انت هنا الان : شبكة جامعة بابل > موقع الكلية > نظام التعليم الالكتروني > مشاهدة المحاضرة

الاحصاء التربوي

Share |
الكلية كلية التربية الاساسية     القسم قسم العلوم     المرحلة 2
أستاذ المادة نسرين حمزة عباس السلطاني       29/02/2016 17:16:01
((المحاضرة الاولى))
علم الأحصاء :
الإحصاء هو العلم الذي يُعنى بجمع البيانات وتبويبها وعرضها وتحليلها واستخراج النتائج والاستدلالات منها بغرض اتخاذ القرارات .
أنــــــــــــــواعهُ :
1. الإحصاء الوصفي :
يهتم الإحصاء الوصفي بعمليات جمع وتنظيم البيانات العددية الرقمية بدلالة بعض المقاييس لإغراض الوصف والمقارنة ، فعلى سبيل المثال ، بعد أن يقوم المعلم بتدريج علامات صف ما في احد الاختبارات فانه يمكن لهذا المعلم أن يحسب معدل علامات الصف في هذا الاختبار لتلخيص أو وصف الأداء الكلي لهذا الصف .
أن وصف أداء الصف في ذلك الاختبار المحدد ، دون أية معلومات إضافية يكون ما يسمى بالإحصاء الوصفي .
كما إن عرض البيانات على شكل جداول أو رسومات يقع ضمن هذا التصنيف للإحصاء .
وعليه إن الإحصاء الوصفي يتعلق بجمع وتمثيل وتنظيم وتلخيص البيانات .

2. الإحصاء التحليلي : أو الإستنتاجي أو الإستدلالي :
يقصد به تلك العملية المنطقية التي تؤدي إلى استخلاص النتائج العامة من النتائج الجزئية وفقاً لقوانين إحصائية معينة ووسيلتي الإحصاء هنا هما
1- التقدير 2- اختبار الفرضيات
وتتضمن أساليب الإحصاء الاستدلالي تقدير مؤشرات المجتمع من القيم المناظرة لها والمحسوبة من بيانات العينة .
والإحصاء الاستدلالي أداة هامة في اختبار الفرضيات التي يضعها الباحث وذلك باستخدام احد الاختبارات الإحصائية مثل الاختبار التائي أو الزائي أو الفائي أو مربع كاي ويعتبر أسلوب تحليل التباين من الأساليب الشائعة في مجال تصميم وتحليل التجارب إذ يمَكن باستخدام تحليل التباين دراسة تأثير مجموعة من المتغيرات على ظاهرة معينة مثل طرائق للتدريس على تعلم التلاميذ .
المقصود بالمتغير وما أنواعه ؟

المتغير :- هو أي ظاهرة تظهر اختلافات بين مفرداتها ويرمز له الرمز y أو أي رمز آخر .
أنواعه :- تنقسم إلى :-

1- متغيرات وصفية أو نوعية :- وهي تلك الظواهر أو الصفات التي لايمكن قياسها مباشرة بالأرقام العددية مثل صفة لون العيون ( ازرق ، اسود ، بني ) أو نوع الشركات ( عامة ، خاصة ، مساهمة) أو انواع المسافرين (قادمون ، ذاهبون) أو الحالة الاجتماعية ( مطلق ، متزوج ، اعزب ، ارمل) أو جنس المولود ( ذكر أو انثى ) .
2- متغيرات كمية :- وهي تلك الظواهر أو الصفات التي يمكن قياسها مباشرة بأرقام عددية مثل : صفة الطول والوزن والعمر .... الخ .

وتنقسم المتغيرات الكمية إلى قسمين هما :-
1- متغيرات مستمرة ( أو متصلة ) :- فالمتغير الذي تأخذ المفردة أو المشاهدة فيه أية قيمة رقمية في مدى معين فلو فرضنا بان أطوال طلبة جامعة ما تتراوح بين 13.5 و 170 سم فنقول بان : 130.5 < y > 170.0
أي إن المتغير y ممكن أن يأخذ أية قيمة بين 130.5سم و170.0 سم وكأمثلة أخرى على المتغيرات المستمرة هي الوزن وكمية المحصول ودرجة الحرارة ... الخ . لأنه لايمكن قياسها بأجزاء صغيرة جداً وتأخذ أية قيمة في حدود معينة .
2- متغيرات غير مستمرة ( أو منفصلة ) :- هو المتغير الذي تأخذ المشاهدة أو المفردة فيه قيماً متباعدة أو متقطعة غير مستمرة . فلو فرضنا إن عدد أفراد الأسرة في أربع عوائل هي : 2,3،4،5 فنقول بان y = 2,3,4,5
كذلك عند رمي حجر النرد نجد إن النتيجة تكون ظهور الوجه 1او 2 أو3 أو 4 أو5 أو 6 فنقول بان y= 1,2,3,4,5,6
وكأمثلة أخرى على المتغيرات غير المستمرة عدد الوحدات الإنتاجية في مصنع ما ، عدد الطلبة في صفوف المرحلة الأولى لجامعة ما ..... الخ .
المجتمع الاحصائي :
يقصد بالمجتمع الاحصائي هو مجموع كلّ الظواهر المحتملة التي لها خواص مشتركة .
الــعـــيــنـة :
يقصد بالعينة عدد الظواهر التي لها خواص مشتركة والتي تكون جزءًا من المجتمع الاحصائي ، ويجب في هذهِ الحالة أن تون العينة ممثلة للمجتمع الاصلي تمثيلًا صادقًا.

يمكن تقسيم العينات الى نوعين هما:
1- العينات العشوائية (الاحتمالية) : وتتمثل في الاشكال التالية: العينة العشوائية البسيطة ، والعينة العشوائية المنتظمة ، والعينة العشوائية الطبقية ، والعينة العشوائية العنقودية.
2- العينات غير العشوائية (اللااحتمالية) : وتتمثل في الاشكال التالية : العينة المتيسرة(عينة الصدفة) ، والعينة القصدية (العينة الغرضية) ، والعينة الحصصية وفيما يلي شرحاً لكل شكل من اشكال العينات العشوائية وغير العشوائية :
أولاً : العينات العشوائية (الاحتمالية)
ثانياً : العينات اللاعشوائية ( اللااحتمالية )
اولاً : العينة العشوائية (الاحتمالية)
وهي العينات التي يكون فيها لكل فرد من افراد المجتمع الفرصة نفسها لان يكون احد افراد العينة ، ويكون جميع افراد البحث معروفين ويمكن الوصول اليهم .
حيث يتم الاختيار العشوائي وفق شروط محددة لا وفقاً للصدفة ويتم الاختيار دون تحيز او تدخل من قبل الباحث.
ولإبعاد الباحث عن النتائج المتحيزة من خلال تأثيرات الاختيار نستعمل بعض الاساليب الميكانيكية لانتقاء العينة .
ومن انواعها :-
العينة العشوائية البسيطة :-
وهي العينة التي يتم اختيارها بطريقة يكون فيها لكل فرد في المجتمع فرصة متساوية لكي يتم اختياره في العينة ، ويشترط فيها ان يكون جميع افراد المجتمع معروفين ومحددين ، كما يجب ان يكون هناك تجانس بين افراد المجتمع أي ان الخصائص التي يتصف بها افراد المجتمع غير متباينة ، فمثلاً اذا كان مجتمع الدراسة هو طلبة كلية التربية الاساسية فأن هذا المجتمع متباين وليس متجانساً لأنه يحتوي طلبة سنوات مختلفة : اولى ، ثانية ، ثالثة ، رابعة .
ويتم اختيار العينة العشوائية البسيطة بأسلوبين :-
القرعة /
حيث يتم تمثل افراد المجتمع بورق متشابه تماماً مكتوب على كل ورقة منه رقم يمثل فرداً من افراد المجتمع ، وتوضع هذه الأوراق كلها في كيس وتخلط جيداً ويختار منها افراد العينة الى ان تستوفي الحجم المقرر لهذه العينة ، الا ان هذه الطريقة تحتاج الى مجهود في تكوين قطع من الورق متشابهة من جميع الوجوه ، فضلاً على انها طريقة غير عملية اذا كان المجتمع كبير .

ب - جداول الارقام العشوائية /
وهي عبارة عن جداول يوضع بها ارقام عشوائية كثيرة يختار الباحث منها سلسلة من الارقام العمودية او الافقية ، ثم يختار من المجتمع الاصلي الافراد الذين لهم نفس الارقام التي اختارها من الجدول ويكون هؤلاء الافراد هم العينة المختارة وهذه الطريقة ابسط واكثر دقة من طريقة القرعة .
العينة العشوائية الطبقية :-
وهي العينة التي يتم فيها تقسيم المجتمع الى فئات او طبقات تمثل خصائص المجتمع ثم يتم الاختيار العشوائي ضمن كل فئة او طبقة .
وتختلف العينة العشوائية الطبقية عن العينة العشوائية البسيطة في ان العينة العشوائية البسيطة تشترط تجانس المجتمع وعدم تباينه ، اما العينة العشوائية الطبقية فهي تناسب المجتمع غير المتجانس وتكونه من فئات مختلفة .
وهناك ثلاثة مستويات للدقة في اختيار حجم هذا النوع من العينات :
أ – التوزيع المتساوي
ب - التوزيع المتناسب
جـ - التوزيع الامثل
العينة العشوائية ذات المراحل المتعددة :-
يعتمد هذا النوع من العينة على تقسيم الوحدات في المجتمع الاصلي الى فئات او عناصر ، وهذه تستعمل كوحدات معاينة تسمى وحدات اولية ، وفي بعض الاحيان قد نختار العينة من هذه الوحدات وهذه تسمى العينة ذات المراحل الواحدة .
اما العينة ذات المرحلتين فتتم على مرحلتين اولهما هي اختيار عينة عشوائية بسيطة من الوحدات الاولية ثم نختار عينة عشوائية من بين الوحدات الثانوية لكل وحدة اولية ، مثال عليها اذا اردنا دراسة المتاجر في مدينة معينة وفرضنا ان هذه المدينة تتكون من ( 10 ) قطاعات تكون اول مرحلة هي اختيار (4) قطاعات مثلاً من العشرة الموجودة في المدينة وهذه تسمى عينة ذات مرحلة واحدة ، اما اذا اخترنا عينة عشوائية من المتاجر الموجودة بالأربع قطاعات فان العينة في هذه الحالة تكون ذات مرحلتين ويمكن زيادة المراحل حسب ظروف الباحث ، وتتميز العينة العشوائية ذات المراحل المتعددة بانها اقتصادية اذ ان ملاحظة فئات من المفردات اكثر سهولة ، اقل كلفة خاصة اذا كان المجتمع الاصلي كبير.
لكن احتمال الخطأ في هذا النوع من العينات اكبر مما يحدث في العينة العشوائية الطبقية ، اضافة الى ان تحليل بياناتها احصائياً يتطلب استعمال اساليب اكثر تعقيداً .

العينة العشوائية المنتظمة :-
تعد طريقة من طرق الاختيار العشوائي ، لكنها لا تعطي فرصاً متساوية للأفراد في الظهور ، وتكون المسافة بين كل وحدة من وحدات العينة التي يتم اختيارها ثابتة ، لذلك اطلق عليها تسمية ذات الفترات المتساوية .
ومثالها لنفرض ان باحثاً يريد ان يختار عينة من ( 50 ) تلميذاً من قائمة ( اطار) تضم ( 500 ) تلميذ ، فوفق هذا الاسلوب يقسم 500 على 50 ليحدد المسافة او الفترة وهي ( 10 ) ثم يختار بطريقة عشوائية رقماً بين ( 1 – 10 ) يبدأ به ولنفرض ان هذا الرقم هو ( 7 ) عندئذ يسحب من القائمة 7 ، 17 ، 27 ، … وهكذا .
ونختار هذه العينة لسهولة اختيار افرادها ، الا انها توصف بانها شبه عشوائية اذ يتم اختيار الفرد الأول فقط عشوائياً فيتحدد بذلك موضوع باقي الافراد .

ثـانياً : العينـات اللاعشوائية (اللااحتمالية ) :-
هي العينات التي تتدخل في طرق اختيارها رغبة الباحث واحكامه الشخصية ونلجأ الى هذا الاسلوب من العينات في الدراسة التي يصعب فيها تحديد جميع افراد المجتمع وبالتالي لا يمكن تحديد عينة عشوائية تمثل المجتمع افضل تمثيل لان خصائص المجتمع غير معروفة ومن انواعها العينة العمدية والحصصية والعارضة.

/// ما القياس ؟ و ماهي أنماط القياس ؟
القياس :- عبارة عن نظام تصنيفي يعطى به للأشياء أرقاما ً خاصة بها لكي يسهل تسجيل وتلخيص الملاحظات ومعالجتها إحصائيا .
أنماط القياس :-
هناك أربع مستويات للقياس :-
1- القياس الاسمي :- عملية تصنيف الأشياء أو الوحدات في فئات نوعية ذات خصائص مشتركة ويعطى لكل فئة رقم أو رمز خاص بها ليميزها عن المجموعات الأخرى أو ليدل عليها .
2- القياس الرتبي :- عملية تصنيف الأشياء أو الوحدات في مجموعات متمايزة وفق نظام معين قد يكون تنازلياً أو تصاعدياً .
3- المقياس الفاصل ( الفئوي ) :- ذلك المقياس الذي يتصف بوجود فروق متساوية ووحدة قياس معلومة فلو كان لدينا درجات مجموعة من الطلبة مرتبة من صفر إلى مئة بوحدة الخمس درجات
( صفر ،5 ،20 ،25 ...... ، 95 ،100 ) نلاحظ إن الفروق بين الدرجات متساوية وإنها ترتب بوحدة قياس ثابتة ألا وهي الخمس درجات ويشمل المقياس الفئوي على المقياسين السابقين وهو الاسمي والرتبي لان الطلاب يختلفون في تحصيلهم أي يمكن تصنيفهم إلى ناجحين وراسبين وهذا مايو فره القياس الاسمي وكذلك فان رتبة الطالب الذي درجته (65) أعلى بوحدة واحدة من رتبة الطالب الذي درجته ( 60) وهو اقل بوحدتين من درجة الطالب الذي حصل على ( 75) وهذا ما يوفره القياس الرتبي
ويدل المقياس الفاصل على إن الصفر نسبي أي لايدل على انعدام الصفة أو الخاصية فالقول إن درجة الحرارة اليوم تساوي صفر هذا لايعني انعدام درجة الحرارة .
4- المقياس النسبي :- هذا المقياس يتشابه مع خصائص المقياس الفاصل من حيث وجود الفروق المتساوية ووحدة القياس المعلومة الاانه يختلف عنه في كون الصفر الموجود فيه صفراً مطلقاً يدل على انعدام الصفة أو الخاصية انعداماً مطلقاً فعندما نقول إن الدخل الشهري لأحد الأشخاص هو صفر فهذا معناه انه ليس له دخل على الإطلاق .

























(( المحاضرة الثانية))
عرض البيانات الإحصائية وتنسيقها
Data Display and Organization
التمثيل البياني: Graphical representation
إن أهم أشكال التمثيل البياني لجداول التوزيعات التكرارية هي :
1- طريقة المستطيلات أو المدرج التكراري: Histogram
تتمثل هذه الطريقة برسم مجموعة من المستطيلات المتلاصقة ذات عرض واحد ولكنها بأطوال مختلفة حيث يتناسب طول كل مستطيل مع تكرار الفئة التي يمثلها وتكون المستطيلات المتلاصقة المتساوية العرض ( عرض المستطيل ) منطبقة على المحور الأفقي ومراكز هذه القواعد منطبقة على مراكز الفئات بينما يشار إلى أطوال هذه المستطيلات ( ارتفاعات هذه المستطيلات ) بتكرار كل فئة على المحور الرأسي .
ولكي نرسم مدرج تكراري فاننا نتبع الخطوات الاتية :
نرسم المحورين الافقي (x) و العمودي (y) .
نقسم المحور الافقي الى اجزاء متساوية ليمثل كل جزء منها طول الفئة ثم نسجل قيمة الحد الادنى الحقيقي أو الحد الاعلى الحقيقي أو كليهما حتى الوصول الى الفئة الاخيرة ومقدارها في هذه الحالة (44.5) باضافة (0.5) الى الحد الاعلى للفئة الاخيرة .
ثم نقسم المحور العمودي الى اقسام متساوية اخذين بنظر الاعتبار الحد الاعلى للتكرار وهو في هذه الحالة (50) والحد الادنى وهو (5) وبالتالي تكون المسافة (5)
الفئة التكرار
10-14 5
15-19 25
20-24 50
25-29 45
30-34 22
35-39 10
40-44 5



مثال :
مثل بيانياً المعلومات الواردة في الجدول (1) مستخدماً طريقة المدرج التكراري .









2- الأعمدة البيانية: Bar chart
وبشكل مشابه للمدرج التكراري هناك تمثيلاً يدعى الأعمدة البيانية Bar chart حيث تمثل ارتفاعات هذه الأعمدة ( المستطيلات غير المتلاصقة ) التكرارات الموافقة لفئاتها . وذلك على غرار المدرج التكراري ولكن لا يوجد ما يشير إلى أن البيانات ذات طابع مستمر في الحالة العامة.
ولتوضيح كيفية عمل الاعمدة البيانية فاننا نرجع الى البيانات الموضحة في الجدول الاتي :
ت مستوى السنة الدراسية عدد الطلبة
1 الاولى 5500
2 الثانية 4250
3 الثالثة 3750
4 الرابعة 1500





















3- المضلع التكراري: Frequency Polygon
هناك تمثيل بياني آخر أقل استعمالاً من التمثيلين السابقين ويسمى المضلع التكراري، ويمكن أن يقال عن المضلع التكراري بأنه مضلع مغلق عندما يبدأ وينتهي من المحور الأفقي وينكسر عند النقاط التي تمثل تكراراً . وتتلخص طريقة رسم هذا المضلع برسم تكرار الفئات رأسياً فوق مراكز الفئات Class mark ثم يصار إلى وصل هذه النقاط بخطوط مستقيمة لتشكل المضلع المطلوب كما هو موضح في المثال أدناه .
مثال :
مثل بيانياً وبطريقة المضلع التكراري البيانات الواردة في الجدول (1).
الفئة التكرار
10-14 5
15-19 25
20-24 50
25-29 45
30-34 22
35-39 10
40-44 5
الحل :
لإتمام حل المثال نحتاج إلى مركز الفئات والى تكرار الفئات ، اذ يمكن استخراج مركز الفئة من مجموع الحدين الادنى والاعلة بقسمتهما على الرقم ( 2) والتكرار معطى في السؤال وكما هو موضح في الجدول) ) وبالتالي يكون المضلع المطلوب كما هو في الشكل ادناه








4-الخط المنحني التكراري:
لايختلف المنحني التكراري عن المضلع التكراري ونتبع نفس الخطوات الالوية المتبعة في رسم المضلع التكراري والاختلاف الوحيد بين المنحنيين هي طريقة التوصيل بين النقاط بالمضلع التكراري بخطوط مستقيمة بينما توصل النقاط بالمنحنيات التكرارية بخطوط منحنية تمر باكبر عدد من النقاط مع محاولة ان يقترب هذا المنحني من النقاط التي لايمر بها قدر الامكان .












5-التمثيل الدائري: Pie chart
وفي هذه الحالة يمكن أن نرسم دائرة ونقسمها إلى قطاعات دائرية تتناسب مساحة (زاوية) كل قطاع مع تكرار الفئة التي يمثلها . فالفئة الأكثر تكراراً تقابل القطاع الأكبر مساحة (زاوية) والفئة الأقل تكراراً تقابل القطاع الأصغر مساحة . وتحسب مساحات القطاعات الدائرية كما يأتي :
لاجل تقسيم الدائرة بشكل دقيق ينبغي ايجاد النسبة المئوية لعدد الطلبة في كل فرع من فروع التعليم المهني بالنسبة للمجموع الكلي وبعد ذلك نضرب هذه النسبة في 3.6 فتتكون لدينا قيم الزوايا لكل جزء من الاجزاء كما هو موضح في الجدول الآتي :

مثال :
مثل بيانياً وبطريقة الدائرة البيانات الواردة لعدد الطلبة المسجلين في فروع التعليم المهي في العراق للعام الدراسي 1974/1975
فروع التعليم عدد الطلبة
الصناعي 70
التجاري 10
الزراعي 10
الفنون المنزلية 10
المجموع 100

الحل :
فروع التعليم عدد الطلبة النسبة المئوية الزاوية
الصناعي 70 70 70×3.6=252
التجاري 10 10 10×3.6=36
الزراعي 10 10 10×3.6=36
الفنون المنزلية 10 10 10×3.6=36
المجموع 100 100 360

















يعتبر التمثيل الدائري Pie chart من أكثر المخططات البيانية شيوعاً ففي الوقت الحاضر تغطي هذه الدوائر البيانية صفحات كثيرة من المجلات والصحف بهدف الدعاية والترويج وقد سهل ذلك الانتشار الواسع لأجهزة الكمبيوتر المجهزة ببرامج لهذا الغرض .
الجدير بالذكر أن هناك تمثيلات بيانية أخرى أقل أهمية من تلك التي ذكرناها أعلاه مثل المخطط الصوري أو الرمزي حيث يرمز للبيانات برسوم سيارات أو حيوانات للدلالة على حجم الواردات والصادرات ويدعى مثل هذا التمثيل Pictogram . وهناك تمثيلات بيانية أخرى لا مجال لذكرها جميعاً.








(( المحاضرة الثالثة))
مقاييس النزعة المركزية (أو المتوسطات)
Central Tendency Measurements
1. مقـدمة :
تعتبر مقاييس النزعة المركزية (أو المتوسطات) من أهم المقاييس الإحصائية التي يفكر الباحث في حسابها، بل هي أول مقاييس إحصائية يفكر فيها الباحث السياسي عموماً. فمقياس النزعة المركزية لظاهرة سياسية ما تعني التعرف على القيمة التي تقع عادة عند مركز التوزيع العددي للقيم المبحوثة.
إن متوسط أي ظاهرة يعبر عن المستوى العام لهذه الظاهرة. فمتوسط مجموعة من القيم هو القيمة التي تعبر عن جميع القيم، أو هو القيمة التي تدور (أو تتركز) حولها باقي القيم. فمتوسط الدخل لأي بلد يعبر عن المستوى العام للدخل في هذا البلد كما أن متوسط دخل عمال أحد المصانع هو الدخل الذي تتركز حوله دخول العمال بهذا المصنع. ولذا تسمى المتوسطات بمقاييس النزعة المركزية. وذلك لأن قيم أي ظاهرة – عادة – تميل أو تنزع للتركز حول قيمة معينة هي متوسط هذه الظاهرة أو مقياس نزعتها المركزية. فأطوال البالغين تتركز حول رقم معين هو متوسط الطول، وكذلك أوزانهم ومعدلات ذكائهم، وأي ظاهرة أخرى. فالمتوسط – بصفة عامة – هو الذي يعبر عن المستوى العام للظاهرة أي هو الذي يعبر عن جميع قيمها، بمعنى أنه القيمة التي تتركز حولها باقي القيم.
وسوف نتناول أهم المتوسطات وهي : الوسط الحسابي والوسيط والمنوال. وفيما يلي عرض لهذه المتوسطات نبين فيه تعريف كل مقياس وكيفية حسابه ومزاياه وعيوبه.
2. الوسط الحسابي The Mean
يعتبر الوسط الحسابي أكثر المتوسطات شهرة وأكثرها استخداماً، بل لعله من أهم المقاييس الإحصائية على الإطلاق، وذلك لما يتمتع به من مزايا وخواص، ولدخوله في حساب الكثير من المقاييس الإحصائية الأخرى كما سيتضح فيما بعد.
والفكرة الأساسية في حساب الوسط الحسابي لمجموعة من القيم أنه يساوي خارج قسمة مجموع القيم على عددها.

الوسط الحسابي لمجموعة قيم =

(ويعرف الوسط الحسابي لمجموعة من القيم بأنه القيمة التي لو حلت محل جميع القيم لا يتغير مجموعها).
مثال (1) :
استغرقت مفاوضات السلام بين بلدين خمس جولات، وكانت كل جولة تستغرق عدة أيام كما يلي :
7, 10, 12, 8, 9
أحسب الوسط الحسابي لعدد الأيام في هذه الجولات.
الحل :
1 – لدينا خمس جولات أو خمس قيم، أي أن عدد القيم = 5 جولات.
2 – مجموع الأيام أو مجموع القيم هو :
يوماً 7 + 10 + 12 + 8 + 9 = 46

3- الوسط الحسابي = = = 9.5 يوما

أي أن متوسط عدد الأيام في هذه الجولات من المفاوضات هو 9.2 يوماً وللباحث السياسي بعدها حرية إعطاء التفسير لطول أو قصر هذه المدة.
والوسط الحسابي – والذي يقال عنه أحياناً " الوسط " أو " المتوسط " - يمكن أن يكتب بالرموز كما يلي :
- نفترض أن عدد القيم هو n
- وأن هذه القيم هي :
X1, X2, X3, … , Xn
حيث أن :
X1 تعني القيمة الأولى.
X2 تعني القيمة الثانية.
X3 تعني القيمة الثالثة.
Xn تعني القيمة الخيرة رقم n
ومجموع هذه القيم هو : X1 + X2 + X3 + … + Xn
والذي يمكن أن يكتب اختصاراً أي مجموع القيم حيث :
X ترمز للقيم
والرمز اللاتيني " سيجما " يرمز للمجموع
أي أن :
X1 + X2 + X3 + … + Xn =
وبالتالي فإن الوسط الحسابي والذي يرمز له بالرمز (والذي ينطق X بار) هو


فإذا عدنا إلى المثال السابق رقم (1) نجد أن :
- عدد القيم يساوي 5 أي أن : n = 5
والقيم هي :
X1 = 7
X2 = 10
X3 = 12
X4 = 8
X5 = 9

ومجموع هذه القيم هو :
X1 + X2 + X3 + … + Xn =
= 7+10+12+8+9= 46
وبالتالي فإن الوسط الحسابي هو :

مثال (2) :
أخذت عينة عشوائية لعدد من سكان أحد الأحياء الفقيرة في دولة نامية
حجمها 10 أشخاص، وكانت دخولهم اليومية بالدولار هي :
3.6 , 4.2 , 2.9 , 3.7 , 4.8 , 2.5 , 3.1 , 3.9 , 3.4 , 4.5
أحسب الوسط الحسابي لدخول هؤلاء الأشخاص.
الحل :
1 – عدد الأشخاص يساوي 10 أي أن
n = 10
2 – مجموع القيم (مجموع دخولهم اليومية) هو :

3 – الوسط الحسابي لدخول هؤلاء الأشخاص هو :


مثال (3) :
إذا كانت أعداد الطلعات الجوية التدريبية الشهرية للمقاتلات الحربية في بلد ما لست من مقاتلاتها هي :
10 , 81 , 84 , 83 , 82 , 80
أحسب الوسط الحسابي الشهري لأعداد هذه الطلعات.


الحل :
قبل الشروع في الحل نلاحظ أن عدد هذه الطلعات متقاربة جداً وكلها بأعداد عالية (80 فأكثر) باستثناء طائرة واحدة بلغ عدد طلعاتها (10) طلعات فقط. وهي تمثل قيمة شاذة (أو متطرفة) بالنسبة لباقي طلعات الطائرات الأخرى (حيث أنها صغيرة جداً بالنسبة للطلعات الأخرى). وسوف نرى فيما يلي تأثيرها على قيمة الوسط الحسابي.
1 – عدد القيم (عدد الطلعات) هو 6 أي أن :
n = 6
2 – مجموع القيمة (أي مجموع الطلعات) هو :

3 – الوسط الحسابي لعدد الطلعات هو :

فكأن الوسط الحسابي لعدد الطلعات قد أنخفض إلى 70 طلعة على الرغم من أن كل الطائرات (باستثناء طائرة واحدة شاذة) كانت 80 فاكثر.
والخلاصة : أن الوسط الحسابي يتأثر بالقيم الشاذة أو المتطرفة، فوجود قيمة كبيرة جداً بالنسبة لباقي القيم يرفع قيمة الوسط، والعكس وجود قيمة صغيرة جداً يقلل من قيمة الوسط. لذا فإنه يقال أن الوسط في هذه الحالات قد يكون مضللاً أي لا يعبر عن الغالبية العظمى من القيم. ففي المثال السابق رقم (3) إذا أهملنا القيمة الشاذة نجد أن :

فإهمال القيم الشاذة رفعت قيمة الوسط الحسابي للطلعات من 70 إلى 82 طلعة وهي التي تعبر فعلاً عن جميع القيم (باستثناء القيمة الشاذة). ونخلص من ذلك إلى أنه في حالة وجود قيم شاذة فإن الوسط الحسابي قد يكون مضللاً أي لا يعبر عن غالبية القيم. وفي هذه الحالة فإنه لا يفضل حساب الوسط الحسابي بل نبحث عن متوسط أخر لا يتأثر بهذه القيم الشاذة. أو – كما يرى البعض – نهمل القيمة الشاذة ونحسب الوسط الحسابي لباقي القيم (بدون القيمة الشاذة).
جـ - إذا كان لدينا عينتين، حجم الأولى n1 وحجم الثاني n2 وكان الوسط الحسابي لكل منهما فإنه يمكن حساب الوسط الحسابي للعينتين معاً بالاستفادة من متوسط كل منهما كما يلي :



ويسمى المتوسط في هذه الحالة " المتوسط المرجح " The weighted average ونلاحظ أنه تم ترجيح كل متوسط بحجم العينة المحسوب منها، أي إعطاء كل متوسط وزن يساوي حجم العينة الخاصة به، ثم القسمة على مجموع حجم العينتين معاً. أي أنه لحساب الوسط الحسابي للعينتين معاً. لا نجمع الوسطين ونقسم على اثنين إلا في حالة واحدة فقط وهي إذا كان حجم العينتين متساويين.
أما في الحالة العامة – وهي اختلاف حجم العينتين – فيتم ضرب كل متوسط في حجم العينة الخاص به، ونجمع، ثم نقسم على حجم العينتين معاً (n1 + n2) ويمكن تعميم هذا القانون لأي عدد من العينات. فمثلاً إذا كان لدينا ثلاث عينات أحجامها هي n1 , n2 , n3 ومتوسطاتها هي على الترتيب فإن الوسط المرجح للعينات الثلاث معاً هو :


مثال (4) :
إذا كانت لدينا مجموعتين من الطلاب تدرسان المقرر نفسه. وكان عدد الطلاب في المجموعتين هو :
n1 = 40 n2 = 25
وكان الوسط الحسابي لدرجات الطلاب في المجموعتين هو :
فما هو الوسط الحسابي لدرجات الطلاب في المجموعتين
معاً ؟



الحل :
المتوسط المرجح يحسب باستخدام العلاقة رقم (2) :


مثال (5) :
في المثال السابق إذا كان لدينا المتوسطان نفسهما، ولكن عدد الطلاب في كل من المجموعتين متساوي وليكن يساوي 40 في كل منهما :

أحسب الوسط المرجح للمجموعتين معاً ؟
الحل :
نلاحظ أن حجمي العينتين (أو المجموعتين) متساويان وبالتالي فإن المتوسط المرجح – في هذه الحالة الخاصة هو :







ولو استخدمنا العلاقة رقم (2) وهي الحالة العامة لحصلنا على النتيجة نفسها وذلك كما يلي :

وهذه النتيجة نفسها بطبيعة الحال. أي أنه في حالة تساوي أحجام العينات فقط تجمع المتوسطات وتقسم على عددها. أما في حالة إختلاف احجام العينات فنحسب المتوسط المرجح (باستخدام العلاقة (2) أو (3) أو الحالة العامة لهما وذلك على حسب عدد العينات).
حساب الوسط الحسابي في حالة البيانات المبوبة ولكن بدون فئات:
أحياناً تكون البيانات المتوافرة لدى الباحث مبوبة بمعنى أنها تأخذ شكل قيم وتكرارات كما يلي :
مثال (6) :
الجدول التالي يعطي عينة من الأسر تمثل نمط الإنجاب في واحدة من دول العالم الثالث، والمطلوب حساب الوسط الحسابي لعدد الأطفال في الأسرة في هذه العينة؟
أعداد الأسر (التكرارات)
F عدد الأطفال بالأسر
X
2 4
6 5
10 6
15 7
9 8
5 9
3 10
50 المجموع
?
الحل :
أرقام الجدول أعلاه تقول أن العينة تحوي 50 أسرة منهم أسرتان بكل منهما
4 أطفال، 6 أسر بكل منهم 5 أطفال، 10 أسر لدى كل واحداً منهم 6 أطفال... وهكذا. ولكي نحسب الوسط الحسابي نحصل أولاً على مجموع الأطفال ثم نقسم على إجمالي عدد أفراد العينة (والذي يساوي في هذا المثال 50 أسرة). ولكي نحصل على مجموع عدد الأطفال نضرب عدد الأطفال في عدد الأسر ثم نجمع لكل الأسر. فمثلاً الأسرتان اللتان لدى كل منهما 4 أطفال مجموع أطفالهما 2 = 8 × 4 والأسر الست التي لدى كل منهم 5 أطفال مجموع عدد أطفالهم 6 = 30 × 5 وهكذا بالنسبة لباقي الجدول. ويمكن تنظيم ذلك في عمود جديد يضاف إلى الجدول السابق كما يلي:

حاصل الضرب
(مجموع الأطفال) أعداد الأسر (التكرارات) عدد الأطفال بالأسر
Xf F X
4 × 2 = 8 2 4
5 × 6 = 30 6 5
6 ×10 = 60 10 6
7 × 15 = 105 15 7
8 × 9 = 72 9 8
9 × 5 = 45 5 9
10 × 3 = 30 3 10
المجموع

ونعلم أن الوسط الحسابي لعدد الأطفال بالأسرة يساوي مجموع الأطفال على عدد الأسر، أي مجموع القيم على عددها. وبالتالي فإن المعادلة تصبح :


وبالتعويض في قانون الوسط الحسابي رقم (4) نحصل على الوسط الحسابي لحجم الأسرة كما يلي :

أي أن الوسط الحسابي لحجم الأسرة بعينة هذا البلد يساوي 7 أطفال، وهو متوسط مرتفع دون شك.
حساب الوسط الحسابي في حالة الفئات :
كما قد تكون البيانات مبوبة على فئات وتكرارات كما يلي :
مثال (7) :
الجدول التالي يمثل توزيع مجموعة من الطلاب حسب فئات الدرجات كما يلي :
أعداد الطلاب
F فئات الدرجات
Classes
3 2 – 4
9 4 – 6
10 6 – 8
5 8 – 10
المجموع
والمطلوب حساب الوسط الحسابي لدرجات الطلاب.
الحل :
الجدول يقول أن 3 طلاب حصل كل منهم على درجة تتراوح بين 2وأقل من
4 (لكن لا نعلم ما درجة كل منهم بالتحديد)، 9 طلاب حصل كل منهم على درجة تتراوح بين 4وأقل من6 (لكن لا نعلم ما درجة كل منهم بالتحديد)، وهكذا بالنسبة لباقي الفئات. وفي هذه الحالة نحسب مراكز الفئات كأحسن قيم تمثل هذه الفئات. ومركز الفئة هو القيمة التي تقع في منتصف الفئة، أي أن :

مركز الفئة =

أي أننا نستعيض عن الفئات بمراكزها وهي التي تمثل القيم (كما في الأمثلة السابقة) وسوف نرمز لها بالرمز X، ثم نكمل الحل كما في المثال السابق :
حاصل الضرب
(مجموع الدرجات) مراكز الفئات أعداد الطلاب فئات الدرجات
x. f x F Classes
3 × 3 = 9 3 2 – 4
5 × 9 = 45 9 4 – 6
7 × 10 = 70 10 6 – 8
9 × 5 = 45 5 8 – 10
المجموع
وبالتعويض في قانون الوسط الحسابي رقم (4) نحصل على :

أي أن الوسط الحسابي يساوي 6.26 درجة.
ملاحظة مهمة :
عند حساب الوسط الحسابي في حالة الفئات نحسب أولاً مراكز الفئات كأحسن قيم تمثل الفئات – كما ذكرنا – ولذلك يقال أن قيمة الوسط الحسابي في حالة الفئات قيمة تقريبية (وليست دقيقة exact) وذلك لأننا نفترض – على سبيل التقريب – أن مركز الفئة هو أحسن قيمة تمثل الفئة لأنه ليست لدينا الدرجات الدقيقة التفصيلية لكل طالب. ومن ذلك نستنتج أنه إذا كانت هناك فئة مفتوحة (بمعنى عدم معرفة أحد حديها) فإنه لا يمكن حساب مركز هذه الفئة، وبالتالي لا يمكن حساب الوسط الحسابي في هذه الحالة.

3.4 الوسيط The Median
يعرف الوسيط بأنه القيمة التي تقع في منتصف القيم بعد ترتيبها (تصاعدياً أو تنازلياً). فالوسيط هو القيمة التي تتوسط القيم بعد ترتيبها. فإذا كان عدد القيم فردياً فإنه توجد قيمة واحدة في المنتصف (بعد الترتيب) تكون هي الوسيط. أما إذا كان عدد القيم زوجياً فإنه توجد قيمتان في المنتصف نجمعهما ونقسم على 2 فنحصل على قيمة الوسيط. وبديهي أننا سنحصل على النتيجة نفسها لو كان الترتيب تصاعدياً أو تنازلياً.
مثال (1) :
البيانات التالية تمثل أعمار مجموعة من الناخبين :
32 24 20 35 29 فما هو وسيط العمر ؟
الحل :
أولاً : نرتب هذه الأعمار تصاعدياً كما يلي :
35 32 29 24 20
ثانياً : نلاحظ أن عدد القيم فردي (يساوي 5) وأنه توجد قيمة واحدة في المنتصف هي 29 وبالتالي فإن قيمة الوسيط تساوي 29 سنة.

مثال (2) :
البيانات التالية تمثل دخول بعض الأفراد اليومية بالدولار الأمريكي في إحدى الدول.
11 19 14 18 12 15 أحسب وسيط هذه الدخول ؟

الحل :
أولاً : نرتب هذه الدخول تصاعدياً كما يلي :
19 18 15 14 12 11
ثانياً : نلاحظ أن عدد القيم زوجي (يساوي 6) وأنه توجد قيمتان في المنتصف هما 15، 14 لذلك نجمعهما ونقسم على 2. أي أن الوسيط يساوي :
دولاراً
بعض خصائص الوسيط :
1 – لا يتأثر الوسيط بالقيم الشاذة أو المتطرفة. وهذا منطقي لأنه يقع في منتصف القيم، والقيم الشاذة إما أن تكون في أول القيم أو أخرها (بعد ترتيب القيم تصاعدياً أو تنازلياً). ففي المثال التالي لدينا عدة مجموعات من القيم المرتبة.
مثال (3) :
10 9 8 6 4
100 9 8 6 4
1000 9 8 6 4
ونلاحظ أن قيمة الوسيط في الحالات الثلاث تساوي 8 (سواء كانت أكبر قيمة تساوي 10 أو 100 أو 1000) أي لم تتأثر قيمة الوسيط بوجود قيمة شاذة أو متطرفة.
2 – يمكن إيجاد قيمة الوسيط في بعض حالات البيانات الترتيبية Ordinal Data. والمثال التالي يوضح ذلك.
مثال (4) :
البيانات التالية تمثل تقديرات بعض عينة مختارة من الناخبين لاحتمال فوز أحد المرشحين في أحد الانتخابات :
good , v.good , fair , good , excellent , fair , good
ولحساب وسيط هذه التقديرات نتبع الخطوات التالية :
رغم ان البيانات غير كمية الا انها ترتيبية أي يمكن ترتيبها (تصاعديا او تنازليا) وترتيبها تصاعديا يكون كما يلي:
fair , fair , good , good , goo , v.good , excellent

وحيث أن التقدير good هو الذي يقع في منتصف التقديرات بعد ترتيبها تصاعدياً فإن وسيط التقديرات هو good أو جيد.

ملاحظة مهمة :
نلاحظ أن الوسيط هو القيمة التي تقع في منتصف القيم. لذلك يمكن حساب " ترتيب الوسيط " أو " موضع الوسيط " أو رقمه في الترتيب قبل معرفة أو حساب قيمته وذلك حسب القاعدة التالية :
ترتيب الوسيط = حيث تمثل n : عدد القيم
ففي المثال رقم (1)، عدد القيم 5 لذا فإن ترتيب الوسيط هو فالوسيط هو القيمة رقم 3 (بعد ترتيب القيم تصاعدياً) والقيمة الثالثة في الترتيب هي 29 وهي تمثل قيمة الوسيط لأعمار الناخبين في المثال الأول.
وفي المثال رقم (2) عدد القيم المعطاة هي 6 لذا فإن ترتيب الوسيط هو : أي أنه يقع بين القيمتين الثالثة والرابعة، لذلك فقد جمعنا هاتين القيمتين وقسمنا على 2، أي أن قيمة الوسيط لدرجات الطلاب في هذا المثال هي :

وفي المثال رقم (4) عدد القيم 7 لذا فإن ترتيب الوسيط هو :
أي أن الوسيط هو القيمة الرابعة في الترتيب، لذا فإن وسيط التقديرات هو good.
والخلاصة إنه يمكن تلخيص خطوات حساب الوسيط في حالة البيانات غير المبوبة كما يلي :
1 – ترتيب البيانات تصاعدياً.
2 – حساب ترتيب الوسيط والذي يساوي حيث n هي عدد القيم.
3 – إذا كان عدد القيم فردياً فإنه توجد قيمة واحدة في المنتصف تكون هي قيمة الوسيط. وإذا كان عدد القيم زوجياً فإنه توجد قيمتان في المنتصف نجمعهما ونقسم على 2 فنحصل على قيمة الوسيط.

4.4 المنوال The Mode
المنوال وهو ثالث المتوسطات ويعرف بأنه القيمة الأكثر تكراراً أو شيوعاً بين القيم، فهو القيمة التي تتكرر أكثر من غيرها. وأحياناً يسمى المنوال "القيمة الشائعة" أي الأكثر شيوعاً بين القيم. والمنوال من أكثر المتوسطات استخداماً في الحياة التجارية. حيث تعتمد – على سبيل المثال – مصانع الملابس الجاهزة على المقاييس الشائعة بين الناس لتحديد المقاييس المختلفة لهذه الملابس.
ويتميز المنوال بالسهولة والبساطة سواء في فكرته أو في إيجاد قيمته. وكما سنرى في الأمثلة التالية أنه لا ترتب البيانات ولا تجمع ولا أي شيء من هذا القيبل. فقط نبحث عن القيمة التي تتكرر أكثر من غيرها لتكون منوال القيم.
مثال (1) :
البيانات التالية تمثل اعمار مجموعة من الناخبين :
25 , 29 , 34 , 29 , 36 , 42 , 29 , 50 , 29 , 36
25 , 29 , 34 , 29 , 36 , 42 , 29 , 50 , 29 , 36
فما هو منوال هذه الأعمار ؟
الحل :
بما أن العمر 29 سنة هو العمر الذي تكرر أكثر من غيره من الأعمار (تكرر
4 مرات) فإن : منوال العمر = 29 سنة
(لاحظ أن البيانات في هذا المثال كمية)
مثال (2) :
البيانات التالية تمثل تقديرات مجموعة من الطلاب في أحد المقررات.

fair , good , fair , v.good , good , excellent , good

فما هو منوال هذه التقديرات ؟
الحل :
منوال التقديرات هو التقدير "good" لأنه تكرر أكثر من غيره (تكرر ثلاث مرات).
(لاحظ أن البيانات في هذا المثال وصفية ترتيبية)

مثال (3) :
البيانات التالية تمثل توزيع فوج من السائحين لإحدى الدول حسب جنسياتهم :
الجنسية عدد السائحين
ألمانية 50
فرنسية 80
أمريكية 120
إيطالية 90
من هذا الجدول نجد أن منوال الجنسية (أي الجنسية الشائعة أو التي تكررت أكثر من غيرها) هي الجنسية الأمريكية (120 سائحاً).
(لاحظ أن البيانات في هذا المثال وصفية اسمية Nominal).
بعض الملاحظات على المنوال :
1 – لاحظنا من الأمثلة السابقة أنه يمكن إيجاد المنوال لكل انواع البيانات (كمية أو ترتيبية أو أسمية).
2 – حسب تعريف المنوال قد لا تتكرر قيمة أكثر من غيرها، وبالتالي قد لا يوجد منوال لبعض البيانات.

مثال (4) :
فإذا كانت البيانات التالية تمثل أعمار مجموعة من الناخبين :
40 55 39 48 32 25
فإنه لا يوجد منوال لهذه الأعمار.
3 – وحسب تعريف المنوال أيضاً قد يوجد أكثر من منوال واحد للبيانات.
مثال (5) :
البيانات التالية تمثل توزيع مجموعة من الناخبين حسب أعمارهم.
الأعمار أعداد الناخبين
25 3
30 5
المنوال الأول = 35 9 أكبر تكرار (التكرار المنوالي)
40 4
المنوال الثاني = 45 9 أكبر تكرار (التكرار المنوالي)
50 2
في هذا الجدول نلاحظ أن العمر 35 تكرر 9 مرات (وهو أكبر تكرار) وكذلك العمر 45 تكرر أيضاً 9 مرات (وهو أكبر تكرار) لذلك فإن :
المنوال الأول = 35 سنة والمنوال الثاني = 45 سنة.
مثال (6) شامل على المتوسطات :
الجدول التالي يمثل أهم الحروب التي شهدها العالم من عام 1945 وحتى عام 1980م. أحسب المتوسطات الثلاثة لهذه البيانات.
أهم الحروب التي شهدها العالم من عام 1945م وحتى عام 1980م
الرقم العام العدد المكان
1 1945 4 سوريا – لبنان، أندونيسا، الصين، ماليزيا
2 1946 2 الهند الصينية، اليونان
3 1947 3 مدغشقر، الهند والباكستان، كشمير
4 1948 4 الفلبين، الحرب العربية الإسرائيلية الأولى. حيدر اباد، بورما
5 1949 0
6 1950 3 كوريا، فرموزا، التبت
7 1951 0
8 1952 1 كينيا
9 1953 0
10 1954 2 جواتيمالا، الجزائر
11 1955 0 السودان، قبرص
12 1956 3 سينا. هنغاريا، السويس
13 1957 0
14 1958 2 لبنان، كوبا
15 1959 4 فيتنام، هملايا، راوندا، لاوس
16 1960 2 الكونغو، كولومبيا
17 1961 3 كوبا (خليج الخنازير) جيو، انغولا
18 1962 3 غرب غينيا الجديدة، اليمن، غينيا الأسبانية
19 1963 4 الجزائر – المغرب، قبرص، ماليزيا، الصومال – كينيا
20 1964 3 جنزيار، تايلند، موزنبيق
21 1965 3 الهند – الباكستان، جمهورية الدومينيكان، أندونيسا
22 1966 1 بيافرا
23 1967 1 الحرب العربية الإسرائيلية الثانية
24 1968 1 تشيوكوسلفاكيا
25 1969 4 ماليزيا، السلفادور، تشاد، شمال إيرلندا
26 1970 1 أثيوبيا (أرثيريا)
27 1971 2 كمبوديا – بانجلاديش / كشمير
28 1972 1 برونداي
29 1973 1 الحرب العربية الإسرائيلية الثالثة (حرب أكتوبر)
30 1974 2 العراق (الأكراد) قبرص
31 1975 3 أنغولا، تايمور، لبنان
32 1976 1 أسبانيا / المغرب
33 1977 4 الصومال، أثيوبيا، أثيوبيا (ارثيريا، سوريا – لبنان، ليبيا – مصر
34 1978 6 إيران، نيكاراغو، فيتنام – لاوس، تشاد، زائير، روديسيا (زمبابوي)
35 1979 6 اليمن الشمالية – اليمن الجنوبية، أوغندا – تنزانيا، الصين – فيتنام،
فيتنام – كمبوديا، نيكاراغوا، جنوب أفريقيا – انغولا
36 1980 3 روسيا – أفغانستان، العراق – إيران، السلفادور
المجموع 85
الحل :
أولاً : حساب الوسط الحسابي :
1 – عدد القيم (عدد السنوات) n= 36
2 – مجموع الحروب خلال تلك الفترة
3 – الوسط الحسابي لعدد الحروب خلال تلك الفترة :
أي أن الوسط الحسابي لعدد الحروب يساوي 2.36 حرباً في السنة الواحدة.
ثانياً : حساب الوسيط :
1 – ترتيب البيانات تصاعدياً (لاحظ أن العدد هو 36) أي ترتب عدد الحروب تصاعدياً :
66 444444 333333333 2222222 11111111 0000
2 – ترتيب الوسيط

أي أن الوسيط يقع بين القيمتين الثامنة عشرة والتاسعة عشرة.


3 – قيمة الوسيط :
(نجمع القيمتين الثامنة عشرة والتاسعة عشرة ونقسم على اثنين)

أي أن وسيط الحروب يساوي (2) حرباً في السنة.

ثالثاً : حساب المنوال :
يعرف المنوال بأنه القيمة التي تكررت أكثر من غيرها وحيث أن القيمة 3 هي التي تكررت أكثر من غيرها (تكررت تسع مرات) فإن منوال الحروب يساوي (3) حروب في السنة. لاحظ أن المتوسطات الثلاثة ليست بالضرورة متساوية.
ملاحظة :
أبحث عن المكان الذي تكرر أكثر من غيره خلال تلك الفترة. أي منوال المكان (أو الدولة أو المنطقة).















(( المحاضرة الرابعة))
مقاييس التشتت

4/1 مقدمة
عند مقارنة مجموعتين من البيانات ، يمكن استخدام شكل التوزيع التكراري، أوالمنحنى التكراري ، وكذلك بعض مقاييس النزعة المركزية ، مثل الوسط الحسابي والوسيط ، والمنوال ، والإحصاءات الترتيبية ، ولكن استخدام هذه الطرق وحدها لا يكفيعند المقارنة ، فقد يكون مقياس النزعة المركزية للمجموعتين متساوي ، وربما يوجد اختلاف كبير بين المجموعتين من حيث مدى تقارب وتباعد البيانات من بعضها البعض ، أو مدى تباعد أو تقارب القيم عن مقياس النزعة المركزية .
ومثال على ذلك ، إذا كان لدينا مجموعتين من الطلاب ، وكان درجات المجموعتين كالتالي :

88 67 85 81 78 70 63 المجموعة الأولى
77 74 75 78 77 78 73 المجموعة الثانية

لو قمنا بحساب الوسط الحسابي لكل مجموعة ، نجد أن الوسط الحسابي لكل منهما يساوي 76 درجة ، ومع ذلك درجات المجموعة الثانية أكثر تجانسا من درجات المجموعة الأولى . من أجل ذلك لجأ الإحصائيون إلى استخدام مقاييس أخرى لقياس مدى تجانس البيانات، أو مدى انتشار البيانات حول مقياس النزعة المركزية، ويمكن استخدامها في المقارنة بين مجموعتين أو أكثر من البيانات، ومن هذه المقاييس ، مقاييس التشتت ، والالتواء ، والتفرطح ، وسوف نركز في هذا الفصل على هذه المقاييس .

4/2 مقاييس التشتت Dispersion Measurements
من هذه المقاييس: المدى، والانحراف الربيعي، والانحراف المتوسط، والتباين، والانحراف المعياري .


4/2/1 المدى Rang
هو أبسط مقاييس التشتت ، ويحسب المدى في حالة البيانات غير المبوبة بتطبيق المعادلة التالية .



وأما المدى في حالة البيانات المبوبة له أكثر من صيغة، ومنها المعادلة التالية:



مثــال (4-1)
تم زراعة 9 وحدات تجريبية بمحصول القمح ، وتم تسميدها بنوع معين من الأسمدة الفسفورية ، وفيما يلي بيانات كمية الإنتاج من القمح بالطن/ هكتار .

5.03 4.63 5.08 5.18 5.29 5.18 5.4 6.21 4.8

والمطلوب حساب المدى .

الحـل
المدى = أكبر قراءة – أقل قراءة
أكبر قراءة = 6.21 أقل قراءة = 4.63
إذا المدى هو :
Rang=Max-Min=6.21-4.63 =1.58
المدى يساوي 1.58 طن / هكتار.

مثـال (4-2)
الجدول التكراري التالي يبين توزيع 60 مزرعة حسب المساحة المنزرعة بالذرة بالألف دونم .

40-45 35-40 30-35 25-30 20-25 15-20 المساحة
3 12 18 15 9 3 عدد المزارع

والمطلوب حساب المدى للمساحة المنزرعة بالذرة .

الحـل
المدى = مركز الفئة الأخيرة – مركز الفئة الأولى
مركز الفئة الأخيرة: (40+45)/2=85/2=42.5 مركز الفئة الأولى: (15+20)/2=35/2=17.5
إذا
أي أن المدى قيمته تساوي 25 دونم

مزايا وعيوب المدى
من مزايا المدى
1- أنه بسيط وسهل الحساب
2- يكثر استخدامه عند الإعلان عن حالات الطقس، و المناخ الجوي، مثل درجات الحرارة، والرطوبة، والضغط الجوي.
3- يستخدم في مراقبة الجودة .
2- ومن عيوبه
• أنه يعتمد على قيمتين فقط ، ولا يأخذ جميع القيم في الحسبان .
• يتأثر بالقيم الشاذة .


4/2/3 الانحراف المتوسط Mean Deviation (MD)
هو أحد مقاييس التشتت، ويعبر عنه بمتوسط الانحرافات المطلقة للقيم عن وسطها الحسابي ، فإذا كانت هي القراءات التي تم أخذها عن ظاهرة معينة ، وكان ( ) عبارة عن الوسط الحسابي لهذه القراءات، فإن الانحراف المتوسط (MD) يحسب بتطبيق المعادلة التالية:


وهذه الصيغة تستخدم في حالة البيانات غير المبوبة .

مثـال(4-5)
إذا كانت الطاقة التصديرية لخمس محطات لتحلية المياه بالمليون متر مكعب كما يلي:
4 5 2 10 7
أوجد قيمة الانحراف المتوسط للطاقة التصديرية

الحـل
لحساب قيمة الانحراف المتوسط يتم استخدام المعادلة (4-4)
الوسط الحسابي :

ويتم تكوين الجدول التالي :

الانحرافات المطلقة

الانحرافات

الطاقة التصديرية


1.6 4 - 5.6 = -1.6 4
0.6 5 - 5.6 = -0.6 5
3.6 2 - 5.6 = -3.6 2
4.4 10 - 5.6 = 4.4 10
1.4 7 - 5.6 = 1.4 7
11.6 0 Sum

إذا الانحراف المتوسط قيمته هي :
(مليون متر مكعب)

وفي حالة البيانات المبوبة، يحسب الانحراف المتوسط باستخدام المعادلة التالية .

حيث أن هو تكرار الفئة ، هو مركز الفئة ، هو الوسط الحسابي.

مثـال(4-6)
يبين الجدول التكراري التالي توزيع40 أسرة حسب الإنفاق الشهري بالألف ريال.
14 – 17 11 – 14 8 - 11 5 - 8 2 - 5 الإنفاق
8 10 13 8 1 عدد الأسرة
أوجد الانحراف المتوسط .
الحـــــل
لحساب الانحراف المتوسط ، يتم تطبيق المعادلة (4-5)، ويتبع الآتي
تكوين جدول لحساب مكونات المعادلة:


الوسط الحسابي


مركز الفئة
عدد الأسر
حدود الإنفاق
7.2 7.2 3.5 3.5 1 2-5
33.6 4.2 52 6.5 8 5-8
15.6 1.2 123.5 9.5 13 8-11
18 1.8 125 12.5 10 11-14
38.4 4.8 124 15.5 8 14-17
112.8 428 40 sum

إذا الانحراف المتوسط هو :

الانحراف المتوسط للإنفاق الشهري هو 2.82 ألف ريال .

مزايا وعيوب الانحراف المتوسط
من مزايا الانحراف المتوسط أنه يأخذ كل القيم في الاعتبار، ولكن يعاب عليه ما يلي:
يتأثر بالقيم الشاذة .
يصعب التعامل معه رياضيا.

4/2/4 التباين Variance
هو أحد مقاييس التشتت ، وأكثرها استخداما في النواحي التطبيقية ، ويعبر عن متوسط مربعات انحرافات القيم عن وسطها الحسابي.
أولا: التباين في المجتمع ( )
إذا توافر لدينا قراءات عن كل مفردات المجتمع ، ولتكن: ، فإن التباين في المجتمع ، ويرمز له بالرمز (سيجما) يحسب باستخدام المعادلة التالية :



حيث أن هو الوسط الحسابي في المجتمع ، أى أن : .

مثـال(4-7)
مصنع لتعبئة المواد الغذائية ، يعمل به 15 عامل ، وكانت عدد سنوات الخبرة لهؤلاء العمال كما يلي :

10 12 11 6 14 13 10 8 6 9 12 14 7 13 5

بفرض أن هذه البيانات تم جمعها عن كل مفردات المجتمع ، فأوجد التباين لعدد سنوات الخبرة .

الحـل
لحساب تباين سنوات الخبرة في المجتمع ، يتم استخدام المعادلة (4-6).
• الوسط الحسابي في المجتمع


• حساب مربعات الانحرافات

بما أن:

إذا تباين سنوات الخبرة للعمال في المصنع هو :





سنوات الخبرة


25 5-10 = -5 5
9 3 13
9 -3 7
16 4 14
4 2 12
1 -1 9
16 -4 6
4 -2 8
0 0 10
9 3 13
16 4 14
16 -4 6
1 1 11
4 2 12
0 0 10
130 0 150



إذا التباين في المجتمع يمكن صياغته كالتالي .


وبالتطبيق على المثال (4-7) ، نجد أن أننا نحتاج إلى المجموعين : ، ويتم عمل الآتي :





إذا التباين هو

وهي نفس النتيجة التي تم الحصول عليها باستخدام الصيغة (4-6) .
سنوات الخبرة


25 5
169 13
49 7
196 14
144 12
81 9
36 6
64 8
100 10
169 13
196 14
36 6
121 11
144 12
100 10
1630 150











(( المحاضرة الخامسة))
معامل الارتباط Correlation Coefficient :
يقاس الارتباط بين متغرين بمقياس إحصائي يسمى " معامل الارتباط " ويعكس هذا المقياس درجة أو قوة العلاقة بين المتغيرين واتجاه هذه العلاقة. وتنحصر قيمة معامل الارتباط بين + 1، - 1. فإذا كانت قيمة معامل الارتباط تساوي + 1 فمعنى ذلك أن الارتباط بين المتغيرين طردي تام، وهو أقوى أنواع الارتباط الطردي بين متغيرين. وإذا كانت قيمة معامل الارتباط تساوي – 1 فمعنى ذلك أن الارتباط بين المتغيرين عكسي تام، وهو أقوى أنواع الارتباط العكسي بين متغيرين. وإذا كانت قيمة معامل الارتباط تساوي صفر، فمعنى ذلك أنه لا يوجد ارتباط بين المتغيرين. وكلما اقتربت قيمة معامل الارتباط من + 1 أو – 1 كلما كان الارتباط قوياً، وكلما اقترب من الصفر كلما كان الارتباط ضعيفاً.
أي أنه كلما كانت العلاقة قوية بين المتغيرين كلما اقترب معامل الارتباط من + 1 أو – 1 فإذا وصلت قيمة المعامل إلى + 1 أو – 1 كان الارتباط تاماً بين المتغيرين. وأنه كلما كانت العلاقة ضعيفة بين المتغيرين كلما اقترب معامل الارتباط من الصفر، فإذا وصلت قيمة المعامل إلى الصفر كان الارتباط منعدماً بين المتغيرين. ومعنى ذلك أيضاً أنه لا يوجد ارتباط بين متغيرين تكون قيمة المعامل فيه أكبر من + 1 ولا أصغر من – 1.
معامل بيرسون للارتباط الخطي البسيط :
يفترض بيرسون Pearson أن المتغيرين كميان، وأن العلاقة بينهما خطية (أي تأخذ شكل خط مستقيم، أنظر الشكل الثاني من أشكال الانتشار).
ويرى بيرسون أن أفضل مقياس للارتباط بين متغيرين قد يختلفان في وحدات القياس و / أو في مستواهما العام (مثل الارتباط بين العمر والدخل) حيث يقاس العمر بالسنوات ويقاس الدخل بالعملة، بالريال أو الدولار.. كما أن المستوى العام للعمر – أي متوسط العمر – قد يساوي أربعين عاماً. فبينما المستوى العام – أي متوسط – الدخل الشهري قد يكون خمسة آلاف ريال مثلاً).
وبالتالي فإن أفضل مقياس للارتباط بين مثل هذين المتغيرين – حسب رأي بيرسون – هو عن طريق حساب انحرافات كل من المتغيرين عن وسطه الحسابي وقسمة هذه الانحرافات على الانحراف المعياري لكل منهما، فنحصل على ما يسمى بالوحدات المعيارية لكل متغير. ويكون معامل ارتباط بيرسون هو " متوسط حاصل ضرب هذه الوحدات المعيارية ". ومعامل الارتباط يكون بدون تمييز.
وبالرموز، إذا فرضنا أن المتغيرين هما Y , X وأن لدينا عدد n من أزواج القيم هي :

وأن الوسط الحسابي للمتغير X هو وللمتغير Y هو وأن الانحراف المعياري للمتغير X هو Sx وللمتغير Y هو Sy فإن معامل بيرسون للارتباط الخطي والذي يرمز له بالرمز r هو :

ونلاحظ من تعريف معامل بيرسون للارتباط الخطي البسيط أنه يجب أولاً حساب كل من ، ثم حساب لكل قيمة من قيم X، وحساب لكل قيمة من قيم y ثم ضرب في لكل زوج من القيم وأخذ مجموع حاصل الضرب ثم القسمة على n. إن هذه العملية كما نرى تستغرق وقتاً طويلاً ونحتاج عمليات حسابية معقدة، لذلك فإنه عادة لا تستخدم الصيغة السابقة في حساب معامل الارتباط وتستخدم بدلاً منه الصيغة المختصرة التالية والتي تعطي بطبيعة الحال النتائج نفسها : -

وكل ما نحتاجه لحساب معامل الارتباط الخطي لبيرسون بالصيغة المختصرة
رقم (2) هو حساب : أي مجموع مربعات قيم x ومجموع مربعات قيم y ومجموع حاصل ضربهما بعد معرفة ، ، n (حيث n هي عدد أزواج القيم).
مثال (1) :
البيانات التالية تمثل أعمار ثمانية من الناخبين ودخولهم اليومية بالدولار، والمطلوب حساب معامل بيرسون للارتباط الخطي بين الأعمار والدخول.
الأعمار 35 47 51 38 43 29 32 25 : x
الدخول 50 100 62 40 35 15 18 10 : y

الحل :
لحساب معامل بيرسون للارتباط الخطي يلزم حساب المجاميع:
لذلك يتم تنظيم حساب هذه المجاميع كما في الجدول التالي:
Y2 x2 Xy y الدخول x الأعمار
100 625 250 10 25
324 1024 576 18 32
225 841 435 15 29
1225 1849 1505 35 43
1600 1444 1520 40 38
3844 2601 3162 62 51
10000 2209 4700 100 47
2500 1225 1750 50 35
19818 11818 13898 330 300
ثم نطبق في الصيغة المختصرة رقم (2) لمعامل الارتباط حيث n = 8 :

أي أن معامل بيرسون للارتباط الخطي بين أعمار الناخبين ودخولهم اليومية يساوي 0.81 وهو ارتباط طردي (لأن إشارته موجبة) وقوى (لأنه قريب من الواحد الصحيح). بمعنى أخر، إن هناك علاقة طردية قوية بين عمر الناخب ودخله مقدارها 81 %. فمع زيادة عمر الناخب يزيد دخله، والعكس صحيح.


المادة المعروضة اعلاه هي مدخل الى المحاضرة المرفوعة بواسطة استاذ(ة) المادة . وقد تبدو لك غير متكاملة . حيث يضع استاذ المادة في بعض الاحيان فقط الجزء الاول من المحاضرة من اجل الاطلاع على ما ستقوم بتحميله لاحقا . في نظام التعليم الالكتروني نوفر هذه الخدمة لكي نبقيك على اطلاع حول محتوى الملف الذي ستقوم بتحميله .
الرجوع الى لوحة التحكم