1- النزعة المركزية
مفهوم النزعة المركزية يعني كيف نلخص مجموعة ارقام في رقم واحد مثال المبيعات اليومية خلال الشهر أو السنة عن طريقة حساب معايير التشابه بين هذه الأرقام
كيف نقوم بحاسب معايير التشابه ؟
اولا المتوسط
المتوسط الحسابي هو المعدل او نقطة التوازن بين الأرقام ويعني
مفهوم النزعة المركزية يعني كيف نلخص مجموعة ارقام في رقم واحد مثال المبيعات اليومية خلال الشهر أو السنة عن طريقة حساب معايير التشابه بين هذه الأرقام
كيف نقوم بحاسب معايير التشابه ؟
اولا المتوسط
المتوسط الحسابي هو المعدل او نقطة التوازن بين الأرقام ويعني
ويعني ( مجموع القيم / عددها )
مثلا لدينا عدة ارقام
5،10،15،20،
عدد الارقام هنا 4 وقيمتها 50
لإيجاد المتوسط نقسم مجموع الارقام علي عددها
50 / 4 = 12.5
اذا 12.5 تمثل المتوسط الحسابي
ولكن هناك مشكلة في المتوسط الحسابي انه يتأثر بالعناصر الشاذة
مثلا لدينا عدة ارقام
5،10،15،20،
عدد الارقام هنا 4 وقيمتها 50
لإيجاد المتوسط نقسم مجموع الارقام علي عددها
50 / 4 = 12.5
اذا 12.5 تمثل المتوسط الحسابي
ولكن هناك مشكلة في المتوسط الحسابي انه يتأثر بالعناصر الشاذة
ثانيا الوسيط الحسابي :- Median
الوسيط هو مفهوم اخر نحاول فيه معرفة التشابه بين الأرقام ، طريقة حسابه اننا نقوم بترتيب الارقام من الأصغر الي الأكبر ثم نأخذ القيمة التي تقع في المنتصف
مثلا لدينا عدة ارقام مثل
10،20،30،40،60
الوسيط الحسابي هنا يمثل الرقم 30
الوسيط هو مفهوم اخر نحاول فيه معرفة التشابه بين الأرقام ، طريقة حسابه اننا نقوم بترتيب الارقام من الأصغر الي الأكبر ثم نأخذ القيمة التي تقع في المنتصف
مثلا لدينا عدة ارقام مثل
10،20،30،40،60
الوسيط الحسابي هنا يمثل الرقم 30
ثانيا من المفاهيم الأساسية في الإحصاء الوصفي
( معايير التشتت dispersion )
يهدف التشتت الي طريقة معرفة مدي اختلاف درجات الطلاب عن بعضها البعض ، في النزعة المركزية نحاول معرفة التشابه بين الأرقام
انما في التشتت نحاول معرفة الإختلاف ومدي بعد الارقام عن بعضها البعض
( معايير التشتت dispersion )
يهدف التشتت الي طريقة معرفة مدي اختلاف درجات الطلاب عن بعضها البعض ، في النزعة المركزية نحاول معرفة التشابه بين الأرقام
انما في التشتت نحاول معرفة الإختلاف ومدي بعد الارقام عن بعضها البعض
مثلا لو لدينا مليون رقم في قائمة
تتمثل قيمها من 1 الي 1000000
وقائمة اخري تتمثل قيمها من 100 الي 1000000 ،
منطقيا ان الأرقام البعيدة عن بعضها وفيها تشتت ستكون في القائمة الأولي التي تتراوح من 1 الي مليون
ولكي نحسب قيمة التباعد او التشتت بين الأرقام لدينا مفهومين
تتمثل قيمها من 1 الي 1000000
وقائمة اخري تتمثل قيمها من 100 الي 1000000 ،
منطقيا ان الأرقام البعيدة عن بعضها وفيها تشتت ستكون في القائمة الأولي التي تتراوح من 1 الي مليون
ولكي نحسب قيمة التباعد او التشتت بين الأرقام لدينا مفهومين
أولا :- التباين Variance
التباين هو متوسط تشتت الأرقام مثلا تباين الطلاب = 8 يعني متوسط ابتعاد الطلاب عن بعضها يساوي 8 درجات
وكل ما قلت القيمة وأصبحت قريبة من الصفر كل ما كانت هذه البيانات قريبة من بعض وإذا كانت الأرقام متساوية ستكون قيمة التباين صفر
التباين هو متوسط تشتت الأرقام مثلا تباين الطلاب = 8 يعني متوسط ابتعاد الطلاب عن بعضها يساوي 8 درجات
وكل ما قلت القيمة وأصبحت قريبة من الصفر كل ما كانت هذه البيانات قريبة من بعض وإذا كانت الأرقام متساوية ستكون قيمة التباين صفر
2- الإنحراف المعياري
Standard deviation
الإنحراف المعياري هو جذر التباين ويمثل متوسط انحراف الأرقام عن المعدل مثلا اذا الانحراف المعياري 8 نقول ان الدرجات تبعد عن المتوسط بمقدار 8
Standard deviation
الإنحراف المعياري هو جذر التباين ويمثل متوسط انحراف الأرقام عن المعدل مثلا اذا الانحراف المعياري 8 نقول ان الدرجات تبعد عن المتوسط بمقدار 8
ثالثا :- الترابط Correlation
الترابط أو العلاقات من المفاهيم الهامة في الإحصاء الوصفي ، في الترابط نحاول معرفة
علاقة المتغيرات ببعضها ، تحدثنا الآن عن معايير النزعة المركزية ومعايير التشابه والإختلاف ،
لو لدينا قائمتين من الأرقام يقدم لنا الإحصاء الوصفي طريقة الترابط >
الترابط أو العلاقات من المفاهيم الهامة في الإحصاء الوصفي ، في الترابط نحاول معرفة
علاقة المتغيرات ببعضها ، تحدثنا الآن عن معايير النزعة المركزية ومعايير التشابه والإختلاف ،
لو لدينا قائمتين من الأرقام يقدم لنا الإحصاء الوصفي طريقة الترابط >
بين متغيرين ، تخيل أن لدينا قائمة تحتوي علي 100 طالب ، وكل طالب منهم لديه ساعات دراسة اسبوعية ، ودرجات الإختبار النهائي
هل هناك علاقة بين بين الدرجات وبين ساعات الإختبار ؟
وهل درجات الطلاب تزيد مع زيادة عدد ساعات المذاكرة ؟
لتوضيح هذه العلاقة نستخدم الترابط
هل هناك علاقة بين بين الدرجات وبين ساعات الإختبار ؟
وهل درجات الطلاب تزيد مع زيادة عدد ساعات المذاكرة ؟
لتوضيح هذه العلاقة نستخدم الترابط
تتراوح قيمة الترابط في العادة بين الأرقام
1 ، -1 ، 0
اذا كانت القيمة قريبة من الرقم 1 تعني موجبة وهذا يعني ان هناك علاقة طردية بين المتغيرات يعني كلما زاد قيمة المتغير الأول زادت قيمة المتغير الثاني
او كلما زادت ساعات المذاكرة كلما كانت درجة الطلاب قريبة من الزيادة تقريبا
1 ، -1 ، 0
اذا كانت القيمة قريبة من الرقم 1 تعني موجبة وهذا يعني ان هناك علاقة طردية بين المتغيرات يعني كلما زاد قيمة المتغير الأول زادت قيمة المتغير الثاني
او كلما زادت ساعات المذاكرة كلما كانت درجة الطلاب قريبة من الزيادة تقريبا
وإذا كانت القيمة قريبة من -1 تعني ان هناك علاقة سلبية بين المتغيرين
كلما زادت قيمة المتغير الأول نقصت قيمة المتغير الثاني ،
وإذا كانت القيمة قريبة من صفر تعني انه لا علاقة بين المتغيرين
كلما زادت قيمة المتغير الأول نقصت قيمة المتغير الثاني ،
وإذا كانت القيمة قريبة من صفر تعني انه لا علاقة بين المتغيرين
وأخيرا يتم إيجاد كل هذه الخطوات برمجيا وبسهولة في تحليل البيانات عن طريقة مكتبة numpy
دالة mean تطبع الوسيط الحسابي
دالة median تطبع المتوسط الحسابي
دالة std تطبع الإنحراف المعياري
دالة corrcoef تطبع الترابط
وسأقوم في موضوع أخر بوضع أمثلة لهم برمجيا بإذن الله
دالة mean تطبع الوسيط الحسابي
دالة median تطبع المتوسط الحسابي
دالة std تطبع الإنحراف المعياري
دالة corrcoef تطبع الترابط
وسأقوم في موضوع أخر بوضع أمثلة لهم برمجيا بإذن الله
وردت هذه البيانات في معسكر تحليل البيانات الموجود في موقع برمج
للإشتراك عن طريق الرابط
barmej.com
وللحصول علي خصم 15٪ من قيمة المعسكر استخدم كود PrograminLovers
للإشتراك عن طريق الرابط
barmej.com
وللحصول علي خصم 15٪ من قيمة المعسكر استخدم كود PrograminLovers
جاري تحميل الاقتراحات...