سعيد شعبان
سعيد شعبان

@Saeed_SH23

11 تغريدة 27 قراءة Sep 23, 2020
مقدمة عن الإحصاء الوصفي ..
Descriptive Statistics
الإحصاء الوصفي من أهم العلوم الأساسية في مجال تحليل البيانات ، مهمته وصف البيانات
تخيل لدينا قائمة من درجات الطلاب في فصل دراسي معين في الغالب لا نستوعب هذا الكم الهائل من الدرجات لذلك يصف لنا الإحصاء الوصفي كل هذا >>>
هناك بعض الأسئلة الهامة في الإحصاء الوصفي عند العمل مثلا مع قائمة تحتوي علي درجات طلاب
1- كيف تبدو هذه الدرجات بشكل عام ؟
2- هل درجات الطلاب متشابهة أم مختلفة ؟
وهذه الأسئلة بالطبع سنتعرف عليها عند عملية وصف البيانات
فما طريقة وصف البيانات
وما المقصود بها ؟
وصف البيانات
يعني تلخيص كم كبير من البيانات في رسم بياني أو رقم يلخص أو يوصف هذا الكم من البيانات
ثم تحويل هذه الأرقام الي صور أو أشكال يستوعبها العقل البشري
يمثل رسم البيانات عمودين
الاول : المحور السيني X
الثاني : المحور الصادي Y
يمثل المحور السيني (X)ترتيب الأرقام من اليمين الي اليسار
ويمثل المحور الصادي (Y)قيمة هذه الأرقام او الدرجات
Histograms المدرج التكراراي من أنواع رسم البيانات وننظر فيه الي شكل المدرجات وحدودها حيث يخبرنا شكل المدرجات عن توزيع الأرقام وحدود المدرجات يخبرنا عن أقل قيمة وأكبر قيمة
مفاهيم إحصائية .
هناك بعض المفاهيم الإحصائية الهامة للمبتدئين في تحليل البيانات باستخدام الإحصاء الوصفي وهما 👇
معايير التشابه
معايير الإختلاف
النزعة المركزية
الوسط الحسابي
الوسيط الحسابي
القيم المتطرفة
فماذا تعني كل هذه المفاهيم ؟
في معايير التشابه نتساءل دوما !
ما الذي يجعل هذه الأرقام تتشابه ؟
وما العامل المشترك بين الأرقام ؟
في معايير الإختلاف !
نتساءل ما الذي يجعل الأرقام مختلفة عن بعضها البعض ؟
ويطلق علماء البيانات علي هذا التباعد ايضا مسمي (التشتت)
مقاييس النزعة المركزية
(Measures of Central Tendency)
المقصود بالنزعة المركزية هو تمركز البيانات حول قيمة معينة يمكن تسميتها بالقيمة المركزية ، وفي هذه الحالك نستخدم بعض المقاييس للتعرف علي هذه القيم المركزية التي تتمركز حولها البيانات
وهنا يأتي دور المتوسط والوسيط الحسابي
المتوسط الحسابي (Mean)
المتوسط الحسابي هو الرقم الذي يمثل نقطة التوازن بين جميع الأرقام
للحصول عليه يدويا كالتالي
لنفرض ان لدينا قائمة 10 فصول من الطلاب وتريد معرفة المتوسط الحسابي لها
نقوم بجمع عدد الطلاب في جميع الفصول ثم نقسم العدد علي 10 وهو عدد فصول الطلاب ..
الوسيط (Median)
هو الرقم الذي في المنتصف تماما بين هذه الأرقام أو ضمن القائمة وعندما تقوم بترتيب الأرقام من الأصغر الي الأكبر ستجده
القيم المتطرفة
هي البيانات أو القيم التي تزيد أو تقل كتيرا عن قيمة الوسيط مثلا لدينا قائمة من الارقام(1،2،3،4،400)رقم 400 يعتبر من القيم المتطرفة
وهناك أيضا في معايير الإختلاف مصطلحات هامة مثل
الإنحراف المعياري (Standard Deviation)
ويعتبر من أهم مقاييس التشتت وقيمته تتمثل في الجذر التربيعي لقيمة (التباين)
والتباين
وهو رقم يمثل معدل تشتت الأرقام عن بعضها البعض
والترابط
وهو حساب التشابه بين متغيرين او قائمتين مختلفتين
هذه مقدمة نظرية بسيطة عن أساسيات الإحصاء الوصفي لتحليل البيانات والغرض منه هو الوصف الجيد وعرض البيانات بطريقة منظمة وسهلة الفهم لأن وصف البيانات الجيد سيؤدي الي توفير الوقت والجهد وتقليل مشاكل تحليل البيانات ولكن الأمر برمجيا فيه بعض التفاصيل والدوال الجاهزة لتسهيل تلك العمليات

جاري تحميل الاقتراحات...