سعيد شعبان
سعيد شعبان

@Saeed_SH23

36 تغريدة 181 قراءة Jan 24, 2023
أنواع البيانات Data Types .
ثريد مهم لكل طالب مبتدء في علم البيانات
ما معني البيانات النوعية ؟
ما معني البيانات الكمية ؟
ما مفهوم مقاييس البيانات ؟
وما أنواع البيانات الكمية ؟
من أهم الأساسيات في رحلتك التعليمية ان تتعلم الفرق بين انواع البيانات المختلفة 👇
لكل علم أساسيات هامة قد تحتاجها قبل البدء فيه وتركك لهذه الأساسيات يحمل عليك المزيد من الوقت الإضافي في البحث عن معلومات مرتبطة بتلك الأساسيات الي تجاهلتها بالبداية لقول أحدهم لك أنها سهلة وقم بتخطيها ، أو لاعتقادك أنها ليست ضرورية .
علي سبيل المثال عند حصولك علي البيانات التي ستعمل عليها داخل ملفات CSV أو في إحدي قواعد البيانات ، أو في ملفات هائلة من الإكسل ، أو مجموعة بيانات ضخمة فوضوية لا تدري كيف ولا من أين تبدء العمل عليها .
* كيف ستفرق بين تلك البيانات ؟
* كيف تجري عليها المقارنات ؟
* كيف تختار العمليات والخوارزميات المناسبة لها ؟
* كيف تعرف البيانات الفئوية من الرقمية ؟
* كيف تختار الرسم البياني المناسب لها ؟
* كيف تطبق العمليات الحسابية عليها ؟
أولا :
* ما مفهوم البيانات ؟
* وما أنواع البيانات Data Types ؟
البيانات هي كل ما تشاهده وتتعامل معه عبر الإنترنت أو داخل شركتك أو علي هاتفك - كل ما تقرأه وتسمعه وتشاهده هو بيانات - سواء كانت ( نصية - رقمية - مرئية ) قد تختلف المسميات والطرق والأنواع ولكن في النهاية تدخل تحت مصطلح ( بيانات Data )
وفهمك لأنواع تلك البيانات سيوفر عليك المزيد من الوقت والمجهود كي تختار العملية المناسبة التي تجريها علي كل نوع .
مفهوم أنواع البيانات .
قسم العلماء البيانات إلي أكثر من نوع لسهولة الفهم وللمساعدة في تطبيق الخوارزميات المناسبة عليها
الأنواع الأساسية للبيانات هم كالتالي وسنأخذهم علي شكل قسمين منفصلين .
القسم الأول :- أنواع البيانات .
* بيانات نوعية ( وصفية) وتسمي Qualitative
* بيانات كمية (عددية) وتسمي Quantitative
البيانات النوعية باختصار شديد هي البيانات التي لا يمكنك إجراء عمليات حسابية عليها ، فهي بيانات ليست إحصائية ولا يتم قياسها عدديا .
ومن أمثلة هذه البيانات كي نوضح تلك المفهوم .
* نوع الشخص ٠ ذكر - أنثي )
* جنسية الشخص ( مصري - سعودي - الخ )
* مستواك المادي ( عالي - متوسط )
* اللون ( أسود - سماوي - داكن )
* الملمس ( ناعم - خشن )
* الصوت ( عالي - منخفض )
* رقم الهوية ( 12344566 )
قد يتساءل البعض أن رقم الهوية عددي وليس نصي ولكن مع اتباع قانون البيانات النوعية أنه لا يمكن إجراء عمليات حسابية علي أرقام الهوية أو جواز السفر أو هوية الجامعة لذلك مع كونها أرقام لكن تدخل في حيز البيانات النوعية ، بشكل عام البيانات النوعية هي بيانات وصفية تستخدم للوصف
النوع الثاني من البيانات :
البيانات الكمية - وتسمي Quantitative Data .
وهذه البيانات باختصار هي البيانات التي نحصل عليها علي شكل أعداد ومن الممكن ترتيب تلك البيانات .
ومن أمثلة هذه البيانات .
* الدخل الشهري
* درجات الحرارة
* الطول
* العرض
* الأسعار
* درجات الإختبار
* عدد أيام السنة
* مسافة المشي بالميل
* الوزن
هذه البيانات هي بيانات عددية رقمية تستطيع ترتيبها من الأصغر للأكبر والعكس التعامل معها بشكل مرتب .
القسم الثاني :- أنواع البيانات الكمية .
في القسم الأول تكلمنا عن أنواع البيانات بشكل عام وذكرنا أنهم نوعين بيانات نوعية وبيانات كمية ، في هذا القسم سنفصل أنواع البيانات الكمية كونها من أكثر الأنواع التي تعمل عليها خلال تحليلك للبيانات
لذلك لا يجب أن تقول علي البيانات الكمية أنها بيانات تأتي في شكل أعداد ويمكن ترتيبها فقط ، ولكن عند ذكرك للبيانات الكمية يجب أن تحدد هلي هي بيانات كمية متصلة ، أم بيانات كمية منفصلة .
تنقسم البيانات الكمية إلي قسمين .
* كمية منفصلة Discrete Data
* كمية متصلة Continuous Data
أولا :- البيانات الكمية المنفصلة Discrete Data
البيانات الكمية المنفصلة هي البيانات التي تستطيع عدها بسهولة حتي لو تأخذ قيما صحيحة ، ويمكن أن تأخذ قيمًا رقمية معينة فقط ، غالبًا ما يتم تمثيل هذا النوع من البيانات باستخدام مخططات الإحصاء أو الرسوم البيانية الشريطية أو المخططات
من الأمثلة علي البيانات الكمية المنفصلة.
* عدد الطلاب داخل الفصل
* عدد الغرف السكنية
* عدد المدرسين بالمدرسة
* عدد موظفين المصنع
* عدد الأسهم المباعة
* عدد الحوادث اليومية
* عدد الموضي بالمستشفي
* عدد الأطباء
* عدد سنوات الخبرة
ثانيا : البيانات الكمية المتصلة Continuous Data
هذه البيانات لا يمكن عدها ولكن تستطيع قياسها بسهولة ويمكن إعطائها قيم صحيحة أو كسرية ويمكن أن تأخذ أي قيمة كما يمكن تقسيمها بلا حدود إلى أجزاء أصغر وهي تختلف عن البيانات المنفصلة في أنها يمكن أن تغير قيمتها مع الوقت
الأمثلة على البيانات المستمرة هي:
* الراتب الشهري
* درجات الحرارة
* وزن الطلاب
* درجات اختبار الذكاء
* العمر الإفتراضي للأجهزة
* مقدار الوقت المطلوب لإكمال المشروع
* ارتفاع الأطفال
* كمية المطر التي تسقط في عاصفة
* سرعة السيارات
كما تري فهذه البيانات يمكن تغييرها مع مرور الوقت
القسم الثالث والأخير
:- مستويات قياس البيانات Interval vs. ratio data
مستويات قياس البيانات تعتبر من أهم العوامل التي تحدد مدي قدرة إجراء العمليات الحسابية علي القيم المختلفة من البيانات
يحدد مستوى قياس المتغير نوع الاختبار الإحصائي الذي سيتم استخدامه ، أو بعبارة أخرى ، كيفية قياس المتغير .
يوجد مستويات مختلفة لقياس البيانات وهم مقاييس القياس الأساسية الأربعة المستخدمة لالتقاط البيانات .
أولا: المقياس الاسمي: المستوى الأول للقياس Nominal Data .
مقياس يستخدم لتصنيف المتغيرات إلى تصنيفات مميزة ولا يتضمن قيمة أو ترتيب كمي هذا المقياس هو أبسط مقاييس القياس المتغيرة الأربعة.
أمثلة على المقياس الاسمي .
* الجنس
* التفضيلات السياسية
* مكان الإقامة
ثانيا : المستوى الثاني للقياس Ordinal Data .
يتم تعريف المقياس الترتيبي على أنه مقياس قياس متغير يستخدم ببساطة لوصف ترتيب المتغيرات وليس الفرق بين كل من المتغيرات تُستخدم هذه المقاييس عمومًا لتصوير الأفكار غير الرياضية مثل التكرار والرضا والسعادة ودرجة الألم وما إلى ذلك.
مثلة على المقياس الترتيبي .
* تصنيفات فريق البطولة
* وترتيب جودة المنتج
* استبيان الاتفاق أو الرضا بين العملاء من أكثر الأمثلة شيوعًا للمقياس الترتيبي.
تُستخدم هذه المقاييس عمومًا في أبحاث السوق لجمع وتقييم التعليقات النسبية حول رضا المنتج ، وتغيير المفاهيم
ثالثا : المستوى الثالث للقياسInterval LEvel
هذا المقياس عبارة عن مجموعة من الأعداد والقيم التي يأخذها المتغير الكمي يمكن استخدام المتوسط ​​أو الوسيط أو الوضع لحساب النزعة المركزية في هذا المقياس العيب الوحيد في هذا المقياس هو عدم وجود نقطة بداية محددة مسبقًا أو قيمة صفرية حقيقية
أمثلة على مقياس الفترات.
بصرف النظر عن مقياس درجة الحرارة ، يعد الوقت أيضًا مثالًا شائعًا جدًا لهذا المقياس حيث أن القيم محددة بالفعل وثابتة وقابلة للقياس.
تندرج سنوات التقويم والوقت أيضًا ضمن هذه الفئة من مقاييس القياس.
رابعا: مقياس النسبة: المستوى الرابع للقياس - النسبي Ratio Scale
يتم تعريف مقياس النسبة على أنه مقياس قياس متغير لا ينتج فقط ترتيب المتغيرات ولكن أيضًا يصنع الفرق بين المتغيرات المعروفة جنبًا إلى جنب مع المعلومات حول قيمة الصفر الحقيقي.
أفضل الأمثلة على المقاييس النسبية هي الوزن والطول ، وفي أبحاث السوق يتم استخدام مقياس النسبة لحساب حصة السوق والمبيعات السنوية وسعر المنتج القادم وعدد المستهلكين وما إلى ذلك.
بشكل عام في الإحصاء الوصفي أو الإستدلالي يتم التعامل مع المستويين ( Ratio - Interval ) علي أنهم بيانات كمية
ويأخذون معاملة واحدة دون تفريق بينهم ، لذلك عند البدء في التحليل الإحصائي تقوم باختيار نوع ومقياس البيانات بناء علي الإختيارات التالية
1- اسمي Nominal
2- ترتيبي Ordinal
3- كمي - قياسي Quantitative
هذه نهاية الثريد والموضوع القادم بإذن الله سيكون عن مواضيع أساسية هامة في علم البيانات مثل
مقاييس النزعة المركزية
ومقاييس التشتت
🤝🖤

جاري تحميل الاقتراحات...