لكل علم أساسيات هامة قد تحتاجها قبل البدء فيه وتركك لهذه الأساسيات يحمل عليك المزيد من الوقت الإضافي في البحث عن معلومات مرتبطة بتلك الأساسيات الي تجاهلتها بالبداية لقول أحدهم لك أنها سهلة وقم بتخطيها ، أو لاعتقادك أنها ليست ضرورية .
علي سبيل المثال عند حصولك علي البيانات التي ستعمل عليها داخل ملفات CSV أو في إحدي قواعد البيانات ، أو في ملفات هائلة من الإكسل ، أو مجموعة بيانات ضخمة فوضوية لا تدري كيف ولا من أين تبدء العمل عليها .
* كيف ستفرق بين تلك البيانات ؟
* كيف تجري عليها المقارنات ؟
* كيف تختار العمليات والخوارزميات المناسبة لها ؟
* كيف تعرف البيانات الفئوية من الرقمية ؟
* كيف تختار الرسم البياني المناسب لها ؟
* كيف تطبق العمليات الحسابية عليها ؟
* كيف تجري عليها المقارنات ؟
* كيف تختار العمليات والخوارزميات المناسبة لها ؟
* كيف تعرف البيانات الفئوية من الرقمية ؟
* كيف تختار الرسم البياني المناسب لها ؟
* كيف تطبق العمليات الحسابية عليها ؟
البيانات هي كل ما تشاهده وتتعامل معه عبر الإنترنت أو داخل شركتك أو علي هاتفك - كل ما تقرأه وتسمعه وتشاهده هو بيانات - سواء كانت ( نصية - رقمية - مرئية ) قد تختلف المسميات والطرق والأنواع ولكن في النهاية تدخل تحت مصطلح ( بيانات Data )
وفهمك لأنواع تلك البيانات سيوفر عليك المزيد من الوقت والمجهود كي تختار العملية المناسبة التي تجريها علي كل نوع .
مفهوم أنواع البيانات .
قسم العلماء البيانات إلي أكثر من نوع لسهولة الفهم وللمساعدة في تطبيق الخوارزميات المناسبة عليها
الأنواع الأساسية للبيانات هم كالتالي وسنأخذهم علي شكل قسمين منفصلين .
قسم العلماء البيانات إلي أكثر من نوع لسهولة الفهم وللمساعدة في تطبيق الخوارزميات المناسبة عليها
الأنواع الأساسية للبيانات هم كالتالي وسنأخذهم علي شكل قسمين منفصلين .
البيانات النوعية باختصار شديد هي البيانات التي لا يمكنك إجراء عمليات حسابية عليها ، فهي بيانات ليست إحصائية ولا يتم قياسها عدديا .
ومن أمثلة هذه البيانات كي نوضح تلك المفهوم .
* نوع الشخص ٠ ذكر - أنثي )
* جنسية الشخص ( مصري - سعودي - الخ )
* مستواك المادي ( عالي - متوسط )
* اللون ( أسود - سماوي - داكن )
* الملمس ( ناعم - خشن )
* الصوت ( عالي - منخفض )
* رقم الهوية ( 12344566 )
* نوع الشخص ٠ ذكر - أنثي )
* جنسية الشخص ( مصري - سعودي - الخ )
* مستواك المادي ( عالي - متوسط )
* اللون ( أسود - سماوي - داكن )
* الملمس ( ناعم - خشن )
* الصوت ( عالي - منخفض )
* رقم الهوية ( 12344566 )
قد يتساءل البعض أن رقم الهوية عددي وليس نصي ولكن مع اتباع قانون البيانات النوعية أنه لا يمكن إجراء عمليات حسابية علي أرقام الهوية أو جواز السفر أو هوية الجامعة لذلك مع كونها أرقام لكن تدخل في حيز البيانات النوعية ، بشكل عام البيانات النوعية هي بيانات وصفية تستخدم للوصف
النوع الثاني من البيانات :
البيانات الكمية - وتسمي Quantitative Data .
وهذه البيانات باختصار هي البيانات التي نحصل عليها علي شكل أعداد ومن الممكن ترتيب تلك البيانات .
البيانات الكمية - وتسمي Quantitative Data .
وهذه البيانات باختصار هي البيانات التي نحصل عليها علي شكل أعداد ومن الممكن ترتيب تلك البيانات .
ومن أمثلة هذه البيانات .
* الدخل الشهري
* درجات الحرارة
* الطول
* العرض
* الأسعار
* درجات الإختبار
* عدد أيام السنة
* مسافة المشي بالميل
* الوزن
هذه البيانات هي بيانات عددية رقمية تستطيع ترتيبها من الأصغر للأكبر والعكس التعامل معها بشكل مرتب .
* الدخل الشهري
* درجات الحرارة
* الطول
* العرض
* الأسعار
* درجات الإختبار
* عدد أيام السنة
* مسافة المشي بالميل
* الوزن
هذه البيانات هي بيانات عددية رقمية تستطيع ترتيبها من الأصغر للأكبر والعكس التعامل معها بشكل مرتب .
لذلك لا يجب أن تقول علي البيانات الكمية أنها بيانات تأتي في شكل أعداد ويمكن ترتيبها فقط ، ولكن عند ذكرك للبيانات الكمية يجب أن تحدد هلي هي بيانات كمية متصلة ، أم بيانات كمية منفصلة .
من الأمثلة علي البيانات الكمية المنفصلة.
* عدد الطلاب داخل الفصل
* عدد الغرف السكنية
* عدد المدرسين بالمدرسة
* عدد موظفين المصنع
* عدد الأسهم المباعة
* عدد الحوادث اليومية
* عدد الموضي بالمستشفي
* عدد الأطباء
* عدد سنوات الخبرة
* عدد الطلاب داخل الفصل
* عدد الغرف السكنية
* عدد المدرسين بالمدرسة
* عدد موظفين المصنع
* عدد الأسهم المباعة
* عدد الحوادث اليومية
* عدد الموضي بالمستشفي
* عدد الأطباء
* عدد سنوات الخبرة
ثانيا : البيانات الكمية المتصلة Continuous Data
هذه البيانات لا يمكن عدها ولكن تستطيع قياسها بسهولة ويمكن إعطائها قيم صحيحة أو كسرية ويمكن أن تأخذ أي قيمة كما يمكن تقسيمها بلا حدود إلى أجزاء أصغر وهي تختلف عن البيانات المنفصلة في أنها يمكن أن تغير قيمتها مع الوقت
هذه البيانات لا يمكن عدها ولكن تستطيع قياسها بسهولة ويمكن إعطائها قيم صحيحة أو كسرية ويمكن أن تأخذ أي قيمة كما يمكن تقسيمها بلا حدود إلى أجزاء أصغر وهي تختلف عن البيانات المنفصلة في أنها يمكن أن تغير قيمتها مع الوقت
الأمثلة على البيانات المستمرة هي:
* الراتب الشهري
* درجات الحرارة
* وزن الطلاب
* درجات اختبار الذكاء
* العمر الإفتراضي للأجهزة
* مقدار الوقت المطلوب لإكمال المشروع
* ارتفاع الأطفال
* كمية المطر التي تسقط في عاصفة
* سرعة السيارات
كما تري فهذه البيانات يمكن تغييرها مع مرور الوقت
* الراتب الشهري
* درجات الحرارة
* وزن الطلاب
* درجات اختبار الذكاء
* العمر الإفتراضي للأجهزة
* مقدار الوقت المطلوب لإكمال المشروع
* ارتفاع الأطفال
* كمية المطر التي تسقط في عاصفة
* سرعة السيارات
كما تري فهذه البيانات يمكن تغييرها مع مرور الوقت
مستويات قياس البيانات تعتبر من أهم العوامل التي تحدد مدي قدرة إجراء العمليات الحسابية علي القيم المختلفة من البيانات
يحدد مستوى قياس المتغير نوع الاختبار الإحصائي الذي سيتم استخدامه ، أو بعبارة أخرى ، كيفية قياس المتغير .
يحدد مستوى قياس المتغير نوع الاختبار الإحصائي الذي سيتم استخدامه ، أو بعبارة أخرى ، كيفية قياس المتغير .
مثلة على المقياس الترتيبي .
* تصنيفات فريق البطولة
* وترتيب جودة المنتج
* استبيان الاتفاق أو الرضا بين العملاء من أكثر الأمثلة شيوعًا للمقياس الترتيبي.
تُستخدم هذه المقاييس عمومًا في أبحاث السوق لجمع وتقييم التعليقات النسبية حول رضا المنتج ، وتغيير المفاهيم
* تصنيفات فريق البطولة
* وترتيب جودة المنتج
* استبيان الاتفاق أو الرضا بين العملاء من أكثر الأمثلة شيوعًا للمقياس الترتيبي.
تُستخدم هذه المقاييس عمومًا في أبحاث السوق لجمع وتقييم التعليقات النسبية حول رضا المنتج ، وتغيير المفاهيم
أمثلة على مقياس الفترات.
بصرف النظر عن مقياس درجة الحرارة ، يعد الوقت أيضًا مثالًا شائعًا جدًا لهذا المقياس حيث أن القيم محددة بالفعل وثابتة وقابلة للقياس.
تندرج سنوات التقويم والوقت أيضًا ضمن هذه الفئة من مقاييس القياس.
بصرف النظر عن مقياس درجة الحرارة ، يعد الوقت أيضًا مثالًا شائعًا جدًا لهذا المقياس حيث أن القيم محددة بالفعل وثابتة وقابلة للقياس.
تندرج سنوات التقويم والوقت أيضًا ضمن هذه الفئة من مقاييس القياس.
أفضل الأمثلة على المقاييس النسبية هي الوزن والطول ، وفي أبحاث السوق يتم استخدام مقياس النسبة لحساب حصة السوق والمبيعات السنوية وسعر المنتج القادم وعدد المستهلكين وما إلى ذلك.
بشكل عام في الإحصاء الوصفي أو الإستدلالي يتم التعامل مع المستويين ( Ratio - Interval ) علي أنهم بيانات كمية
ويأخذون معاملة واحدة دون تفريق بينهم ، لذلك عند البدء في التحليل الإحصائي تقوم باختيار نوع ومقياس البيانات بناء علي الإختيارات التالية
ويأخذون معاملة واحدة دون تفريق بينهم ، لذلك عند البدء في التحليل الإحصائي تقوم باختيار نوع ومقياس البيانات بناء علي الإختيارات التالية
1- اسمي Nominal
2- ترتيبي Ordinal
3- كمي - قياسي Quantitative
2- ترتيبي Ordinal
3- كمي - قياسي Quantitative
هذه نهاية الثريد والموضوع القادم بإذن الله سيكون عن مواضيع أساسية هامة في علم البيانات مثل
مقاييس النزعة المركزية
ومقاييس التشتت
🤝🖤
مقاييس النزعة المركزية
ومقاييس التشتت
🤝🖤
اذا أحببت قراءة المقال بالكامل والإطلاع علي المزيد من المواضيع الهامة حول البيانات من علي موقعي .
arabsdatascience.com
arabsdatascience.com
جاري تحميل الاقتراحات...