في تقييم جودة البيانات (Data Quality) نقوم بالتأكد من صحة البيانات أو دقتها .. ولكن ربما يسأل أحدهم بقوله:
ماهو الفرق بين الصحة (Correctness) والدقة (Accuracy)؟
أسفل هذه التغريدة سأتكلم عن الفرق بينهما.. المصدر: vceit.com
#علم_البيانات
ماهو الفرق بين الصحة (Correctness) والدقة (Accuracy)؟
أسفل هذه التغريدة سأتكلم عن الفرق بينهما.. المصدر: vceit.com
#علم_البيانات
"الصحيح" هناك شيء صحيح أو غير صحيح. لا توجد درجات من الصحة، لا يمكنك أن تكون صحيحاً جزئياً!
بينما "الدقة" تشير إلى الدرجة التي يتم بها تمثيل الحقيقة في بيان أو حساب وقد تكون دقيقة جزئياً، أي قريب من الصحة
بينما "الدقة" تشير إلى الدرجة التي يتم بها تمثيل الحقيقة في بيان أو حساب وقد تكون دقيقة جزئياً، أي قريب من الصحة
ولتوضيح الفرق بين "الصحة" و "الدقة" إليكم بعض الأمثلة:
✅ "فرنسا بلد في نصف الكرة الشمالي" --> "صحيح" و لكن ليس "دقيق" جداً
✅ "فرنسا بلد في أوروبا" --> "صحيح" وأكثر "دقة"
✅ "فرنسا بلد في أفريقيا" --> غير "صحيح"
✅ "فرنسا بلد في نصف الكرة الشمالي" --> "صحيح" و لكن ليس "دقيق" جداً
✅ "فرنسا بلد في أوروبا" --> "صحيح" وأكثر "دقة"
✅ "فرنسا بلد في أفريقيا" --> غير "صحيح"
وهنا أمثلة رقمية على الفرق بين "الصحة" و "الدقة":
✅ "باي "Pi" = 3.14" --> "صحيح" ولكن غير "دقيق" للغاية
✅ "باي "Pi" = 3.14159" --> "صحيح" وأكثر "دقة"
✅ "باي "Pi" = 8.08495" --> غير "صحيح"
✅ "باي "Pi" = 3.14" --> "صحيح" ولكن غير "دقيق" للغاية
✅ "باي "Pi" = 3.14159" --> "صحيح" وأكثر "دقة"
✅ "باي "Pi" = 8.08495" --> غير "صحيح"
يلاحظ أن القيمة قد تكون صحيحة ولكن ليست دقيقة للغاية، ولكن لا يمكن أن تكون دقيقة و غير صحيحة، بمعنى لكي تكون دقيقة بأي شكل من الأشكال يجب أن تكون القيمة صحيحة أولاً..
التحدي: هل تستطيع أن تقترح مثالًا يكون فيه شيء "غير صحيح" ، ولكنه "دقيق"؟
التحدي: هل تستطيع أن تقترح مثالًا يكون فيه شيء "غير صحيح" ، ولكنه "دقيق"؟
كذلك يلاحظ أن:
📍الصحة "Correctness" صفة مرتبطة أكثر بالبيانات الفئوية (categorical data) مثل (سعودي، غير سعودي) ، (ذكر، أنثى) ونتيجة المتغير تكون صائبة أو خاطئة!
📍الدقة "Accuracy" صفة مرتبطة بالأرقام (numerical data) كالراتب 15100 لو سجلت القيمة 15050 ربما تصنف على أنها دقيقة
📍الصحة "Correctness" صفة مرتبطة أكثر بالبيانات الفئوية (categorical data) مثل (سعودي، غير سعودي) ، (ذكر، أنثى) ونتيجة المتغير تكون صائبة أو خاطئة!
📍الدقة "Accuracy" صفة مرتبطة بالأرقام (numerical data) كالراتب 15100 لو سجلت القيمة 15050 ربما تصنف على أنها دقيقة
هناك مصطلح أيضاً يستخدم مع الصحة correctness و الدقة accuracy، وهو Precision مصطلح مرتبط بالدقة، وقد يُترجم بـ "الإحكام" ويعني اتساق وتكرار ملاحظات متعددة بغض النظر عن بعدها عن الحقيقة (correctness)، والبعض يفسر الـ precision بـ "النتائج ذات انحراف معياري منخفض"
على سبيل المثال الميزان الذي يُظهر وزن الشخص على أنه 70 كجم زائد أو ناقص 50 جرام يوميًا لمدة أسبوع على أنها "دقيقة" لأن التباين في القياسات صغير (precision منخفض)، ولكن إذا كان الوزن الفعلي للشخص 90 كجم ، فإن هذا الميزان "غير دقيق" حتى لو كان تباين القياسات صغير(precision منخفض)
جاري تحميل الاقتراحات...