حمود الدوسري
حمود الدوسري

@Dr_Hmood

10 تغريدة 752 قراءة Oct 28, 2019
في تقييم جودة البيانات (Data Quality) نقوم بالتأكد من صحة البيانات أو دقتها .. ولكن ربما يسأل أحدهم بقوله:
ماهو الفرق بين الصحة (Correctness) والدقة (Accuracy)؟
أسفل هذه التغريدة سأتكلم عن الفرق بينهما.. المصدر: vceit.com
#علم_البيانات
قاموس أكسفورد الإنجليزي يعرف:
📌الصحة (Correctness) – صفة- تعني الخلو من الأخطاء ، وتعريف آخر: الصحيح هو المطابق للمعايير الاجتماعية المقبولة
📌الدقة (Accuracy) – صفة- وتعني بأنه صحيح في كل التفاصيل، وتعريف آخر: الدقيق هو القادر أو الناجح في الوصول إلى الهدف المقصود
"الصحيح" هناك شيء صحيح أو غير صحيح. لا توجد درجات من الصحة، لا يمكنك أن تكون صحيحاً جزئياً!
بينما "الدقة" تشير إلى الدرجة التي يتم بها تمثيل الحقيقة في بيان أو حساب وقد تكون دقيقة جزئياً، أي قريب من الصحة
ولتوضيح الفرق بين "الصحة" و "الدقة" إليكم بعض الأمثلة:
✅ "فرنسا بلد في نصف الكرة الشمالي" --> "صحيح" و لكن ليس "دقيق" جداً
✅ "فرنسا بلد في أوروبا" --> "صحيح" وأكثر "دقة"
✅ "فرنسا بلد في أفريقيا" --> غير "صحيح"
وهنا أمثلة رقمية على الفرق بين "الصحة" و "الدقة":
✅ "باي "Pi" = 3.14" --> "صحيح" ولكن غير "دقيق" للغاية
✅ "باي "Pi" = 3.14159" --> "صحيح" وأكثر "دقة"
✅ "باي "Pi" = 8.08495" --> غير "صحيح"
يلاحظ أن القيمة قد تكون صحيحة ولكن ليست دقيقة للغاية، ولكن لا يمكن أن تكون دقيقة و غير صحيحة، بمعنى لكي تكون دقيقة بأي شكل من الأشكال يجب أن تكون القيمة صحيحة أولاً..
التحدي: هل تستطيع أن تقترح مثالًا يكون فيه شيء "غير صحيح" ، ولكنه "دقيق"؟
كذلك يلاحظ أن:
📍الصحة "Correctness" صفة مرتبطة أكثر بالبيانات الفئوية (categorical data) مثل (سعودي، غير سعودي) ، (ذكر، أنثى) ونتيجة المتغير تكون صائبة أو خاطئة!
📍الدقة "Accuracy" صفة مرتبطة بالأرقام (numerical data) كالراتب 15100 لو سجلت القيمة 15050 ربما تصنف على أنها دقيقة
هناك مصطلح أيضاً يستخدم مع الصحة correctness و الدقة accuracy، وهو Precision مصطلح مرتبط بالدقة، وقد يُترجم بـ "الإحكام" ويعني اتساق وتكرار ملاحظات متعددة بغض النظر عن بعدها عن الحقيقة (correctness)، والبعض يفسر الـ precision بـ "النتائج ذات انحراف معياري منخفض"
على سبيل المثال الميزان الذي يُظهر وزن الشخص على أنه 70 كجم زائد أو ناقص 50 جرام يوميًا لمدة أسبوع على أنها "دقيقة" لأن التباين في القياسات صغير (precision منخفض)، ولكن إذا كان الوزن الفعلي للشخص 90 كجم ، فإن هذا الميزان "غير دقيق" حتى لو كان تباين القياسات صغير(precision منخفض)
لذا لكي نفرق بين الدقة "Accuracy" و الإحكام "Precision" الأولى تعني الاقتراب من الحقيقة، والثانية تعني مدى تقارب القياسات من بعضها البعض، والصورة توضح أربع حالات:
1⃣ إحكام ضعيف و دقة ضعيفة
2⃣ إحكام ضعيف و دقة عالية
3⃣ إحكام عالي و دقة ضعيفة
4⃣ إحكام عالي و دقة عالية

جاري تحميل الاقتراحات...