حمود الدوسري
حمود الدوسري

@Dr_Hmood

7 تغريدة 2 قراءة Dec 25, 2022
البيانات الطبية كنز ثمين ووجبة دسمة لخوارزميات #تعلم_الآلة ، تخيلوا انها نجحت في التنبؤ بحدوث السكتة الدماغية بدقة تصل إلى 92% ! 🧐
البحث تم نشره مؤخراً في الرابط المرفق وألخصه أسفل هذه التغريدة
#علم_البيانات
researchgate.net
السكتة الدماغية هي السبب الثاني للوفاة حول العالم ، حسب منظمة الصحة العالمية 5 مليون شخص يصابون بالسكتة الدماغية سنوياً ، ثلثهم يموت والثلث الآخر يصاب بالإعاقة الدائمة ، السكتة الدماغية كابوس صحي للبشر وعبء اقتصادي على أنظمة الرعاية الصحية للدول
قام الباحث بسحب البيانات الشخصية والصحية لـ 5510 شخص من Kaggle وتمثل عشر خصائص منها العمر والجنس والوظيفة والسكن وضغط الدم وأمراض القلب وهل هو مدخن أو لا ، وقام بتنظيفها وبناء النماذج باستخدام لغة Python ، بعد تنظيف البيانات أصبح حجم البيانات 4201 شخص
أحد مشاكل البيانات انها غير متزنة (unbalanced dataset) وتعني أن الاشخاص الذين أصيبوا بسكتة دماغية يمثلون عدد بسيط جداً (فقط 204 شخص من أصل 4201) - يعني أقل من 5% من البيانات ينتمي لصنف مصاب ، وحوالي 95% سليمين ، لابد من توازن الصنفين وإلا لن تتعلم الآلة ولن تميز المصاب من السليم!
بعد موازنة بيانات المصابين وغير المصابين ، أصبحت البيانات الآن جاهزة لبناء نماذج التنبؤ اعتماداً على الخصائص الشخصية والخصائص الطبية ، بعد تدريب عدة خوارزميات كانت النتائج كما في الصورة تفوق Random Forest بدقة 92% تليها XGboost ثم Decision Tree
يجب التنويه إلى التكلفة العالية للسلبيات الكاذبة - false negatives - (الخوازمية لا تحدد المريض على أنه مصاب بالمرض ، أو معرض لخطر الإصابة بالمرض) ، على عكس السلبيات الكاذبة في بيئة العمل ، السلبيات الكاذبة في الطب عواقبها وخيمة وربما مميتة!
تخيل تاريخيًا تجاوزت معدلات السلبية الخاطئة من الأساليب التقليدية لاكتشاف الأمراض 50٪ ، ولكن تم تقليل هذا المعدل إلى أقل من 20٪ من خلال تطبيق خوارزميات #تعلم_الآلة

جاري تحميل الاقتراحات...