👋🏻 سلطان أبوخشيم
👋🏻 سلطان أبوخشيم

@Abukoshaim

7 تغريدة 35 قراءة Dec 15, 2021
في عام 1850 فتكت الكوليرا في انجلترا، وشاع بين الناس ان سببها تلوث في الهواء، والبعض قال انها لعنة من السماء، واخرون ذكروا بانها الارواح الشريرة تصافح البشر!
هذه السلسة القصير تعرض احد تطبيقات #علم_البيانات في علاج احد اكثر الامراض خطورة
وهي #البيانات_المتطرفة او #outliers
وال #outliers هي بيانات تظهر بشكل ملحوظ بعيدة عن نقاط البيانات الأخرى مثل ان تكون جميع درجات الطلبة في بحر ال 70% بينما أحدهم درجته 100%
او ان تسقط كمية نقود معدنية بشكل رأسي لتتمركز في محيط وسطي عدا قطعة واحدة او قطعتين تكونان بعيدتين
هذاالشذوذ في البيانات يسمى البيانات المتطرفة
لكن ماهي قصة وباء الكوليرا كما كان الناس يعتقدون؟
لم يكن الطبيب جون سنو مقتنعا بأن للكوليرا علاقة بالهواء، وكان يظن بأن الكوليرا سببها مصادر المياه، فبدا بجمع البيانات للوفيات ووضع نقاط لها على خريطة لندن
في الصورة أدناه الخريطة التي صنعها جون سنو (رمز للوفيات بالأسود حسب العدد)
ولاحظ ان بيانات الوفيات على الخريطة متركزه في منطقة في لندن تسمى سوهو، فافترض بأن السبب هو مصدر المياه فيها
لكن لم يكن ليصدقه احد لان الأطباء وقتها يعتقدون بأن الكوليرا وباء كالطاعون ينتشر بالهواء الملوث
كويز: أيهما جون سنو المعني في هذه السلسة؟
فانتبه سنو بان احد الوفيات حصلت بعيدا عن لندن، فقرر الذهاب لبيتها ليقابل ابنها عقب وفاتها، فذكر الابن ان امه كانت تسكن في حي سوهو قبل سنوات! وخرجت قبل الوباء منه بفترة طويلة، إلا انها كانت تحب طعم المياه في حيها القديم فاوصت صديقا لها قبل ايام من مرضها فاحضر لها قنينة ماء من سوهو
وهكذا، ركض الطبيب بهذه البيانات المتطرفة، والتي لم يكن لها أي معنى في بداية الأمر الى المسؤولين عن بلدية لندن ليغلقوا مصدر المياه عن حي سوهو وتحل مشكلة المياه الملوثة تماما
لذلك عند تحليل البيانات حاذر ان تحجب البيانات المتطرفة ظنا بأنها غير مفيدة
فلربما تكتشف سببا اخر لأمراض اخرى، او احداث اقتصادية، أو حتى اسباب تميز بعض الطلبة.
انتهى

جاري تحميل الاقتراحات...