Ahmed Moharram
Ahmed Moharram

@ABMOHARRAM

28 تغريدة 10 قراءة Jun 17, 2020
يلجأ بعض علماء البيانات أحياناً لطرق عكسية في استنتاج الأرقام.
تصور أنك عالم بيانات أو خبير إحصائي، أو باحث في الذكاء الصناعي. في كثير من الأحوال سيكون المطلوب منك الإجابة على أسئلة تبدو بسيطة لكنها في الواقع ليست كذلك.
مثلاً إذا طلبت منك مؤسسة ما أن تختار 20 سلعة (من بين 100 ألف) ليتم عرضها في الصفحة الأولى لموقع جديد سينافس أمازون في البيع عن طريق الإنترنت. كيف ستتصرف؟ أو مثلاً لو طلبت منك دولة أن تخبرهم بردود الفعل المتوقعة حين يتم رفع أسعار السجائر (هم لن يسمعوا نصيحتك في النهاية طبعاً)
في مثل هذه الأحوال يسعى الباحثون إلى معطيات تبدو للوهلة الأولى غير مرتبطة بالموضوع إطلاقاً. مثلاً في الحالة الأولى قد يلجأ الباحث إلى معلومات مكاتب البريد المجهَّلة حول أوزان وأحجام الطرود الواردة من الخارج وبالتحديد مش شركات مواقع البيع عن طريق الإنترنت
باحث آخر قد يجهيز روبورت يزور موقع أمازون 10 آلاف مرة [بـ IPs وهمية تنتمي ظاهرياً للدول(ة) المستهدفة طبعاً] ويقوم بسحب المنتجات التي تظهر في الصفحة الأولى في كل مرة
لاحقاً يدرس توزيع تكرار هذه المنتجات (لأن هذه النتائج هي خلاصة معارف أمازون التي يستخدمها للاحتفاظ بالعملاء الجدد)
في أزمة كورونا تقوم بعض الدول بالكذب إما بسبب الاقتصادي أو السياسة أو حتى بحكم التعود
لكن علماء البيانات يستطيعون استخدام بيانات معينة لاكتشاف كثير من أشكال الكذب. كيف يمكنهم ذلك ؟؟
هناك العديد من الطرق في الحقيقة، فالبيانات القادمة من دول كثيرة تسمح باستنتاج أرقام من دول أخرى
وبالطبع أول فكرة يجب أن تأتي لنا هو أن كل دولة حالة خاصة، لا يمكننا مقارنة أو مقاربة الدول لأنه لا يوجد أساس مشترك بين أي دولتين.
إذا كان هذا هو رأيك، فلعلم البيانات رأيٌ مختلف .. فهيا بنا نلعب
سأبدأ باختيار دول أوروبا فبينها صفات كثيرة مشتركة. ولأن إيطاليا وأسبانيا بلدين سياحيين وهما أكبر الدول المتضررة فسأبدأ من السياحة
ما هي الدول الأكثر جذباً للسياح في أوروبا، أنظروا للرسم البياني التالي وهو يوضح عدد الليالي الفندقة المشغولة في كل دولة في أوروبا في يناير 2020
الجدول التالي يبين الأرقام التي اعتمد عليها الرسم السابق:
ما هي أعداد الإصابات في هذه الدول (دول أوروبا) ؟
(بشكل ما يضع worldmeters روسيا ضمن أوروبا لكن تغاضوا روسيا الآن)
ألا يبدو لكم أن هناك ارتباط بشكل ما بين حجم السياحة في يناير 2020 وعدد الإصابات في مختلف الدول؟
يبدو هذا منطقياً فالسياحة تعني التحرك في أماكن كثيرة خلال فترة قصيرة.. إنها وصفة سحرية لنشر العدوى بالطبع. لكن هل يوجد شيء غريب هنا؟
نعم؛ النمسا
أعداد الإصابات في النمسا لا تتناسب مع أعداد السائحين الذين زاروها خلال يناير 2020
لا يمكننا القفز إلى استنتاج أنهم كاذبون.
فمزيد من البحث يخبرنا أن هذا الوقت من العام يجعل مدينة Ischgl في ولاية Tyrol بالنمسا محط أنظار أغلب السياح للتزلج على الجليد. يكفي أن تكتب إسم المدينة ليكون أول ما يظهره لك Google هو هذه الصفحة:
هذه المدينة تحديداً يبدو أنها كانت مصدر انتقال المرض لكثير من المرض. لكن أين تقع تحديداً؟
إن لها موقع فريد في الحقيقة، فهي تقع شمال إيطاليا على الحدود السويسرية وفي نفس الوقت قريبةجداً من الحدود الجنوبية الألمانية.
لو نظرنا لخريطة انتشار فيروس كورونا في القارة العجوز ستجدون أن هذه المدينة تحديداً لونها أصفر (نسبياً إلى بقية الدول المحيطة)
وبالنظر إلى خريطة تتعامل بدقه أكبر وتنسب الأعداد لعدد السكان سنرى ما يلي. (الدائرة الصفراء تظهر منطقة Tyrol)
تستطيعون أن تروا أن الجزء الأكثر تضرراً في ألمانيا هو جنوبها وغربها كما يتضح من الخريطة التالية:
وبالنسبة لإيطاليا فأن الكثافة الأكبر للمرضى في شمالها، كما يتضح من الخريطة التالية:
هل هناك منطق إذن في أن الدولتين المحيطتين بالمدينة الأكثر تسبباً في الإصابات حققا إصابات أكثر منها بكثير؟
لن تتعب كثيراً إذا قررت استقصاء الأمر، فمنذ عام 2008 بدأت زيادة أعداد الصينيين الذين يزورون النمسا وتحديداً مدن التزلج على الجليد ،
وتحديداً منطقة Tyrol Disappointed face (وفقاً لهذا المصدر ف ديسمبر 2019)
المصدر: chinadaily.com.cn
على خريطة النمسا سترون بقع أغمق من غيرها، هذه المناطق مرتبطة بالمدن الثلاث التي ذكرها كاتب المقال حول تفضيلات السياح الصينيين. وأولهم هي الأكثر سوءاً
تكاد تكون حالة تَلبُّس
لكن هذا لا يجيب على السؤال الذي بدأنا به؟ هل كذبت النمسا في أرقامها؟
تعالوا بنا نقارن النمسا بالبلاد المحيطة بها
وسوف نختار ألمانيا وإيطاليا وسويسرا على التوالي لنقارنهم بالنمسا.
في الجدول التالي نقارن بعض المؤشرات الهامة لهذه البلدان:
كما تلاحظون فإن النمسا لديها أقل معدلات إصابات ووفيات لكل مليون. تليها ألمانيا. لكن الأهم هو أن النمسا قامت بعدد تحاليل لكل مليون نسمة أكبر من ألمانيا ولا يتفوق عليها في هذا المؤشر إلا سويسرا
هل يمكن أن تكون النمسا قد أخفت مثلاً عدداً من الوفيات ؟ هل يمكن أن تكون النمسا أخفت عدداً من الإصابات؟
هذا غير منطقي في دولة قامت بكل هذا العدد من التحاليل.
هل يمكن أن يكون معدل وفيات أهل النمسا الطبيعي مثلاً أقل من معدل وفيات بقية الدول ؟؟
من البيان الأخير في الجدول يتضح أن عدد الوفيات الطبيعية لكل مليون في النمسا وسويسرا أقل منه في إيطاليا، وأن ألمانيا لديها أعلى معدل وفيات سنوي لأسباب غير COVID19
هذا قد يفسر الفارق. أهل النمسا وسويسرا يسكنون مناطق مرتفعة في أغلبهم. فهم يسكنون الجبال، هذا ربما يجعل صحتهم أفضل
هل هناك سبب آخر ربما خلف هذا الأمر؟ إنظروا إلى الخريطة التالية
واضح أن المنطقة التي يعشقها السياح هي منطقة منخفضة الكثافة السكانية. هذا يعني أنه بالرغم من أن السياح يأتون ويسببون العدوى، فإن النصيب الأكبر من العدوي يكون للسياح الآخرين، فهم أغلبية في هذا الموسم.
كما لو كان السياح يلتقون ليتناقلوا العدوى بينهم
أما نصيب السكان الأصليين فأقل
أقل لأن عددهم أصلاً في هذه المناطق أقل. ولأن التزلج له موعد محدد وهو فترة رأس السنة وما حولها، فهذا جعل كثير من السياح بالذات من يفضلون التزلج في دولة قريبة وبين الحدود يعودون بالمرض إلى بلادهم.
بينما السكان القليلون أصلاً ماكثون
لكن هل هذا هو كل شيء؟
مما قرأنا لا يبدو أن النمسا كذبت أو أنتجت أرقاماً خاطئة
لكن واضح أن هناك أسباب بعضها لوجيستي وبعضها صحي أدت إلى الوضع الذي وصلت له
وهذا لا ينفي أنها شاركت في نقل الفيروس بمدنها السياحية ، شأنها شأن كل المدن السياحية الأخرى
لكن التوقيت مع حب التزلج جعلا آثار مدن النمسا مؤثرة أكثر

جاري تحميل الاقتراحات...