راشيل كلينتون لديها خبرة في العمل في مشاريع التنقيب في البيانات 20 سنة ، هنا تُسدي 9 نصائح للمهتمين بالعمل على تقنيات التنقيب في البيانات (Data Mining) ، النصائح متوفرة على الرابط وألخصها أسفل هذه التغريدة
datasciencecentral.com
datasciencecentral.com
تقول كلينتون: في مسيرتي ، رأيت العديد من الأمثلة على مشاريع التنقيب في البيانات ، مشاريع ناجحة وأخرى غير ناجحة ، وكثيراً ما تساءلت كيف يتمكن العملاء من زيادة فرص نجاح مشاريعهم ، وإستناداً للمشاريع التي عملت فيها أعتقد أن هناك 9 عناصر يجب مراعاتها لزيادة إحتمالية نجاح هذه المشاريع
1⃣ فكر جيداً في المشاريع التي تنفذها ، حاول التركيز على المشاريع التي تتماشى مع قضايا أعمال مهمة مثل تعزيز ولاء العملاء، اكتشاف الاحتيال ، أحذر من استكشاف مشكلات تبدو باردة أو معقدة ، تلك المشاكل محفوفة بالمخاطر وتأخذ وقت طويل وهامش ربح ضئيل ، مثل هذه المشاريع الأفضل تجنبها
2⃣ استخدم أكبر قدر من البيانات من أكثر من مصدر، حينما تنوي بناء نموذج لأنماط سلوك العملاء، الأفضل الوصول إلى بيانات العملاء ذوي التأثير الكبير وكذلك الذين قد يكونون أقل تأثيرًا حاليًا ولكنهم عرضة للتأثر ، أنتبه التمثيل الزائد أو الناقص لأي من المجموعتين سيؤدي إلى أنحراف نموذجك
3⃣ لا تعتمد على البيانات الداخلية لمنظمتك (بيانات العملاء) بل استخدم البيانات الخارجية مثل بيانات وسائل التواصل الاجتماعي، البيانات الخارجية ستوضح أسباب تذبذب البيع أو الاستحواذ، أنتبه من بناء مجموعة التدريب الخاصة بك من مصادر خاطئة والتي قد تتسبب في بناء نموذج مضلل وغير دقيق
4⃣ أختر العينة بدقة ، يجب أن يكون لديك استراتيجية واضحة لأخذ العينات ، قد يكون لديك منصة تحليلات قوية تمكنك من تدريب نماذجك ، ولكن اختيارك للعينة خاطيء (إما في التمثيل أو في الحجم) وبالتالي يقودك إلى نماذج ضعيفة و نتائج غير دقيقة
5⃣ التأكد من صحة النموذج الذي طورته مهم جداً ، لذلك أحرص على عزل مجموعة بسيطة من البيانات الحقيقية لتختبر بها أداء نموذجك (holdout sample) ، يجب أن تحرص على أن تكون بيانات التدريب وبيانات الاختبار حديثة وتمثل الواقع الحالي، الاعتماد على بيانات قديمة يقود الى بناء نماذج غير دقيقة
6⃣ يجب أن يكون لديك الصبر الكافي لاختبار نماذج عدة ، يجب أن تتعود على رمي النماذج (throwaway modelling) ، هذا السلوك يحتاج الكثير من الوقت و الجهد لتحديد أفضل النماذج من مجموعة واسعة من المتغيرات المستقلة ، هي عملية مضنية ومملة ولكنها تساعد كثيراً في بناء نموذج عملي بأداء جيد
7⃣ قم بتحديث نموذجك بانتظام، إذا كنت تعتقد أن النموذج الذي أنشأته للتو سيتناسب دائمًا مع بيانات العالم الحقيقي بشكل مثالي فأنت واهم! ، غالباً ما تتآكل جودة النماذج مع الوقت وذلك لتقادم البيانات التي بٌني عليها النموذج وللتغيرات في الواقع ، لذلك يجب أن تتغذى النماذج ببيانات آنية
8⃣ تأكد من أن النتائج التي توصلت لها ذات مغزى للآخرين، اجعل نتائجك واضحة يسهل الوصول إليها واستخدامها، قد يكون النموذج الأنيق الذي أنشأته معقدًا للغاية، لذا يجب أن تساعد المستهدفين في فهم واستخدام البصيرة التي اكتسبتها من البيانات ، لا تتكلم بلغة إحصائية بل لتكن لغتك لغة أعمال
9⃣ يجب أن يتم نشر النموذج الذي طورته وان يستخدم في بيئة العمل (إقناع متخذ القرار بجدوى تطبيقه) ، استخدام النموذج بالتوازي مع الطرق التقليدية القديمة سيساعد في رؤية نتائج مخاطر تذبذب البيع على سبيل المثال، أنتبه إذا لم تتأكد من نشر نماذجك، فلن تكون قادرًا أبدًا على إظهار قوة عملك
جاري تحميل الاقتراحات...