حمود الدوسري
حمود الدوسري

@Dr_Hmood

8 تغريدة 111 قراءة Feb 20, 2021
أسفل هذه التغريدة سأتكلم عن خوارزمية Random Forest ، خوارزمية سهلة الفهم ، ديمقراطية و قوية تعتمد على مبدأ فرق تسد (divide-and-conquer) وتتبنى نظرية التحالف (Ensemble) لبناء نتيجة تنبؤ أعلى دقة .. خرجت من رحم خوارزمية الـ Decision Tree وتفوقت عليها
سُميت هذه الخوارزمية بـ Forest لانها تعتمد على بناء أكثر من شجرة مما يشكل "غابة" من الأشجار كلما كانت الأشجار أكثر كلما كانت دقة التنبؤ أعلى ، ومصطلح Random يعني أن بناء كل شجرة يتم بشكل عشوائي على مستوى الخصائص و البيانات المستخدمة في بناء الشجرة
تستخدم الـ Random Forest في مهام الـ Regression (التنبؤ بالقيم الرقمية مثل درجة الحرارة) أو مهام الـ Classification (التنبؤ بالقيم الصنفية مثل الجو مشمس أو غائم) ، ويتم بناءها بنفس طريقة بناء خوارزمية الـ Decision Tree مما يجعلها سهلة الفهم .. مرفق خطوات بناء أشجار الغابة
قوة الـ Random Forest مستمدة من استخدام أكثر من Model وهذا ماجعلها تُصنف على أنها Ensemble Algorithm ، هذا الشيء جعلها تتفادى مشكلة الـ over-fitting التي تعاني منها خوارزمية الـ Decision Tree التي تعتمد على رأي شجرة واحدة فقط ، بعكس الـ Random Forest التي تستعين برأي أكثر من شجرة
تبني رأيها النهائي بشكل ديمقراطي ، تُعطي كل شجرة نتيجة التنبؤ ، في التنبؤ الرقمي تكون النتيجة النهائية بأخذ المتوسط (درجة الحرارة)، وفي التنبؤ التصنيفي تكون بالتصويت (مثلاً الجو مشمس 7 ، غائم 3) تكون نتيجة التنبؤ مشمس
تم إستخدام الـ Random Forest بنجاح في التطبيقات البنكية لمعرفة العملاء المخلصين، في القطاع الصحي لتحديد مكونات الدواء،مع الأسهم في القطاع المالي،وكذلك في التجارةالالكترونيةمع نظام التوصيةلمعرفة إن كان العملاء راضين عن التوصيات التي وصلتهم،وكذلك استخدمتها مايكروسوفت في تصنيف الصور
من أبرز خصائصها أنها تعطي نتائج جيدة حتى لو كانت نسبة القيم المفقودة في البيانات عالية ، وكذلك تعمل مع الخصائص الكثيرة (curse of dimensionality) ، وتستخدم في الـ Features Selection ، ولكن يلاحظ أنها تعطي نتائج أفضل للتنبؤ بالقيم التي من نوع Categorical أكثر من نوع Continuous
هنا مقال يشرح الـ Random Forest بطريقة مفصلة: goo.gl
وهنا مقطع فيديو رائع يشرح هذه الخوارزمية بشكل مبسط: youtube.com

جاري تحميل الاقتراحات...