سُميت هذه الخوارزمية بـ Forest لانها تعتمد على بناء أكثر من شجرة مما يشكل "غابة" من الأشجار كلما كانت الأشجار أكثر كلما كانت دقة التنبؤ أعلى ، ومصطلح Random يعني أن بناء كل شجرة يتم بشكل عشوائي على مستوى الخصائص و البيانات المستخدمة في بناء الشجرة
قوة الـ Random Forest مستمدة من استخدام أكثر من Model وهذا ماجعلها تُصنف على أنها Ensemble Algorithm ، هذا الشيء جعلها تتفادى مشكلة الـ over-fitting التي تعاني منها خوارزمية الـ Decision Tree التي تعتمد على رأي شجرة واحدة فقط ، بعكس الـ Random Forest التي تستعين برأي أكثر من شجرة
تبني رأيها النهائي بشكل ديمقراطي ، تُعطي كل شجرة نتيجة التنبؤ ، في التنبؤ الرقمي تكون النتيجة النهائية بأخذ المتوسط (درجة الحرارة)، وفي التنبؤ التصنيفي تكون بالتصويت (مثلاً الجو مشمس 7 ، غائم 3) تكون نتيجة التنبؤ مشمس
تم إستخدام الـ Random Forest بنجاح في التطبيقات البنكية لمعرفة العملاء المخلصين، في القطاع الصحي لتحديد مكونات الدواء،مع الأسهم في القطاع المالي،وكذلك في التجارةالالكترونيةمع نظام التوصيةلمعرفة إن كان العملاء راضين عن التوصيات التي وصلتهم،وكذلك استخدمتها مايكروسوفت في تصنيف الصور
من أبرز خصائصها أنها تعطي نتائج جيدة حتى لو كانت نسبة القيم المفقودة في البيانات عالية ، وكذلك تعمل مع الخصائص الكثيرة (curse of dimensionality) ، وتستخدم في الـ Features Selection ، ولكن يلاحظ أنها تعطي نتائج أفضل للتنبؤ بالقيم التي من نوع Categorical أكثر من نوع Continuous
هنا مقال يشرح الـ Random Forest بطريقة مفصلة: goo.gl
وهنا مقطع فيديو رائع يشرح هذه الخوارزمية بشكل مبسط: youtube.com
وهنا مقطع فيديو رائع يشرح هذه الخوارزمية بشكل مبسط: youtube.com
جاري تحميل الاقتراحات...