سؤال جميل: تحويل القيم من رقمية إلى فئوية أو العكس يحكمه نوع التحليل المستهدف ، في الدراسة نستهدف معرفة المهارات المطلوبة لسوق العمل ، وبالتالي من الأفضل تجميع الخبرات في فئات كل فئة مكونة من خبرات متقاربة (مثلاً من سنه إلى خمس سنوات) ، بالطريقة هذي نستطيع استخراج سمات هذه الفئة
تحويل القيم الفئوية إلى قيم رقمية يسمى (Encoding) وفي الغالب نحتاجه عند بناء نماذج باستخدام بعض الخوارزميات لأنها لا تقبل إلا قيم رقمية مثل خوارزمية SVM و LR ، وأحياناً قد نحتاج هذا التحويل بسبب طبيعة التحليل الذي نستهدفه
على سبيل المثال لو كان عندنا مجموعة من المتقدمين على وظيفة ربما نحتاج تحويل مؤهلاتهم إلى قيم رقمية (دبلوم 1 ، بكالوريوس 2 ، ماجستير 3 ، دكتوراه 4)، نلاحظ هنا أنه من السهولة التعرف على أن مؤهل البكالوريوس أعلى من الدبلوم ، لكن ربما ندخل في إشكالية تمثيل الفرق بين كل مؤهل والآخر!
بمعنى أن الترقيم السابق للمؤهلات رياضياً ربما يكون مضلل في موضوع الفروقات لأنه يعطي معاني ضمنية غير صحيحة، مثلاً الدكتوراه يعادل 4 أضعاف الدبلوم!
مثل هالاشكاليات نستطيع تلافيها بنوع التحليل المستهدف وحصره على العلاقات (أكبر ، أصغر ، يساوي) بدلاً من العمليات الرياضية (+ ، - ، ..)
مثل هالاشكاليات نستطيع تلافيها بنوع التحليل المستهدف وحصره على العلاقات (أكبر ، أصغر ، يساوي) بدلاً من العمليات الرياضية (+ ، - ، ..)
جاري تحميل الاقتراحات...