ما هو تعريف التنقيب عن البيانات؟
هناك عدة تعاريف لكن التعريف الشامل هو (مجال يجمع عدة تقنيات من عدة تخصصات مثل تعليم الآلة، الإحصاء، التعرف على الأنماط، قواعد البيانات والإظهار المرئي بهدف استخراج المعلومات من مستودعات وأماكن تخزين البيانات الضخمة)
هناك عدة تعاريف لكن التعريف الشامل هو (مجال يجمع عدة تقنيات من عدة تخصصات مثل تعليم الآلة، الإحصاء، التعرف على الأنماط، قواعد البيانات والإظهار المرئي بهدف استخراج المعلومات من مستودعات وأماكن تخزين البيانات الضخمة)
تنقيب البينات جامع لعدة تخصصات
•Statistics
•Database
•Machine Learning
•math
وغيرها من التخصصات
•Statistics
•Database
•Machine Learning
•math
وغيرها من التخصصات
1.تنظيف البيانات:
هي المرحلة الأولى وتكون على تنظيف البيانات من القيم الخالية (null value) وبعض البيانات التي يكون يها أخطاء
هي المرحلة الأولى وتكون على تنظيف البيانات من القيم الخالية (null value) وبعض البيانات التي يكون يها أخطاء
2.المرحلة الثانية :
و تكون عبارة عن دمج البيانات بعد ما تم تنظيفها
و الدمج يكون في حال كانت من اكثر من مصدر واحد
و تكون عبارة عن دمج البيانات بعد ما تم تنظيفها
و الدمج يكون في حال كانت من اكثر من مصدر واحد
3.اختيار البيانات :
في هذه المرحلة يتم اختيار البيانات المهمة في عملية التنقيب ، ويتم استبعاد البيانات الغير مهمة، المُكررة والتي ليس لها علاقة .
البيانات المكررة و البيانات التي ليس لها قيمة تؤثر بشكل كبير على عملية التنقيب
في هذه المرحلة يتم اختيار البيانات المهمة في عملية التنقيب ، ويتم استبعاد البيانات الغير مهمة، المُكررة والتي ليس لها علاقة .
البيانات المكررة و البيانات التي ليس لها قيمة تؤثر بشكل كبير على عملية التنقيب
4.تحويل البيانات:
و هي المرحلة الرابعة و نقوم في هذه المرحلة بتحويل البيانات او قيمتها لكي تكون مناسبة للخوارزمية المتبعة في
تنقيب البينات
من الممكن أن تكون الخوارزمية تستخدم فقط الأرقام و في هذي الحالة نقوم بتحويل البيانات الى أرقام
و هي المرحلة الرابعة و نقوم في هذه المرحلة بتحويل البيانات او قيمتها لكي تكون مناسبة للخوارزمية المتبعة في
تنقيب البينات
من الممكن أن تكون الخوارزمية تستخدم فقط الأرقام و في هذي الحالة نقوم بتحويل البيانات الى أرقام
5.تنقيب البيانات:
و هي المرحلة الخامسة و تكون من خلال استخدام خوارزميات معينة في التنقيب عن البيانات و من خلالها نكون قادرين على اننا نستخرج المعلومات التي من خلالها تتم عملية اتخاذ القرار
و هي المرحلة الخامسة و تكون من خلال استخدام خوارزميات معينة في التنقيب عن البيانات و من خلالها نكون قادرين على اننا نستخرج المعلومات التي من خلالها تتم عملية اتخاذ القرار
بعض الأمثلة على الخوارزميات المستخدمة في التنقيب
(Statistical Procedure Based Approach، ID3 Algorithm, Neural Network)
(Statistical Procedure Based Approach، ID3 Algorithm, Neural Network)
6. المعرفة و التصوير:
وهي تقديم المعرفة و تصويرها على شكل رسم بياني و تقديمها للمسؤول او العميل و تساعدهم على فهم نتائج البيانات .
وهي تقديم المعرفة و تصويرها على شكل رسم بياني و تقديمها للمسؤول او العميل و تساعدهم على فهم نتائج البيانات .
وهذه بعض الأمثلة للأدوات التي تستخدم في التنقيب عن البيانات
•Oracle Data Mining
•Rapid Miner
•Python
•R
•Hadoop
•Rattle
•Weka
•SQL Server Data Tools
•SAS Data Mining
•Xplenty
•Oracle Data Mining
•Rapid Miner
•Python
•R
•Hadoop
•Rattle
•Weka
•SQL Server Data Tools
•SAS Data Mining
•Xplenty
كتابة الطالب ابراهيم يحيى اليحيى @1ibrahimAlyahya
جاري تحميل الاقتراحات...