يصعب على الكثير من المبتدئين في علم البيانات التفرقة بين عدة مصطلحات مثل تنقيب البيانات ، تعلم الالة وإلى آخره ، اليوم سيكون محور حديثنا عن الفرق بين علم البيانات والتنقيب عن البيانات.
#datamining #DataScience #SaudiArabia
#تنقيب_البيانات #علم_البيانات #تحليل_البيانات
#datamining #DataScience #SaudiArabia
#تنقيب_البيانات #علم_البيانات #تحليل_البيانات
ولنبدأ بتعريف التنقيب عن البيانات (Data Mining) :
التنقيب عن البيانات أو مايعرف باكتشاف المعرفة في قواعد البيانات (knowledge discovery in databases)
عبارة عن مجموعة من الأساليب المختلفة لتمييز العلاقات والأنماط التي لم تكن معروفة من قبل.
التنقيب عن البيانات أو مايعرف باكتشاف المعرفة في قواعد البيانات (knowledge discovery in databases)
عبارة عن مجموعة من الأساليب المختلفة لتمييز العلاقات والأنماط التي لم تكن معروفة من قبل.
لتوضيح الأمر بشكل أكثر بساطة ، التنقيب عن البيانات هو عملية يستخدمها علماء البيانات وعشاق التعلم الآلي لتحويل مجموعات كبيرة من البيانات إلى شيء ذات قابليه أكبر للإستخدام.
تاليا علم البيانات :
وكما ذكرنا سابقا علم البيانات هو مجال يشمل كل ما يرتبط بتنقية البيانات وإعدادها وتحليلها. يجمع علم البيانات بين البرمجة والتفكير المنطقي والرياضيات والإحصاء.
وكما ذكرنا سابقا علم البيانات هو مجال يشمل كل ما يرتبط بتنقية البيانات وإعدادها وتحليلها. يجمع علم البيانات بين البرمجة والتفكير المنطقي والرياضيات والإحصاء.
ماهو الفرق بينهما ؟
١. يركز علم البيانات بشكل أكبر على القدرات الفنية للتعامل مع أي نوع من البيانات. على عكس التنقيب عن البيانات فهو مسؤول عن تقييم تأثير البيانات في منتج أو مؤسسة معينة.
١. يركز علم البيانات بشكل أكبر على القدرات الفنية للتعامل مع أي نوع من البيانات. على عكس التنقيب عن البيانات فهو مسؤول عن تقييم تأثير البيانات في منتج أو مؤسسة معينة.
٢. يمكن لأي شخص لديه معرفة بالتنقل عبر البيانات والفهم الإحصائي إجراء التنقيب في البيانات. بينما في علم البيانات يحتاج الشخص إلى معرفة جيدة بالمجال مثل فهم تقنيات التعلم الآلي ، والبرمجة ، وطرق عرض البيانات إلى آخره.
٣. يتعامل التنقيب عن البيانات مع البيانات المهيكلة في الغالب (structured data). في حين يتعامل علم البيانات مع جميع أشكال البيانات - المهيكلة( structured data)
وشبه المهيكلة( semi-structured data)
وغير المهيكلة ( unstructured data).
وشبه المهيكلة( semi-structured data)
وغير المهيكلة ( unstructured data).
جاري تحميل الاقتراحات...