حمود الدوسري
حمود الدوسري

@Dr_Hmood

16 تغريدة 109 قراءة Sep 08, 2019
جوما عالم بيانات عمل في أربع شركات تقنية عملاقة (Google،Apple،Facebook ، Amazon) ، يتحدث عن #علم_البيانات في مقطع فيديو قصير:
ماهو علم البيانات؟
ما عمل عالم البيانات؟
مراحل علم البيانات؟
مسميات وظائف علم البيانات؟
متوفرة في الرابط .. وألخصها أسفل التغريدة
youtube.com
❌ علم البيانات ليس بناء نماذج معقدة
❌ علم البيانات ليس تصميم وتطوير لوحات معلومات
❌ علم البيانات ليس برمجة و كتابة أكواد
✔️ علم البيانات هو استخدام البيانات لإحداث أثر إيجابي في بيئة العمل (منتج جديد – توصية – رؤية)
#علم_البيانات
الوظيفة الرئيسية لعالم البيانات حل مشاكل الشركة باستخدام البيانات ، الشركات تركز بشكل كبير على استخدام البيانات في تحسين أعمالها و منتجاتها
Data scientist is not a "Data Cruncher", but a Problem Solver
#علم_البيانات
عالم البيانات المميز لا يٌقاس بقدرته على بناء نماذج معقدة ، و إنما بالأثر الذي يُحدثه في بيئة عمله باستخدام البيانات ، عالم البيانات ليست وظيفته إجراء عمليات على البيانات ، وإنما "حل مشاكل" .. الشركات يطلبون من عالم البيانات حل مشاكلهم ويتوقعون منه قيادتهم للطريق الصحيح
تاريخ #علم_البيانات :
التنقيب في البيانات Data Mining بدأ في التسعينات الميلادية ، تم نشر ورقة في عام 1996 بعنوان "من التنقيب في البيانات إلى اكتشاف المعلومات في قواعد البيانات" ، تم تعريف إكتشاف المعارف Knowledge Discovery بأنه الإجراءات التي تهدف لاكتشاف المعارف من البيانات
في عام 2001م أحدث William S. Cleveland نقلة نوعية للتنقيب في البيانات عن طريق دمجها مع علوم الحاسب: Computer Science + Data Mining ليخرج مانُطلق عليه اليوم #علم_البيانات (Data Science)
نفس الفترة شهدت ظهور الـ Web 2.0 والتي توالى فيه ظهور منصات الشبكات الإجتماعية والتي حولت المستخدمين من مجرد متلقين للمعلومة إلى منتجين لها:
2003: myspace
2004: Facebook
2005: YouTube
2006: Twitter
الـ Web 2.0 أدى إلى ثورة في البيانات (Data Revaluation) ، بيانات كثيرة وسريعة ومتعددة الأشكال ، أُطلق عليها ما يسمى بالـ #البيانات_الضخمة Big Data والتي أدت إلى تطوير أدوات معينة للتعامل معها مثل Hadoop و Spark
الصعود الهائل للاهتمام بالبيانات الضخمة في 2010م أدى إلى زيادة الاهتمام بعلم البيانات لدعم احتياجات الشركات والمؤسسات في استخراج المعارف والعلوم التي تساعدهم في تحسين أعمالهم من خلال تحليل #البيانات_الضخمة
مع توفر هذا الكم الهائل من البيانات أصبح من الممكن تدريب الآلة على التعلم من خلال البيانات ، لذا خرج لنا ما يسمى بـ #التعلم_العميق (Deep Learning) والذي لم يعد حكراً على المعامل والأبحاث ، وإنما أصبح واقعاً ملموساً في حياتنا اليومية ومن خلال أخباره المتصاعدة في وسائل الإعلام
الـ ML و AI أصبحت تقود تطبيقات علم البيانات، وأصبح الناس يعتقدون أن عمل علماء البيانات هو العمل على تطوير خوارزميات ML و تطبيقات AI في مراكز الأبحاث ، ولكن الواقع مختلف!.. الشركات توظف علماء البيانات للتحليل و للعمل على تحسين أعمالهم بطرق قد لا تتطلب بناء نماذج متقدمة باستخدام ML
هرم #علم_البيانات كما يوضح الشكل المرفق يتكون من ست مستويات ويعمل فيه ما يقارب 6 موظفين بمسميات مختلفة ، المسميات والمهام تعتمد على حجم الشركة ، شركة ناشئة أو متوسطة أو كبيرة ، التفصيل بالأسفل
المستوى الأول: جمع البيانات
المستوى الثاني: نقل ودمج البيانات من مصادر عديدة
المستوى الثالث: تنظيف وإعداد البيانات
المستوى الرابع: تحليل البيانات Dashboards
المستوى الخامس: بناء نماذج بسيطة من البيانات ML
المستوى السادس: بناء نماذج متقدمة DL و AI
في الشركات الناشئة الموارد قليلة والمهام كثيرة ومتنوعة لذا فإن عالم البيانات يعمل في كل المستويات ما عدا المستوى السادس كون الشركات الناشئة لا تحتاجه ، فنجده يجمع البيانات ، ينظفها ، يبني نموذج يكتب أكواد ، يصمم لوحة معلومات
في الشركات المتوسطة الموارد جيدة ، لذا يوظفون أكثر من شخص للعمل على البيانات ، هناك #مهندس_برمجيات يعمل في المستوى الأول ، و #مهندس_بيانات في المستوى الثاني والثالث ، و #عالم_بيانات في الرابع والخامس ، وقد لا يحتاجون للمستوى السادس
أما في الشركات الكبيرة ، الموارد كثيرة والمهام كثيرة ومعقدة ، لذا التوظيف في مجال البيانات عالي بمسميات مختلفة ، هناك مهندس برمجيات للمستوى الأول ، مهندس بيانات للمستوى الثاني والثالث ، علم بيانات للرابع والخامس ، وأكثر من شخص يعمل في المستوى السادس بمسمى #باحث أو #مهندس_تعلم_آلة

جاري تحميل الاقتراحات...