بعبارة بسيطة ، فإن وظيفة عالم البيانات هي تحليل البيانات للحصول على رؤى عملية.
وتشمل المهام المحددة ما يلي:
تحديد مشاكل تحليل البيانات التي تتيح أكبر الفرص للمنظمة
تحديد مجموعات البيانات الصحيحة والمتغيرات
جمع مجموعات كبيرة من البيانات المنظمة وغير المنظمة من مصادر متباينة
تحديد مشاكل تحليل البيانات التي تتيح أكبر الفرص للمنظمة
تحديد مجموعات البيانات الصحيحة والمتغيرات
جمع مجموعات كبيرة من البيانات المنظمة وغير المنظمة من مصادر متباينة
- تنظيف البيانات والتحقق منها لضمان الدقة والاكتمال والتوحيد
وضع وتطبيق نماذج وخوارزميات لتنقيب مخازن البيانات الكبيرة
تحليل البيانات لتحديد الأنماط والاتجاهات
تفسير البيانات لاكتشاف الحلول والفرص
إبلاغ أصحاب المصلحة بالنتائج باستخدام التصور والوسائل الأخرى
وضع وتطبيق نماذج وخوارزميات لتنقيب مخازن البيانات الكبيرة
تحليل البيانات لتحديد الأنماط والاتجاهات
تفسير البيانات لاكتشاف الحلول والفرص
إبلاغ أصحاب المصلحة بالنتائج باستخدام التصور والوسائل الأخرى
في كتاب "ممارسة علم البيانات" practice Data Science ، يصف المؤلفون واجبات عالم البيانات بهذه الطريقة:
"وبشكل أعم ، عالم البيانات هو شخص يعرف كيفية استخلاص المعنى من البيانات وتفسيرها ، وهو ما يتطلب الأدوات والأساليب من الإحصاءات والتعلم الآلي ، فضلا عن كونه الإنسان. انها تقضي الكثير من الوقت في عملية جمع ، تنظيف ، واستغلال البيانات
لأن البيانات ليست نظيفة أبدا. وتتطلب هذه العملية الثبات ، والإحصاءات ، والمهارات الهندسية البرامجية ــ المهارات الضرورية أيضاً لفهم التحيزات في البيانات.
بمجرد أن تحصل على البيانات في الشكل ، جزء حاسم هو تحليل البيانات الاستكشافية ، التي تجمع بين الرؤية وحس البيانات. سوف تجد الأنماط ، وبناء النماذج ، والخوارزميات - بعضها بنية فهم استخدام المنتج والصحة العامة للمنتج
والبعض الآخر لتكون نماذج أولية التي في نهاية المطاف يتم خبزها مرة أخرى في المنتج. قد تقوم بتصميم التجارب وهي جزء حاسم في صنع القرار القائم على البيانات. ستتواصل مع أعضاء الفريق ، المهندسين والقيادة بلغة واضحة
وبتصورات البيانات حتى وإن لم تكن زميلاتها مغمورات في البيانات أنفسهن ، فإنهن يفهمن الآثار ".
ما الذي يصنع عالم بيانات جيد ؟
يتطلب علماء البيانات معرفة بالرياضيات أو الإحصاءات. والفضول الطبيعي مهم أيضا ، وكذلك التفكير الإبداعي والنقدي. ماذا يمكنك أن تفعل بكل هذه البيانات ؟ ما هي الفرص غير المكتشفة المخفية في الداخل ؟
يتطلب علماء البيانات معرفة بالرياضيات أو الإحصاءات. والفضول الطبيعي مهم أيضا ، وكذلك التفكير الإبداعي والنقدي. ماذا يمكنك أن تفعل بكل هذه البيانات ؟ ما هي الفرص غير المكتشفة المخفية في الداخل ؟
يجب أن يكون لديك موهبة لربط النقاط والرغبة في البحث عن الإجابات على الأسئلة التي لم يتم طرحها حتى الآن إذا كنت تريد تحقيق الإمكانات الكاملة للبيانات.
تحتاج أيضا إلى بعض الخلفية في برمجة الكمبيوتر حتى تتمكن من ابتكار النماذج والخوارزميات اللازمة لاستخراج مخازن البيانات الكبيرة. بيثون وR اثنين من بيئات البرمجة الرئيسية لعلم البيانات.
لابد وانك ملم بسير أعمال. ومن المهم أن يكون هناك رئيس لاستراتيجية الأعمال. على الرغم من أنك يمكن أن تعمل مع أخصائيي بيانات آخرين أو حتى مع فريق متعدد التخصصات من المهنيين
فلن تعمل.
أن تكون ناجحا إذا كنت لا تستطيع ابتكار أساليبك الخاصة وبناء الهياكل الأساسية الخاصة بك لتقطيع ونرد البيانات التي ستقودك إلى اكتشافاتك الجديدة والرؤى الجديدة للمستقبل.
أن تكون ناجحا إذا كنت لا تستطيع ابتكار أساليبك الخاصة وبناء الهياكل الأساسية الخاصة بك لتقطيع ونرد البيانات التي ستقودك إلى اكتشافاتك الجديدة والرؤى الجديدة للمستقبل.
وعليكم أيضا أن تكونوا قادرين على إيصال الأفكار المعقدة إلى أصحاب المصلحة غير المتخصصين في المجال التقني بطريقة يمكنهم فهمها بسهولة. أدوات برمجيات علم البيانات يمكن أن تساعدك في تصور النتائج ، ولكن سوف تحتاج أيضا إلى مهارات الاتصال اللفظي لسرد القصة بوضوح.
جاري تحميل الاقتراحات...