حمود الدوسري
حمود الدوسري

@Dr_Hmood

12 تغريدة 260 قراءة Nov 05, 2019
إن كانت جوجل هي بوابة الدخول للإنترنت فإن لغة Python هي بوابة الدخول لـ #علم_البيانات
بايثون الأداة الأكثر استخداماً لـ 3 سنوات متتالية، بعكس R المتخصصة في البيانات فإن Python لغة برمجة عامة
بالأسفل سأشرح الطريقة الصحيحة لتعلم بايثون لعلم البيانات المصدر:kdnuggets.com
يبدأ البعض في تعلم بايثون من خلال دورات برمجة مخصصة للمطورين، وهذا خطأ وفيه ضياع للوقت والجهد!
في مجال علم البيانات تستخدم لغة بايثون لسحب البيانات وجمعها وتنظيفها وتصويرها وبناء نماذج، وليس لتطوير تطبيقات البرمجيات، لذا يجب أن يركز الجهد على أداء تلك المهام من خلال تعلم المكتبات
يعتبر Jupyter Notebook بيئة برمجة قوية لتطوير مشاريع #علم_البيانات، وأبسط طريقة للعمل على تلك البيئة على جهاز الكمبيوتر تكون من خلال تثبيت Anaconda والطريقة على الرابط:
medium.com
وهنا مقطع يشرح تثبيته على الوندوز:
youtube.com
تحتاج في البداية تعلم أساسيات لغة بايثون حتى تتأقلم مع طريقة كتابة الكود بهذه اللغة من ناحية المتغيرات والجمل الشرطية وجمل التكرار، هنا تمارين جميلة وبسيطة يقدمها موقع: w3schools.com
الخطوة الثانية تعلم العمل مع مكتبة Numpy التي تدعم التعامل مع الأرقام وخصوصاً المصفوفات متعددة الأبعاد التي تحتاجها معظم لغات تعلم الآلة
بعد ذلك ننتقل لتعلم العمل مع مكتبة Pandas الأكثر شعبية في معالجة البيانات، والتي تساعد عالم البيانات في تنظيف البيانات وتجهيزها، هذه المكتبة أمتداد لمكتبة Numpy، وهذا الكتاب سيساعدك في معرفة طريقة العمل مع هذه المكتبتين:
amazon.com
بعد تجهيز البيانات سنحتاج إلى تصويرها (Visualization) وهذا دور مكتبة Matplotlib التي تساعدنا في إنشاء رسوم بيانية، وهناك ايضاً مكتبة Pandas Seaborn ولكن ينصح في هذه المرحلة التركيز على Matplotlib ، عمل هذه المكتبات مشابه لعمل برامج وأدوات تصوير البيانات مثل Tableau و Power BI
يتعامل علماء البيانات مع البيانات باستخدام كل من SQL و Pandas، بعض المهام يسهل تنفيذها باستخدام SQL والبعض الآخر نحتاج Panadas، يمكن العمل بهما معاً عن طريق تثبيت قاعدة بيانات SQLite لتخزين ملف CVS فيها ومعالجته باستخدام بايثون و SQL، شرح الطريقة على: medium.com
تعلم أساسيات الإحصاء مهم قبل بناء نماذج باستخدام خوارزميات #تعلم_الآلة ، StatsModels هي أحد مكتبات بايثون شائعة الاستخاد لبناء نماذج إحصائية
موقع دروس تعليمية لشرح طريقة تنفيذ المفاهيم الإحصائية باستخدام Python: statsmodels.org
وهنا مقطع فيديو: youtube.com
أخيراً لبناء نماذج نستخدم مكتبة Scikit-Learn الأكثر شعبية في بايثون، هذه المكتبة تساعد في تنفيذ العديد من خوارزميات #تعلم_الآلة الأكثر شيوعاً
مقطع فيديو لشرح العمل على هذه المكتبة: youtube.com
وهنا رابط لكتاب: amazon.com
@Salothman1991 المستهدف من تغريداتي المتخصصين (أو من يريد التخصص) في #علم_البيانات ، الغير متخصصين خيار تعلم الأدوات الجاهزة لتحليل البيانات أفضل وأسهل بالنسبة لهم
تعيش Python في قلب #علم_البيانات ، هل تعلم أنه في عام 2018م ذكر 66% من علماء البيانات أنهم يستخدمون لغة بايثون بشكل يومي!
مقال يختصر لك الكثير من المسافات في تعلم هذه اللغة:
towardsdatascience.com

جاري تحميل الاقتراحات...