Muhammad Gad
Muhammad Gad

@Muhammadgad99

20 تغريدة 65 قراءة Jul 01, 2023
Thread
في اكتر من ٥ سألوني على Curiouscat على تجربة الانترفيو في تراك Data science وتراكData management في iti منحة ال ٩ شهور
انا متقبلتش فيها بس اترشحت بعدها لمنحة ٤ شهور
وبما ان لسا شهر والتقديم يفتح فانا هحكي تجربتي سريعًا وبرضو اتسألت في ايه وكدة لعل حد منكم يستفيد
-1-
وفي الآخر iti دي محتاجة توفيق كتير عشان تتقبل فيها بس اهو تعمل اللي عليك وخلاص
مبدئياً الانترفيو بتاعي كان ٥٠ دقيقة تقريباً وده مش العادي والمفروض لما الانترفيو بيطول اوي كدة معناها اني أديت كويس وهما بيزودوا لكن في ناس مكملتش جوا ربع ساعة ونص ساعة
-2-
عشان تقدم في Data science انت محتاج تكون عارف
Database+SQL
Statistics + Machine learning
Data warehouse fundamentals
وأصلا تكون عارف يعني ايه Data science ومقدم ليه وهتشتغل ايه وكل الكلام اللطيف ده
يعني متبقاش مذاكر الحاجات دي ومش عارف ال Data scientist بيشتغل ايه في يومه
-3-
اول حاجة انت بتروح المعهد حسب معاد محدد هما محددينه مسبقًا فدي اول نصيحة ليك اخرج بدري جدا واوصل قبلها بنص ساعة عالأقل خاصة لو جاي من سفر زيي عشان دي اول غلطة انا وقعت فيها
-4-
كنت واخد Swvl ومنها لله العربية عطلت بينا مرتين في الطريق وانا معادي كان ٩ دخلت المعهد الساعة ٩ بالثانية لبست البدلة تحت وطلعت تعبان من الحر ولسا هستريح شوية لقيتهم بيندهوا اسمي وانا داخل عشان اروح ال HR Interview
فروح بدري عشان ترتاح شوية من الطريق وتبقى جاهز نفسيًا كدة
-5-
دخلت التيكنيكال انترفيو ولقيت ٣ هيعملوا معايا الانترفيو
طبعًا الاول اتسألت عن اسمي وخريج ايه ؟ بتعمل كارير شيفت ليه؟وهل اخدت اي شهادات أو كورسات في المجال ؟ طب هي ايه ؟
فمهم تكون محضر الكورسات اللي خدتها وانت رايح عشان بيكتبوها وراك ومعرفش عليها weight في القبول ولا لا
-6-
وبدأ الانترفيو الأول
ال Database + SQL كانوا نص الانترفيو حرفيًا وتوقعي لأني كنت مقدم Data management كمان مع ال Data science
اول سؤال يعني ايه index في الداتابيز؟
بنستخدمه ليه وامتى؟ الفرق بين Clusterd vs non Clusterd وفي الآخر اديتني مثال لTable فيه Nulls كتير وقالتلي
-7-
تفتكر الاحسن نعملهIndex ولا لا؟
بعدين اتسألت في حاجات كتير في Database fundamentals وال SQL
زي يعني ايه Prime attribute ويعني ايه strong entity و Weak entity
انواع ال Relationships في ال ERD
اتسألت في ال Mapping ودي كانت مفاجاة بالنسبة ليا بس كنت مذاكره
-8-
ايه هو ال VIEW وبيتخزن فين وفوائده ايه واضراره ايه
يعني ايه DBMS وRDBMS وحاجات تانية كتير اوي مش فاكرها
بس بقا السر هنا كنت كل إجابة بقولها بتسأل عليها ليه؟
يعني حرفيا انت لو حافظ مش فاهم هتقع كتير لأن كل حاجة هتتسأل عليها ليه؟ وكذا مرة كمان لحد ما يشوفوا انت فاهم لحد فين.
-9-
دخلنا في ال SQL طلبت مني اكتب 2 queries على ورق بالقلم
الاتنين كان فيهم GROUP BY ومش صعبين خالص لو حليت SQL قبل كدة
وبدأت أسئلة بقا نظري كتير
زي الفرق بين DROP DELETE TRUNCATE وحرفيا هنا انا كل ما اقول فرق كانت تسألني ليه؟ والحمدلله انا كنت فاهم برضو مش حافظ فكنت بسد معاها
-10-
ايه هو ال View زي ما وضحت فوق وكدة
اتسألت في ال Log files ودي كانت حاجة غريبة جدًا بس ممكن عشان انا اللي جبت سيرتها في الكلام فعشان كدة بقولك مهم قبل ما تقول حاجة تكون فاهمها
اتسألت في طريقة تنفيذ ال SQL يعني ترتيب الخطوات اللي ال Engine بينفذه بيها
الفرق بين WHERE VS HAVING
-11-
وحاجات كتير مش فاكرها بصراحة في ال SQL ونص الأسئلة كانت بتيجي من كلمة ليه؟
بعد كدة بدأنا Statistics
الاول فتحتلي ملف اكسيل فيه داتاسيت كدة وقالتلي هسيبك ٣ دقايق وقولي خرجت منها insights ايه واشرحلي اللي فهمته من الداتا
-12-
هنا كان في Missing data كتير ممكن تتعامل معاهم لو عاوز، ممكن تروح تحسب Correlation بين 2 variables مثلاً أو ممكن تتفحصها بعينك ونشوف هتقدر تطلع ايه
ايه الفرق بين Mean vs median
يعني ايه Median ويعني ايه Standard deviation وليهn - 1 ويعني ايه Variance
-13-
ايه هي Sampling methods والفروق بينهم
ازاي نتعامل مع ال Missing data والoutliers
يعني ايه Box plot وبيترسم ازاي وبتستفيد منه ايه أصلاً؟
وبرضو ده اللي فاكره عشان مش فاكر الباقي اوي بس انا حظي كان جلو مكنتش مذاكر Inferential ومتسألتش فيها خالص بس ناس كتير اتسألت فيها عادي
-14-
بعد كدة رحنا لل Machine learning
اتسألت عن ال Decision tree ومميزاته وعيوبه ايه وليه نستخدمه وليه منستخدموش
طب ايه الفرق بينه وبين ال Random Forrest ومين افضل
يعني ايه Confusion matrix ويعني ايه Accuracy و F1 و Recall و Precision وحاجات كتير جواهم بس مش فاكر تفاصيل كتير
-15-
بعد كدة رحنا لل Big data
يعني ايه big data وال 5 V's وأشرح كل واحدة منهم مع مثال
ايه ال Tools اللي بنتعامل بيها في البيج داتا بس متعمقناش في التولز دي بس مهم اووي تذاكرها حلو لو انت مقدم Data management عشان هتتسأل فيها
-16-
بعد كدة رحنا لل Data warehouse
ايه هي ال DWH والفرق بينها وبين ال Database
الصفات والخصائص بتاعت ال DWH
الفرق بين Star vs Snowflake والفرق بين FactsوالDimensions واديني مثال على كل واحدة منهم ميكونش فيه اي فلوس خالص ولا sales 😂
يعني ايه Slowly change dimension وتعرف عنه ايه
-17-
وسؤال بقا لو عندنا Customer في الداتاويرهاوس وعمل عملية شراء وهو كان ساكن في المنصورة
بعدين نقل وعاش في القاهرة، هنعمل ايه في العنوان الجديد ده في الداتاويرهاوس والداتابيز
يعني ايه Operational Data store ؟ بنستفيد منها ايه ؟
-18-
وفي الآخر خالص سؤالين مش تينكيال بالانجليزي
عملت كارير شفت ليه
وايه اكتر إنجاز فخور بيه في حياتك
مهم جدا جدا تكون عارف مين هو ال Data scientist وال Data engineer وبيعملوا ايه في يومهم في الشغل
انا اتسألت كتير ليه انت عاوز تبقى ده او ده ؟
-19-
وطالما عاوز تبقى حد منهم ليه عاوز تبقى التاني؟
الأسئلة دي مهمة واعتقد هي اللي وقعتني شوية
انا سردت اكتر من 60% من اللي اتسألت فيه بس انا فاكر كان في اسئلة كتير في التفاصيل ورا كل حاجة جاوبتها
ومهم جدا أنوه ان مش كل الناس اتسألت في كل ال Topics اللي ذكرتها
والموضوع في الاخر توفيق.

جاري تحميل الاقتراحات...