سعيد شعبان
سعيد شعبان

@Saeed_SH23

12 تغريدة 18 قراءة May 21, 2023
الإنحدار الخطي البسيط Simpl Linear Regression
ما هو الإنحدار الخطي ؟
وما هي معادلة الإنحدار ؟
وكيف يعمل ؟
كيف تقوم ببناء النماذج ؟
كيف تعرف العلاقات بين المتغيرات ؟
ثريد مختصر يتحدث عن الإنحدار الخطي البسيط وبعض المفاهيم المرتبطة بعمليات التنبؤ والعلاقات بين المتغيرات
الإنحدار الخطي هو تقريب للعلاقة السببية بين متغيرين أو أكثر وتعتبر نماذج الإنحدار ذات قيمة عالية لأنها من أكثر الطرق شيوعا لعمل التنبؤات والإستدلالات .
ويقع الإنحدار الخطي البسيط عندما يكون متغير الإستجابة واحد فقط أو عند دراسة وتحليل أثر متغير على متغير آخر
تدور عملية الإنحدار الخطي كالتالي :
- الحصول علي البيانات المناسبة
بناء النموذج المناسب
عمل توقعات علي النموذج
في علم الآلة وبناء النماذج هناك متغيرين أساسيين لبناء أي نموذج انحدار خطي وهما
المتغير التابع - Independent Varible ويرمز له بحرف Y
المتغير المستقل Dependent Varible ويرمز له بحرف X
المتغير التابع هو الذي تحاول التنبؤ به دائما ، وعند استخدام تحليل الإنحدار نريد توقع قيمة Y بشرط أن تتوفر لدينا قيمة X
وللحصول علي انحدار يجب أن تعتمد Y علي X بطريقة سببية وعندما يكون هناك تغير في قيم X يجب أن يؤثر هذا التغيير في Y أيضا .
مثلا يعتمد الدخل الشهري من راتبك علي عدد سنوات التعليم وشهادات الخبرة والمؤهل الدراسي إذا قمنا بتطبيق هذه البيانات لتوقع الدخل الشهري الخاص بك وبناء نموذج انحدار خطي
فإن قيمة المتغير التابع Y هي التي نريد التنبؤ بها والتي تتمثل في راتبك الشهري
وقيمة المتغير المستقل X هي التي تحتوي علي تفاصيل الشهادات والخبرات والمؤهلات العلمية التي تؤدي الي زيادة دخلك الشهري
وإذا نظرت الي العلاقة بين المتغيرين ستجد أن هناك علاقة سببيسة بمعني أنه كلما زادات مؤهلاتك وخبراتك كلمان كان من المتوقع زيادة دخلك الشهري وهذا مفهوم العلاقة الإيجابية بين المتغيرات .
كيف تقوم بمقياس العلاقة بين المتغيرات ؟ Correlathionship varibles
في مكتبة Pandas تتوفر أدوات خاصة بالرسم البياني وإظهار العلاقة بين المتغيرات الفئوية والرقمية ، والحديث هنا عن توضيح العلاقة بين المتغيرات الرقمية وسنقوم باستخدام Scatter Plot مخطط الإنتشار ، والذي يوضح العلاقات عن طريق رسم خط مستقيم يربط بين متغيرين رقميين كما بالمثال .
مثلا عند العلاقة الإيجابية بين المتغيرات تزداد قيمة المتغير الأول كلما زادت قيمة المتغير الثاني
في هذا المثال من بيانات مبيعات السيارات المستعملة ببعض الدول يوضح العلاقة الإيجابية Possitive Correlation بين سعر السيارة والمحرك الخاص بها وتبين العلاقة أنه كلما زادت قوة محرك السيارة كلما ارتفع سعرها.
أما هذا المثال يوضح العلاقة السلبية Possitive Correlation بين المتغيرات وأنه كلما ازداد عدد الكيلو مترات التي قطعتها السيارة كلما انخفض سعرها.
يعتمد الإنحدار علي السببية ويدور حول كيفية تأثير أحد المتغيرات علي الآخر أو التغيرات التي يسببها الآخر ، كما أن وجود ارتباط بين عاملين أو متغيرين لا يعني أن أحدهما يسبب الاخر
وهنا معني أن الإرتبا لا يعني السببية
(Correlation does not imply causation)
الإرتباط يحدث عن ظاهرتين لهم علاقة ببعض مثلا الطول والوزن ، المشي والجوع ، أما السببية فتكون أحد المتغيرين مسببا للآخر يعني المتغير A تغير لأن المتغير B تغير أيضا .
معادلة الإنحدار الخطي Equition Linear Regressison .
خطوط الإنحدار الخطي دائما مستقيمة وهذه من سمات الإنحدار ، ولتحديد خط الإنحدار نحتاج إلي خاصيتين
التقاطع Intercept - هو قيمة Y عندما تكون X تساوي صفر
الميل Slope - الميل أو المنحدر هو شدة انحدار الخط ،
ويساوي مقدار زيادة Y إذا قمت بزيادة X بمقدار 1 .
ومعادة اللإنحدار كالتالي :
Y = Intercept + Slope * X
وتعني أن قيمة Y = التقاطع + الميل مضروبا في قيمة X
التنبؤ بالإنحدار Prediction
الفائدة الكبيرة من الإنحدار أن النماذج تسمح لك بعمل تنبؤات تتمتع بدرجة عالية من الدقة لأن الغرض في النهاية هو التنبؤ بمتغير الإستجابة الذي يكشف لنا مدي درجة الإعتماد علي النموذج في التنبؤ بشئ معين .
في هذا المثال سنعتمد علي نموذج إحصائي هام ومستخدم بكثرة مع نماذج الإنحدار الخطي وهو OLS -
ordinary least squares (OLS)
وهو نوع من الإنحدار شائع الإستخدام يأخذ وسيطين الأول متغير الإستجابة ، والثاني متغير التنبؤ ويبين لنا نموذج OLS مجموعة هامة من الإختصارات المفيدة جدا عند بناء نموذج الإنحدار مثل قيمة R-Squred والعديد من الخواص التي سنتطرق لشرحها فيما بعد بإذن الله
هذا المثال من بيانات أسعار المنازل في بعض بعض المناطق يوضح
المسافة بين المتاجر والمنازل
عدد المتاجر القريبة من المنزل
عمر المنزل بالسنوات
سعر المنزل
نريد التنبؤ هنا بأسعار المنازل بناء علي عدد المتاجر القريبة من كل منزل لذلك سيكون متغير الإستجابة Y هو سعر المنزل ومتغير التنبؤ X هو عدد المتاجر .
قبل التنبؤ بالنموذج نقوم أولا بعمل fit للنموذج باستخدام ols علي متغير التنبؤ والاستجابة ثم نحدد متغير الإستجابة Y ومتغير التنبو X .
بعدما قمنا بتحديد المتغيرات وعملية التنبؤ علي النموذج كانت النتيجة كالتالي .
التقاطع = 8.22
الإنحدار = 0.79
وهذا يعني أنه إذا قمت بزيادة عدد المتاجر القريبة لكل منزل ، فإن الزيادة المتوقعة في سعر المنزل ستكون
0.7981 للمتر .
وهنا يعتبر التقاطع موجبًا أيضًا وله ارتباط إيجابيًا ، حيث يزداد سعر المنزل أيضًا مع زيادة عدد المتاجر القريبة.
تصور التوقعات Visualizing predictions
يحتوي نموذج التنبؤ الذي قمنا بإنشائه على متغيرات التنبؤ والإستجابة هذا يعني أنه يمكنك رسمها على نفس مخطط الإنتشار Scatter Plot عن طريق تحديد المتغيرات وتمييز نقاط الإنحدار باللون الأحمر.
توضح الصورة مدي ملائمة خط الإنحدار للبيانات مع تمييز نقاط التوقع مع ملاحظة أن التوقعات بالضبط تقع علي خط الإنحدار
هذه كانت مقدمة بسيطة عن نماذج الإنجدار الخطي البسيط وطريقة عملها بالموضوع القادم باذن الله بنستكمل طرق التحقق من النماذج والأسباب المؤثرة علي دقة النموذج
لقراءة الموضوع كامل
linkedin.com

جاري تحميل الاقتراحات...