الإنحدار الخطي هو تقريب للعلاقة السببية بين متغيرين أو أكثر وتعتبر نماذج الإنحدار ذات قيمة عالية لأنها من أكثر الطرق شيوعا لعمل التنبؤات والإستدلالات .
ويقع الإنحدار الخطي البسيط عندما يكون متغير الإستجابة واحد فقط أو عند دراسة وتحليل أثر متغير على متغير آخر
تدور عملية الإنحدار الخطي كالتالي :
- الحصول علي البيانات المناسبة
بناء النموذج المناسب
عمل توقعات علي النموذج
في علم الآلة وبناء النماذج هناك متغيرين أساسيين لبناء أي نموذج انحدار خطي وهما
المتغير التابع - Independent Varible ويرمز له بحرف Y
المتغير المستقل Dependent Varible ويرمز له بحرف X
المتغير التابع هو الذي تحاول التنبؤ به دائما ، وعند استخدام تحليل الإنحدار نريد توقع قيمة Y بشرط أن تتوفر لدينا قيمة X
وللحصول علي انحدار يجب أن تعتمد Y علي X بطريقة سببية وعندما يكون هناك تغير في قيم X يجب أن يؤثر هذا التغيير في Y أيضا .
مثلا يعتمد الدخل الشهري من راتبك علي عدد سنوات التعليم وشهادات الخبرة والمؤهل الدراسي إذا قمنا بتطبيق هذه البيانات لتوقع الدخل الشهري الخاص بك وبناء نموذج انحدار خطي
فإن قيمة المتغير التابع Y هي التي نريد التنبؤ بها والتي تتمثل في راتبك الشهري
وقيمة المتغير المستقل X هي التي تحتوي علي تفاصيل الشهادات والخبرات والمؤهلات العلمية التي تؤدي الي زيادة دخلك الشهري
وإذا نظرت الي العلاقة بين المتغيرين ستجد أن هناك علاقة سببيسة بمعني أنه كلما زادات مؤهلاتك وخبراتك كلمان كان من المتوقع زيادة دخلك الشهري وهذا مفهوم العلاقة الإيجابية بين المتغيرات .
ويقع الإنحدار الخطي البسيط عندما يكون متغير الإستجابة واحد فقط أو عند دراسة وتحليل أثر متغير على متغير آخر
تدور عملية الإنحدار الخطي كالتالي :
- الحصول علي البيانات المناسبة
بناء النموذج المناسب
عمل توقعات علي النموذج
في علم الآلة وبناء النماذج هناك متغيرين أساسيين لبناء أي نموذج انحدار خطي وهما
المتغير التابع - Independent Varible ويرمز له بحرف Y
المتغير المستقل Dependent Varible ويرمز له بحرف X
المتغير التابع هو الذي تحاول التنبؤ به دائما ، وعند استخدام تحليل الإنحدار نريد توقع قيمة Y بشرط أن تتوفر لدينا قيمة X
وللحصول علي انحدار يجب أن تعتمد Y علي X بطريقة سببية وعندما يكون هناك تغير في قيم X يجب أن يؤثر هذا التغيير في Y أيضا .
مثلا يعتمد الدخل الشهري من راتبك علي عدد سنوات التعليم وشهادات الخبرة والمؤهل الدراسي إذا قمنا بتطبيق هذه البيانات لتوقع الدخل الشهري الخاص بك وبناء نموذج انحدار خطي
فإن قيمة المتغير التابع Y هي التي نريد التنبؤ بها والتي تتمثل في راتبك الشهري
وقيمة المتغير المستقل X هي التي تحتوي علي تفاصيل الشهادات والخبرات والمؤهلات العلمية التي تؤدي الي زيادة دخلك الشهري
وإذا نظرت الي العلاقة بين المتغيرين ستجد أن هناك علاقة سببيسة بمعني أنه كلما زادات مؤهلاتك وخبراتك كلمان كان من المتوقع زيادة دخلك الشهري وهذا مفهوم العلاقة الإيجابية بين المتغيرات .
كيف تقوم بمقياس العلاقة بين المتغيرات ؟ Correlathionship varibles
في مكتبة Pandas تتوفر أدوات خاصة بالرسم البياني وإظهار العلاقة بين المتغيرات الفئوية والرقمية ، والحديث هنا عن توضيح العلاقة بين المتغيرات الرقمية وسنقوم باستخدام Scatter Plot مخطط الإنتشار ، والذي يوضح العلاقات عن طريق رسم خط مستقيم يربط بين متغيرين رقميين كما بالمثال .
مثلا عند العلاقة الإيجابية بين المتغيرات تزداد قيمة المتغير الأول كلما زادت قيمة المتغير الثاني
في مكتبة Pandas تتوفر أدوات خاصة بالرسم البياني وإظهار العلاقة بين المتغيرات الفئوية والرقمية ، والحديث هنا عن توضيح العلاقة بين المتغيرات الرقمية وسنقوم باستخدام Scatter Plot مخطط الإنتشار ، والذي يوضح العلاقات عن طريق رسم خط مستقيم يربط بين متغيرين رقميين كما بالمثال .
مثلا عند العلاقة الإيجابية بين المتغيرات تزداد قيمة المتغير الأول كلما زادت قيمة المتغير الثاني
يعتمد الإنحدار علي السببية ويدور حول كيفية تأثير أحد المتغيرات علي الآخر أو التغيرات التي يسببها الآخر ، كما أن وجود ارتباط بين عاملين أو متغيرين لا يعني أن أحدهما يسبب الاخر
وهنا معني أن الإرتبا لا يعني السببية
(Correlation does not imply causation)
الإرتباط يحدث عن ظاهرتين لهم علاقة ببعض مثلا الطول والوزن ، المشي والجوع ، أما السببية فتكون أحد المتغيرين مسببا للآخر يعني المتغير A تغير لأن المتغير B تغير أيضا .
وهنا معني أن الإرتبا لا يعني السببية
(Correlation does not imply causation)
الإرتباط يحدث عن ظاهرتين لهم علاقة ببعض مثلا الطول والوزن ، المشي والجوع ، أما السببية فتكون أحد المتغيرين مسببا للآخر يعني المتغير A تغير لأن المتغير B تغير أيضا .
معادلة الإنحدار الخطي Equition Linear Regressison .
خطوط الإنحدار الخطي دائما مستقيمة وهذه من سمات الإنحدار ، ولتحديد خط الإنحدار نحتاج إلي خاصيتين
التقاطع Intercept - هو قيمة Y عندما تكون X تساوي صفر
الميل Slope - الميل أو المنحدر هو شدة انحدار الخط ،
ويساوي مقدار زيادة Y إذا قمت بزيادة X بمقدار 1 .
ومعادة اللإنحدار كالتالي :
Y = Intercept + Slope * X
وتعني أن قيمة Y = التقاطع + الميل مضروبا في قيمة X
خطوط الإنحدار الخطي دائما مستقيمة وهذه من سمات الإنحدار ، ولتحديد خط الإنحدار نحتاج إلي خاصيتين
التقاطع Intercept - هو قيمة Y عندما تكون X تساوي صفر
الميل Slope - الميل أو المنحدر هو شدة انحدار الخط ،
ويساوي مقدار زيادة Y إذا قمت بزيادة X بمقدار 1 .
ومعادة اللإنحدار كالتالي :
Y = Intercept + Slope * X
وتعني أن قيمة Y = التقاطع + الميل مضروبا في قيمة X
التنبؤ بالإنحدار Prediction
الفائدة الكبيرة من الإنحدار أن النماذج تسمح لك بعمل تنبؤات تتمتع بدرجة عالية من الدقة لأن الغرض في النهاية هو التنبؤ بمتغير الإستجابة الذي يكشف لنا مدي درجة الإعتماد علي النموذج في التنبؤ بشئ معين .
في هذا المثال سنعتمد علي نموذج إحصائي هام ومستخدم بكثرة مع نماذج الإنحدار الخطي وهو OLS -
ordinary least squares (OLS)
وهو نوع من الإنحدار شائع الإستخدام يأخذ وسيطين الأول متغير الإستجابة ، والثاني متغير التنبؤ ويبين لنا نموذج OLS مجموعة هامة من الإختصارات المفيدة جدا عند بناء نموذج الإنحدار مثل قيمة R-Squred والعديد من الخواص التي سنتطرق لشرحها فيما بعد بإذن الله
الفائدة الكبيرة من الإنحدار أن النماذج تسمح لك بعمل تنبؤات تتمتع بدرجة عالية من الدقة لأن الغرض في النهاية هو التنبؤ بمتغير الإستجابة الذي يكشف لنا مدي درجة الإعتماد علي النموذج في التنبؤ بشئ معين .
في هذا المثال سنعتمد علي نموذج إحصائي هام ومستخدم بكثرة مع نماذج الإنحدار الخطي وهو OLS -
ordinary least squares (OLS)
وهو نوع من الإنحدار شائع الإستخدام يأخذ وسيطين الأول متغير الإستجابة ، والثاني متغير التنبؤ ويبين لنا نموذج OLS مجموعة هامة من الإختصارات المفيدة جدا عند بناء نموذج الإنحدار مثل قيمة R-Squred والعديد من الخواص التي سنتطرق لشرحها فيما بعد بإذن الله
قبل التنبؤ بالنموذج نقوم أولا بعمل fit للنموذج باستخدام ols علي متغير التنبؤ والاستجابة ثم نحدد متغير الإستجابة Y ومتغير التنبو X .
بعدما قمنا بتحديد المتغيرات وعملية التنبؤ علي النموذج كانت النتيجة كالتالي .
التقاطع = 8.22
الإنحدار = 0.79
وهذا يعني أنه إذا قمت بزيادة عدد المتاجر القريبة لكل منزل ، فإن الزيادة المتوقعة في سعر المنزل ستكون
0.7981 للمتر .
وهنا يعتبر التقاطع موجبًا أيضًا وله ارتباط إيجابيًا ، حيث يزداد سعر المنزل أيضًا مع زيادة عدد المتاجر القريبة.
بعدما قمنا بتحديد المتغيرات وعملية التنبؤ علي النموذج كانت النتيجة كالتالي .
التقاطع = 8.22
الإنحدار = 0.79
وهذا يعني أنه إذا قمت بزيادة عدد المتاجر القريبة لكل منزل ، فإن الزيادة المتوقعة في سعر المنزل ستكون
0.7981 للمتر .
وهنا يعتبر التقاطع موجبًا أيضًا وله ارتباط إيجابيًا ، حيث يزداد سعر المنزل أيضًا مع زيادة عدد المتاجر القريبة.
تصور التوقعات Visualizing predictions
يحتوي نموذج التنبؤ الذي قمنا بإنشائه على متغيرات التنبؤ والإستجابة هذا يعني أنه يمكنك رسمها على نفس مخطط الإنتشار Scatter Plot عن طريق تحديد المتغيرات وتمييز نقاط الإنحدار باللون الأحمر.
توضح الصورة مدي ملائمة خط الإنحدار للبيانات مع تمييز نقاط التوقع مع ملاحظة أن التوقعات بالضبط تقع علي خط الإنحدار
يحتوي نموذج التنبؤ الذي قمنا بإنشائه على متغيرات التنبؤ والإستجابة هذا يعني أنه يمكنك رسمها على نفس مخطط الإنتشار Scatter Plot عن طريق تحديد المتغيرات وتمييز نقاط الإنحدار باللون الأحمر.
توضح الصورة مدي ملائمة خط الإنحدار للبيانات مع تمييز نقاط التوقع مع ملاحظة أن التوقعات بالضبط تقع علي خط الإنحدار
هذه كانت مقدمة بسيطة عن نماذج الإنجدار الخطي البسيط وطريقة عملها بالموضوع القادم باذن الله بنستكمل طرق التحقق من النماذج والأسباب المؤثرة علي دقة النموذج
لقراءة الموضوع كامل
linkedin.com
لقراءة الموضوع كامل
linkedin.com
جاري تحميل الاقتراحات...