أنا سويت تحليل إحصائي باستخدام ال Regression ، طلعت العلاقة بين المتغيرات جميلة و النتائج حلوة و كل شيء تمام.
السؤال: هل أبدأ كتابة النتائج و ألا باقي شيء؟
الجواب: باقي شيئ مهم جداً (و هو يعتبر صداع لكل محلل إحصائي) و هو التأكد من فرضيات التحليل (ٌRegression Assumptions).
التحقق من الفرضيات يجيب على أهم سؤال في التحليل و هو:
هل النموذج الاحصائي للعلاقات بين المتغيرات في دراستي مبني على أساس إحصائي صحيح
أو بالانجليزية
Is the regression model fit my data?
سأشرح أهم الفرضيات الخاصة بكل نوع من أنواع التحليل الإحصائي في هذا الثريد.
السؤال: هل أبدأ كتابة النتائج و ألا باقي شيء؟
الجواب: باقي شيئ مهم جداً (و هو يعتبر صداع لكل محلل إحصائي) و هو التأكد من فرضيات التحليل (ٌRegression Assumptions).
التحقق من الفرضيات يجيب على أهم سؤال في التحليل و هو:
هل النموذج الاحصائي للعلاقات بين المتغيرات في دراستي مبني على أساس إحصائي صحيح
أو بالانجليزية
Is the regression model fit my data?
سأشرح أهم الفرضيات الخاصة بكل نوع من أنواع التحليل الإحصائي في هذا الثريد.
فرضيات الانحدار الخطي
( Linear Regression Assumptions)
1.نوع المتغير التابع (Outcome Variable):
يجب أن يكون المتغير التابع مستمراً (Continuous variable)
2. التوزيع الطبيعي للبواقي Residuals Normality:
يجب أن تكون البواقي موزعة توزيعاً طبيعياً.
3. العلاقة الخطية Linearity:
يجب أن تكون العلاقة بين المتغيرات المستقلة والتابعة خطية.
4. التباين Homoscedasticity:
يجب أن يكون للبواقي تباين ثابت عند كل مستوى من مستويات المتغيرات المستقلة.
افتراضات أخرى:
5. ترابط المتغيرات No Multicollinearity:
يجب أن لا تكون المتغيرات المستقلة مترابطة بشكل كبير مع بعضها البعض.
6. استقلالية بيانات المرضى Independence:
يجب أن تكون observations مستقلة عن بعضها البعض.
( Linear Regression Assumptions)
1.نوع المتغير التابع (Outcome Variable):
يجب أن يكون المتغير التابع مستمراً (Continuous variable)
2. التوزيع الطبيعي للبواقي Residuals Normality:
يجب أن تكون البواقي موزعة توزيعاً طبيعياً.
3. العلاقة الخطية Linearity:
يجب أن تكون العلاقة بين المتغيرات المستقلة والتابعة خطية.
4. التباين Homoscedasticity:
يجب أن يكون للبواقي تباين ثابت عند كل مستوى من مستويات المتغيرات المستقلة.
افتراضات أخرى:
5. ترابط المتغيرات No Multicollinearity:
يجب أن لا تكون المتغيرات المستقلة مترابطة بشكل كبير مع بعضها البعض.
6. استقلالية بيانات المرضى Independence:
يجب أن تكون observations مستقلة عن بعضها البعض.
فرضيات الانحدار اللوجستي (Logistic Regression):
1. نوع المتغير التابع (Outcome Variable):
يجب أن يكون المتغير التابع ثنائي (0 أو 1).
2. توزيع البواقي Residuals Normality:
لا يتطلب أن تكون البواقي موزعة توزيعاً طبيعياً و لكن يفضل أن تكون موزعة بشكل قريب من التوزيع الطبيعي.
3. الترابط بين المتغيرات No Multicollinearity:
يجب أن لا تكون المتغيرات مترابطة بشكل كبير فيما بينها.
4. استقلالية الحالات Independence of observation:
يجب أن تكون observations مستقلة عن بعضها البعض.
1. نوع المتغير التابع (Outcome Variable):
يجب أن يكون المتغير التابع ثنائي (0 أو 1).
2. توزيع البواقي Residuals Normality:
لا يتطلب أن تكون البواقي موزعة توزيعاً طبيعياً و لكن يفضل أن تكون موزعة بشكل قريب من التوزيع الطبيعي.
3. الترابط بين المتغيرات No Multicollinearity:
يجب أن لا تكون المتغيرات مترابطة بشكل كبير فيما بينها.
4. استقلالية الحالات Independence of observation:
يجب أن تكون observations مستقلة عن بعضها البعض.
فرضيات الانحدار البواسوني (Poisson Regression):
1. نوع المتغير التابع (Outcome Variable):
يجب أن يكون المتغير التابع بيانات تعدادية (أعداد صحيحة غير سالبة).
3. التوزيع الطبيعي للبواقيResiduals Normality:
لا يتطلب أن تكون البواقي موزعة توزيعاً طبيعياً.
4.الترابط بين المتغيرات No Multicollinearity:
يجب أن لا تكون المتغيرات المستقلة مترابطة بشكل كبير.
5. استقلالية الحالات Independence:
يجب أن تكون observations مستقلة عن بعضها.
6. عدم وجود تشتت No overdispertion:
يجب التأكد أن معامل التشتت لا يزيد كثيراً عن 1.
1. نوع المتغير التابع (Outcome Variable):
يجب أن يكون المتغير التابع بيانات تعدادية (أعداد صحيحة غير سالبة).
3. التوزيع الطبيعي للبواقيResiduals Normality:
لا يتطلب أن تكون البواقي موزعة توزيعاً طبيعياً.
4.الترابط بين المتغيرات No Multicollinearity:
يجب أن لا تكون المتغيرات المستقلة مترابطة بشكل كبير.
5. استقلالية الحالات Independence:
يجب أن تكون observations مستقلة عن بعضها.
6. عدم وجود تشتت No overdispertion:
يجب التأكد أن معامل التشتت لا يزيد كثيراً عن 1.
الانحدار كوكس ( Cox Regression or Survival analysis):
1. نوع المتغير التابع (Outcome Variable):
يتكون المتغير التابع من مكونين
A. Time (hours, days, or months).
B. Status (Death, Discharge, or recurrence)
يجب أن يحتوي المكونين على الشروط التالية:
Time Variable Assumptions:
Non-negative Values: Time values should be non-negative, representing durations from the start of the study or some other reference point.
Continuous or Discrete: Time can be continuous or discrete, depending on the nature of the event being studied.
Status Variable Assumptions:
Binary Outcome: The status variable should be binary, typically coded as 0 for censored observations (individuals who have not experienced the event by the end of the study or lost to follow-up) and 1 for event occurrences (individuals who have experienced the event).
Independent Censoring: The censoring mechanism should be independent of the event occurrence. In other words, the probability of being censored at a particular time should not be related to the potential survival time or the occurrence of the event.
2. توزيع البواقي Residuals Normality:
لا يتطلب أن تكون البواقي موزعة توزيعاً طبيعياً.
افتراضات محددة:Proportional Hazards: يجب أن تكون نسبة الخطر بين أي فردين ثابتة على مر الوقت.
3. ترابط المتغيرات المستقلة No Multicollinearity:
يجب أن لا تكون المتنبئات مترابطة بشكل كبير.
4. أوقات البقاء Independence of Survival Times:
يجب أن تكون أوقات البقاء مستقلة.
5. من أهم فرضيات Cox regression:
The proportional hazards assumption is a critical assumption in Cox regression analysis. This assumption implies that the hazard (risk of experiencing the event) associated with a particular risk factor remains constant over time. In other words, the relative hazard between two individuals with different levels of the risk factor is constant over time.
1. نوع المتغير التابع (Outcome Variable):
يتكون المتغير التابع من مكونين
A. Time (hours, days, or months).
B. Status (Death, Discharge, or recurrence)
يجب أن يحتوي المكونين على الشروط التالية:
Time Variable Assumptions:
Non-negative Values: Time values should be non-negative, representing durations from the start of the study or some other reference point.
Continuous or Discrete: Time can be continuous or discrete, depending on the nature of the event being studied.
Status Variable Assumptions:
Binary Outcome: The status variable should be binary, typically coded as 0 for censored observations (individuals who have not experienced the event by the end of the study or lost to follow-up) and 1 for event occurrences (individuals who have experienced the event).
Independent Censoring: The censoring mechanism should be independent of the event occurrence. In other words, the probability of being censored at a particular time should not be related to the potential survival time or the occurrence of the event.
2. توزيع البواقي Residuals Normality:
لا يتطلب أن تكون البواقي موزعة توزيعاً طبيعياً.
افتراضات محددة:Proportional Hazards: يجب أن تكون نسبة الخطر بين أي فردين ثابتة على مر الوقت.
3. ترابط المتغيرات المستقلة No Multicollinearity:
يجب أن لا تكون المتنبئات مترابطة بشكل كبير.
4. أوقات البقاء Independence of Survival Times:
يجب أن تكون أوقات البقاء مستقلة.
5. من أهم فرضيات Cox regression:
The proportional hazards assumption is a critical assumption in Cox regression analysis. This assumption implies that the hazard (risk of experiencing the event) associated with a particular risk factor remains constant over time. In other words, the relative hazard between two individuals with different levels of the risk factor is constant over time.
جاري تحميل الاقتراحات...