الانحدار الخطي التدريجي

تشغيل الانحدار الخطي التدريجي

على سبيل المثال، لتشغيل الانحدار الخطي التدريجي Stepwise Linear Regression باستخدام درجات العوامل factor scores:

1. قم باستدعاء مربع حوار الانحدار الخطي أو Linear Regression.

يظهر مربع حوار الانحدار الخطي، ثم نقوم فيه بتحديد خيار “التدريجي” Stepwise باعتباره الأسلوب، وذلك كما يلي:

مربع حوار الانحدار الخطي مع تحديد خيار التدريجي Stepwise باعتباره الأسلوب
مربع حوار الانحدار الخطي مع تحديد “التدريجي” Stepwise باعتباره الأسلوب

2. حدد”تدريجي” Stepwise كطريقة الدخول أو entry method.

لاحظ أنه نظرًا لأن الأساليب المتدرجة تختار النماذج التي تستند فقط إلى الجدارة الإحصائية statistical merit، فقد تختار تنبؤات ليس لها أهمية عملية. وفي الوقت الذي تعتبر فيه الطرق التدريجية هي طريقة ملائمة للتركيز على مجموعة فرعية أصغر من المتنبئين predictors، يجب أن تحرص على فحص النتائج لمعرفة ما إذا كانت منطقية.

3. حدد النموذج Model كمتغير تسمية الحالة case labeling variable.

4. انقر فوق إحصائيات Statistics.

يظهر مربع حوار الإحصائيات كما يلي:

مربع حوار الإحصائيات - الانحدار الخطي التدريجي
مربع حوار الإحصائيات – الانحدار الخطي التدريجي

5. قم بإلغاء تحديد الارتباطات الجزئية والتجزيئية Part and partial correlations وتشخيص العلاقة الخطية المتداخلة Collinearity diagnostics.

6. حدد Casewise diagnostics واكتب 2 في مربع النص الانحراف المعياري Standard Diviations.

7. انقر فوق متابعة Continue.

8. انقر فوق مخططات Plots في مربع حوار الانحدار الخطي Linear Regression.

يظهر مربع حوار المخططات كما يلي:

مربع حوار المخططات - الانحدار الخطي التدريجي
مربع حوار المخططات

9. حدد *SDRESID كمتغير y و *ZPRED كمتغير x.

10. حدد المدرج التكراري Histogram.

11. انقر فوق متابعة Continue.

12. انقر فوق “حفظ” Save في مربع حوار الانحدار الخطي Linear Regression.

يظهر مربع حوار الحفظ كما يلي:

مربع حوار الحفظ - الانحدار الخطي التدريجي
مربع حوار الحفظ

13. حدد قياسي Standardized  في مجموعة “القيم المتنبأ بها” Predicted Values.

14. حدد قياسي Standardized  في مجموعة “المتبقية” Residuals.

15. حدد قيم Cook’s و Leverage في مجموعة المسافات Distances.

16. انقر فوق متابعة Continue.

17. انقر فوق موافق OK في مربع حوار الانحدار الخطي Linear Regression.

التحقق من ملاءمة نموذج الانحدار الخطي التدريجي

الشكل التالي يبين جدول ملخص النموذج Model summary table، نموذج مع جميع المتنبئين، وهو يوضح قيم R و R-square و R-square المعدل والخطأ المعياري في التقدير لجميع المتنبئين دفعة واحدة:

جدول ملخص النموذج، نموذج مع جميع المتنبئين
جدول ملخص النموذج، نموذج مع جميع المتنبئين

أما الشكل التالي يبين جدول ملخص النموذج Model summary table، نموذج مع تنبؤات مختارة خطوة بخطوة، فهو يوضح قيم R و R-square و R-square المعدل والخطأ المعياري للتقدير في كل خطوة:

جدول ملخص النموذج، نموذج مع تنبؤات مختارة خطوة بخطوة
جدول ملخص النموذج، نموذج مع تنبؤات مختارة خطوة بخطوة

تظهر قدرة النموذج الجديد على شرح المبيعات بشكل إيجابي بالمقارنة مع قدرة النموذج السابق. انظر بشكل خاص إلى إحصائيات R-square المعدلة، والتي تكون متطابقة تقريبًا. سيكون للنموذج الذي يحتوي على تنبؤات إضافية دائمًا قيمة R-square كبيرة على الأقل، لكن قيمة R-square المعدلة تعوض تعقيد النموذج لتوفير مقارنة أكثر إنصافًا لأداء النموذج.

المعاملات المتدرجة في الانحدار الخطي التدريجي

الشكل التالي يبين جدول المعاملات Coefficients، وهو يُظهر المعاملات غير القياسية والموحدة، t، والدلالة لكل متغير مستقل في كل خطوة كما يلي:

جدول المعاملات Coefficients - الانحدار الخطي التدريجي
جدول المعاملات Coefficients

تختار الخوارزمية المتدرجة درجات العوامل 1 و 2 و 3 و 5 و 6 كمتنبئات predictors؛ لتفسير هذه النتائج، ستحتاج إلى إلقاء نظرة على مصفوفة المكون المدورة rotated component matrix في مخرجات تحليل العامل Factor Analysis output.

الشكل التالي يبين مصفوفة المكون المدورة rotated component matrix:

مصفوفة المكون المدورة rotated component matrix - الانحدار الخطي التدريجي
مصفوفة المكون المدورة rotated component matrix
  • يتم تحميل المكون الأول (درجات العوامل) (factor scores) بقوة أكبر على السعر price والقدرة الحصانية horsepower. نظرًا لأن معامل الانحدار regression coefficient سلبي (قيمة سالبة) بالنسبة لدرجة العامل 1، يمكنك استنتاج أنه من المتوقع أن تحقق السيارات الأعلى سعراً وذات القدرة الحصانية الأكبر مبيعات أقل.
  • يتم تحميل المكون الثاني بقوة أكبر على قاعدة العجلات wheelbase والطول length. نظرًا لأن معامل الانحدار إيجابي (قمية موجبة) لعامل الدرجة 2، فإن هذا يشير إلى أنه من المتوقع أن تحقق المركبات الأكبر حجمًا مبيعات أعلى.
  • يتم تحميل المكون الثالث بقوة أكبر على نوع السيارة vehicle type. يشير المعامل الإيجابي لدرجة العامل 3 إلى أنه من المتوقع أن تحقق الشاحنات مبيعات أعلى.
  • يتم تحميل المكون السادس بقوة أكبر على حجم المحرك engine size؛ لاحظ أن حجم أحمال المحرك يكاد يكون بنفس القوة على المكون الأول، لذا فإن المعامل الإيجابي لدرجة العامل 6 يشير إلى أن هذا يعوض جزئيًا الارتباط السلبي بين حجم المحرك والمبيعات الذي يقترحه المعامل السلبي لدرجة العامل 1.
  • يتم تحميل المكون الخامس بأقصى قوة على كفاءة استخدام الوقود fuel efficient؛ يشير تركيبة “تحميل المكون السالب” مع “الدلالة السلبية لدرجة العامل 5” إلى أنه من المتوقع أن تحقق السيارات الأكثر كفاءة في استهلاك الوقود مبيعات أعلى، مع تساوي جميع الأشياء الأخرى.

التحقق من طبيعية مصطلح الخطأ

الشكل التالي يبين رسم بياني للحالات المتبقية residuals مع المنحنى الطبيعي:

رسم بياني للحالات المتبقية residuals مع المنحنى الطبيعي
رسم بياني للحالات المتبقية residuals مع المنحنى الطبيعي

شكل الرسم البياني يتبع شكل المنحنى الطبيعي normal curve جيدًا إلى حد ما، ولكن هناك واحد أو اثنين من الحالات المتبقية السلبية negative residuals الكبيرة. لمزيد من المعلومات حول هذه الحالات، راجع تشخيص الحالات.

تشخيص الحالات

الشكل التالي يبين جدول تشخيص الحالات Casewise diagnostics table، وهو يعرض الحالات المتبقية المعيارية وقيم المتغير التابع والقيم المتوقعة والحالات المتبقية كما يلي:

جدول تشخيص الحالات
جدول تشخيص الحالات


يحدد هذا الجدول الحالات المتبقية السلبية الكبيرة مثل 3000GT و Cutlass. هذا يعني أنه بناءً على المبيعات المتوقعة التي تنبأ بها نموذج الانحدار regression model، كان أداء هذين النموذجين ضعيفًا في السوق. يبدو أيضًا أن Breeze و SW كان أداءهما ضعيفًا إلى حد أقل.

مخططات الانتشار للحالات المتبقية

الشكل التالي يبين مخطط انتشار الحالات المتبقية حسب القيم المتوقعة Residuals by predicted values، ويظهر فيه الحالات المتبقية المحذوفة على المحور الرأسي والقيم القياسية المتوقعة على المحور الأفقي:

مخطط انتشار الحالات المتبقية حسب القيم المتوقعة
مخطط انتشار الحالات المتبقية حسب القيم المتوقعة

يُظهر مخطط القيم المتبقية بحسب القيم المتوقعة بوضوح السيارتين الأقل أداءً. بالإضافة إلى ذلك، يمكنك أن ترى أن Breeze و SW قريبان جدًا من غالبية الحالات. يشير هذا إلى أن التقصير الواضح في أداء Breeze و SW قد يكون بسبب الصدفة العشوائية. ما يثير القلق الأكبر في هذا المخطط هو مجموعات الحالات البعيدة على يسار المجموعة العامة للحالات. في حين أن المركبات في هذه المجموعات لا تحتوي على حالات متبقية كبيرة، فإن بعدها عن المجموعة العامة قد يكون قد أعطى هذه الحالات تأثيرًا لا داعي له في تحديد معاملات الانحدار.

التحقق بحسب درجات العامل

للتحقق من القيم المتبقية حسب درجة العامل 1:

1. من القوائم، اختر: الرسوم البيانية> منشئ المخطط …

Graphs > Chart Builder…

يظهر منشئ المخططات البيانية كما يلي:

منشئ المخطط - الانحدار الخطي التدريجي
منشئ المخطط – الانحدار الخطي التدريجي

2. في معرض “مبعثر/نقطة” Scatter/Dot، حدد مبعثر بسيط Simple Scatter.

3. حدد Standardized Residual كمتغير y وREGR factor score 1 كمتغير x.

4. انقر فوق علامة التبويب المجموعات/معرّف النقطة Groups/Point ID وحدد Point ID Label.

5. حدد النموذج Model كمتغير لتسمية الحالات حسب  variable to label cases by.

6. انقر فوق موافق OK.

يظهر الشكل التالي وهو مخطط الانتشار للحالات المتبقية حسب درجة العامل 1 كما يلي:

مخطط الانتشار للحالات المتبقية حسب درجة العامل 1 - الانحدار الخطي التدريجي
مخطط الانتشار للحالات المتبقية حسب درجة العامل 1

يكشف مخطط الانتشار الناتج أن التجميع غير العادي للنقاط الملحوظة في القيم المتبقية بواسطة مخطط تشتت القيم المتوقعة له قيم كبيرة لدرجة العامل 1؛ أي أنها مركبات باهظة الثمن. نظرًا لأن توزيع الأسعار ملتوي بشكل صحيح، فقد يكون من الجيد استخدام الأسعار المحولة باللوغاريتمات log-transformed prices في التحليلات المستقبلية. من خلال استدعاء منشئ الرسم البياني، يمكنك إنتاج درجات متشابهة للعوامل الأخرى.

الشكل التالي يبين انتشار الحالات المبقية حسب درجة العامل 5:

مخطط انتشار الحالات المتبقية حسب درجة العامل 5 - الانحدار الخطي التدريجي
مخطط انتشار الحالات المتبقية حسب درجة العامل 5

لا تكشف الرسوم البيانية لدرجات العامل 2 و 3 عن أي شيء مثير للاهتمام، ولكن نتائج الحالات المتبقية حسب درجة العامل 5 تكشف أن المركبة Metro قد تكون نقطة مؤثرة لأنها تتمتع بكفاءة أعلى في استهلاك الوقود من أي مركبة أخرى في مجموعة البيانات وتقع بعيدًا في خارج المجموعة الرئيسية من النقاط.

الشكل التالي يبين مخطط انتشار الحالات المتبقية حسب درجة العامل 6:

مخطط انتشار الحالات المتبقية حسب درجة العامل 6 - الانحدار الخطي التدريجي
مخطط انتشار الحالات المتبقية حسب درجة العامل 6

يكشف الرسم البياني الخاص بالحالات المتبقية حسب درجة العامل 5 أن المركبة من نوع Viper قد تكون أيضًا نقطة مؤثرة لأنها تحتوي على حجم محرك كبير بشكل غير عادي وتقع خارج مجموعة النقاط الرئيسية.

تحديد النقاط المؤثرة

للتحقق من “مسافة كوك” Cook’s distance من خلال قيمة الرافعة المركزية centered leverage value:

1. قم باستدعاء مربع حوار مُنشئ المخطط Chart Builder.

يظهر مربع حوار منشئ المخطط كما يلي:

مربع حوار منشئ المخطط
مربع حوار منشئ المخطط

2. حدد “مسافة كوك” Cook’s Distance كمتغير y.

3. حدد قيمة الرافعة المركزية Centered Leverage Value كمتغير x.

4. انقر فوق موافق OK.

الشكل التالي يبين مخطط انتشار مسافة كوكCook’s Distance حسب قيمة الرافعة المركزية Centered Leverage Value، ويظهر فيه وجود معظم القيم في مجموعة في الزاوية اليسرى السفلية بالقرب من الأصل. 3000GT و Metro و Viper كلها خارج مجموعة القيم الرئيسية:

Scatterplot with Cook's distance on the vertical axis and centered leverage values on the horizontal axis. Most values are in a cluster in the lower left corner near the origin. 3000GT, Metro, and Viper are all far outside main cluster of values.

يُظهر مخطط الانتشار الناتج بعض النقاط غير العادية. 3000GT لها مسافة كوك كبيرة، لكنها لا تتمتع بقيمة رافعة عالية، لذلك في حين أنها تضيف الكثير من التباين لتقديرات الانحدار، فمن المحتمل أنها لم تؤثر على ميل معادلة الانحدار. تتمتع Viper بقيمة رافعة عالية، ولكن ليس لديها مسافة كوك كبيرة، لذلك من غير المحتمل أن يكون لها تأثير غير ضروري على النموذج. الحالة الأكثر إثارة للقلق هي Metro، التي تتمتع بقيمة رافعة كبيرة ومسافة كوك كبيرة. ستكون الخطوة التالية هي إجراء التحليل بدون هذه الحالة، لكننا لن نتابع هذا هنا.

ملخص الانحدار الخطي التدريجي

باستخدام الطرق المتدرجة في الانحدار الخطي، حددت النموذج “الأفضل” للتنبؤ بمبيعات السيارات. باستخدام هذا النموذج، وجدت طرازين من السيارات كان أداءهما ضعيفًا في السوق، في حين لم يكن أداء أي سيارة أكثر من اللازم بشكل واضح.

أشارت المخططات التشخيصية للحالات المتبقية وإحصائيات التأثير إلى أن نموذج الانحدار الخاص بك قد يتأثر سلبًا بالمركبة من نوع Metro. ستكون إزالة هذه الحالة وإعادة تشغيل التحليل لمعرفة الفرق في النتائج خطوة تالية جيدة.

الإجراءات ذات الصلة

يُعد إجراء الانحدار الخطي مفيدًا في نمذجة العلاقة بين متغير تابع من نوع المقياس ومتغير واحد أو أكثر من المتغيرات المستقلة من نوع المقياس.

  • استخدم إجراء الارتباطات Correlations لدراسة قوة العلاقات بين المتغيرات قبل تركيب النموذج.
  • إذا كان لديك متغيرات توقع فئوية categorical predictor variables، فجرب إجراء النموذج الخطي العام أحادي المتغير GLM Univariate.
  • إذا كان المتغير التابع فئويًا categorical، فجرّب إجراء التحليل التمييزي.
  • أما إذا كان لديك الكثير من المتنبئين وتريد تقليل عددها، فاستخدم إجراء تحليل العوامل.

المصدر

error:
Scroll to Top