معامل سبيرمان للارتباط
معامل سبيرمان للارتباط (بالإنجليزية: Spearman's correlation coefficient) ويعرف أيضا بمعامل ارتباط سبيرمان حسب الرتب، في الإحصاء، هو قياس لمستوى الارتباط الإحصائي بين متغيرين، انطلاقا من رتب البيانات الملاحظة.[1] بالتالي، يعتبر تقنية إحصائية غير معلمية[2]، مقارنة بمعامل الارتباط لبيرسون.
الطبيعة | |
---|---|
فرع من | |
سمّي باسم | |
الصيغة |
يشار إلى معامل ارتباط سبيرمان في المراجع الإحصائية بالحرف الإغريقي غو ويرمز إلى المعامل، بين متغيرين و، ب أو .[3]
سمي المعامل باسم واضعه النفساني البريطاني تشارلز سبيرمان.
حساب المعامل
عدلحساب المعامل ينطلق من تعويض البيانات برتبها داخل العينة. باعتبار عينة مكونة من فردا إحصائيا وفق متغيرين و ، عوض اعتبار البيانات و ( )، نعتبر سلسلتي الرتب و بحيث يمثل رتبة القيمة الملاحظة داخل العينة حسب الترتيب التصاعدي. هذه الرتب تأخذ قيمها بين و .
معامل الارتباط لسبيرمان هو معامل ارتباط بيرسون للمتغيرين الجديدين المعرفين حسب الرتب:
- مع:
- هو التغاير بين متغيري الرتب و .
- و هما الانحرافان المعياريان لمتغيري الرتب و .
مقدر المعامل
عدلنعرف كفرق بين رتبتي القيمتين الملاحظتين للفرد .
في حالة وجود حالات كثيرة لتساوي الرتب، داخل العينة، يجب تقويم صيغة المقدر (أنظر فقرة تساوي الرتب أسفله).[2]
مزايا المعامل
عدل- على العموم، يجب قراءة معامل سبيرمان بالموازاة مع معامل بيرسون، وذلك دون إغفال بأنه معامل غير معلمي، بمعنى أنه لا يمكن تقييمه واختبار مغزاه الإحصائي اعتمادا على فرضية التوزيع الطبيعي الثنائي للمتغيرين المدروسين.[2]
- مقارنة بمعامل بيرسون، معامل سبيرمان يوائم بشكل أفضل الحالات التي يكون فيها أحد المتغيرين و (أو كلاهما) من الصنف النوعي الترتيبي (مثلا، رتب وصفية لحدة ظاهرة ما أو قياسات على سلم إحصائي على شاكلة سلالم ليكرت). في هذه الحالة، يستحسن أن تكون فقرات (items) المقياس كبيرة العدد نسبيا: إذا كانت قليلة، تكون مقاربة قياس الارتباط حسب معاملات كمية غير ناجعة وغير ذات جدوى ويستحسن الجوء إلى تقنية اختبار خي تربيع لقياس مستوى الارتباط الإحصائي بين المتغيرين.
- حالة الاستخدام الأكثر شيوعا لمعامل سبيرمان هي التي يشتبه خلالها في وجود ارتباط غير خطي بين و ، وخصوصا إذا كان على شكل علاقة رتيبة (تزايدية أو تناقصية) كالدوال الأسية مثلا.[1]
تأويل المعامل
عدل- معامل سبيرمان، على غرار معامل بيرسون، يأخذ قيمه بين و .
- معامل بقيمة مطلقة يشير إلى وجود حالة ارتباط كامل بين المتغيرين، بدون أن يكون خطيا بالضرورة. الارتباط التام من منظور سبيرمان يعني وجود علاقة رتيبة تامة بين المتغيرين.
- معامل بقيمة منعدمة يعني عدم وجود علاقة ارتباط إحصائي بين المتغيرين.[2]
- رغم طبيعته غير المعلمية، في حالة تحقق توزيع طبيعي ثنائي للمتغيرين و ، يكون معامل سبيرمان ذا قيمة قريبة من معامل بيرسون.
- إذا كانت قيمتا معاملي سبيرمان وبيرسون متباعدتين، فإن ذلك يعني وجود علاقة غير خطية بين المتغيرين المدروسين ويجب أن يؤدي ذلك إلى تطبيق تحويلات مناسبة عليهما بهدف ضبط العلاقة المثلى بينهما، قبل استعمالهما في نمذجة إحصائية مثلا.[2]
أمثلة
عدل-
في المثال اعلاه، معامل سبيرمان يساوي 1 نظرا لوجود علاقة رتيبة تامة بين المتغيرين و ، رغم عدم وجود علاقة خطية بينهما، وهو ما تؤكده قيمة معامل ارتباط بيرسون.
-
في المثال أعلاه، حيث لا وجود لعلاقة رتيبة أو خطية أو بيانات غير اعتيادية، يؤول المعاملان إلى نفس القيم الدنيا، تقريبا.
-
معامل سبيرمان أقل تأثرا بوجود ملاحظات شاذة أو غير اعتيادية. في المثال أعلاه، معامل سبيرمان يقيس بشكل أفضل العلاقة الخطية القوية الموجودة بين المتغيرين المدروسين
استدلال إحصائي
عدللاختبار المغزى الإحصائي للمقدر ، أي الفرضية المنعدمة التي تفترض بأنه يساوي صفرا، تستعمل، في الغالب، إحصائيتان في الاختبارات الإحصائية، حسب حجم العينة :
حالة العينات الصغرى
عدلوهي الحالة التي يكون فيها بين 20 و30، تستعمل الإحصائية الموزعة حسب توزيع ستيودنت:[2]
حالة العينات الكبرى
عدلوهي الحالة التي يكون فيها أكبر من 30، تستعمل الإحصائية الموزعة طبيعيا:[2]
العتبة الحرجة، التي بموجبها ترفض الفرضية تكون بدلالة عتبة القيمة الاحتمالية
باستخدام القيم الاحتمالية (p-value) وباعتبار عتبة (في الغالب تعتبر عتبة 0.05):
- إذا كانت القيمة الاحتمالية أصغر من العتبة ترفض الفرضية المنعدمة، وبالتالي يعتبر الارتباط ذا مغزى إحصائي.
- إذا كانت القيمة الاحتمالية أكبر من العتبة ، لا ترفض الفرضية المنعدمة ويتم وفق ذلك رفض وجود ارتباط.
حالة تساوي الرتب
عدلفي حالة وجود حالات كثيرة لتساوي رتب القيم الملاحظة، يتم استبدال الرتب بأخرى متوسطة، وهو ما يستوجب تقويم صيغة مقدر معامل سبيرمان بإدماج معاملي تصحيح و ، لتصبح صيغة مقدر معامل سبيرمان:[2]
.
لحساب معامل التصحيح (مثلا لقيم المتغير )، يجب أولا تحديد رتب متوسطة للقيم التي لها نفس الرتبة. مثلا، إذا كانت لملاحظتين نفس الرتبة وهما مرتبتان بين الرتبتين 5 و6، تعطى لكل واحدة منهما الرتبة .
بعد ذلك يجب تحديد العدد الذي يمثل عدد الرتب المختلفة (بين الرتب المتوسطة). لكل رتبة يتم حساب مرات تكرارها ، لنحصل على صيغة معامل التصحيح التالية:
مثال عددي
عدلنعتبر ملاحظات لمتغير في عينة مكونة من 12 فردا إحصائيا:
الفرد | القيمة الملاحظة | الرتب الخام | الرتب المتوسطة |
---|---|---|---|
1 | 0 | 1 | 1.5 |
2 | 0 | 2 | 1.5 |
3 | 1 | 3 | 3 |
4 | 2 | 4 | 5 |
5 | 2 | 5 | 5 |
6 | 2 | 6 | 5 |
7 | 5 | 7 | 7 |
8 | 6 | 8 | 8 |
9 | 7 | 9 | 9 |
10 | 8 | 10 | 10.5 |
11 | 8 | 11 | 10.5 |
12 | 12 | 12 | 12 |
في هذا المثال[2] و (لوجود 8 رتب مختلفة فقط ضمن الرتب المتوسطة):