عندما يخفق الحدس، كيف نستخدم الاحتمالات والإحصاءات لنصل إلى إجابات حقيقية
1 أكتوبر 2021
المترجم: عدنان أحمد الحاجي
المقالة رفم 303 لسنة 2021
When intuition fails، how to use probability and statistics to find the real answers
1 October 2021
الكثير من تفكيرنا فاسد لأنه يقوم على حدس خاطئ، كما يقول البروفيسور لايتون فوغان ويليامز Leighton Vaughan Williams. ولكن باستخدام إطار الاحتمالات وأدواتها والإحصاءات، بين البروفسور لايتون كيف يمكننا التغلب على هذه المشكلة لتقديم حلول للعديد من مشاكل ومفارقات العالم الحقيقي.
عندما يتعلق الأمر بحالات كانتظار حافلة، غالبًا ما يكون حدسنا خاطئًا، كما يقول البروفيسور لايتون فوغان ويليامز.
تخيل حافلة تصل إلى محطة الحافلات كل 30 دقيقة في المتوسط وأنت تصل إلى تلك المحطة دون أي فكرة عن متى غادرت الحافلة السابقة لها. كم من الوقت تتوقع أن تنتظر حتى تصل الحافلة التالية؟ حدسيًا، نصف ال 30 دقيقة «أي 15 دقيقة» يبدو هذا صحيحًا من الناحية الحدسية، لكنك ستكون محظوظًا جدًا لو انتظرت فقط مدة مقدارها 15 دقيقة.
لنفترض، على سبيل المثال، أن نصف الوقت الذي تصل فيه الحافلات في فاصل زمني مدته 20 دقيقة ونصف الوقت بفاصل زمني قدره 40 دقيقة. المعدل الإجمالي الآن هو 30 دقيقة. ولكن من وجهة نظرك، فاحتمالية وصولك المحطة خلال فترة الأربعين دقيقة أكثر بمرتين من احتمالية وصولك خلال فترة ال 20 دقيقة.
مفارقة المعاينة هي وهم إحصائي ربما لم تسمع به من قبل. إنه مصدر ارتباك شائع وسبب عرَضي للخطأ وفرصة لتصميم تجريبي ذكي[1] .
هذا صحيح في كل حالة إلا عندما تصل الحافلات بفواصل زمنية محددة مدتها 30 دقيقة. كلما زاد الانتشار dispersion حول متوسط الوقت، كلما زاد مقدار وقت الانتظار المتوقع على متوسط الانتظار. هذه هي ”مفارقة المعاينة / الملاحظة / المراقبة، Inspection Paradox [2] «انظر المثال في[3] “، التي تنص على أنه عندما تقوم ”بمعاينة“ عملية ما، فمن المحتمل أن تجد أن الأشياء تستغرق «أو تدوم» وقتًا أطول من متوسطها ”غير الملحوظ“. ما يبدو وكأن تمادي سوء حظ هو ببساطة كشف قوانين الاحتمالات والإحصاءات عن مجراها الطبيعي.
بمجرد أن تكون عارفًا «واعيًا» بها، يبدو أن المفارقة موجودة في كل مكان.
على سبيل المثال، لنفترض أنك تريد إجراء مسح استقصائي لمتوسط عدد الطلاب في الصف في احدى الجامعات. لنفترض أن عدد الطلاب في الصف في الجامعة إما 10 أو 50 طالبًا، وهناك عدد متساوٍ من الصفوف فيها هذان الاحتمالان، لذا فإن متوسط عدد طلاب الصف الإجمالي هو 30 طالبًا [المترجم: حاصل جمع 10+50 مقسوم على [3] ]. ولكن عند اختيار طالب بشكل عشوائي / اعتباطي، فمن المحتمل أن يأتي الطالب / ة من صف مكون من 50 طالبًا أكثر من أن يأتي من صف فيه 10 طلاب. لذلك، لكل طالب يرد على استفسارك «في المسح الاستقصائي» ان متوسط عدد طلاب الصف هم ”10 طلاب“، سيكون هناك خمسة طلاب يجيبون بأن هناك ”50 طالبًا“ كمتوسط لعدد طلاب الصف. متوسط عدد طلاب الصف الذي سينتج من الاستطلاع الذي قمت به سيكون أقرب إلى 50 طالبًا، من أن يكون أقرب من 30 طالبًا.
لذا فإن إجراء معاينة لعدد طلاب الصفوف يزيد بشكل كبير من المتوسط المتحصل عليه مقارنة بالمتوسط الحقيقي لعدد طلاب الصفوف التي لم تتم معاينتها. الحالة الوحيدة التي فيها يتطابق متوسط عدد طلاب الصفوف التي جرت معاينتها مع تلك التي لم تجرى معاينتها هي عندما يكون عدد طلاب الصفوف متساويًا.
بمجرد أن تعرف عن ”مفارقة المعاينة“، فإن محيطنا وإدراكنا الحسي بمكاننا في هذا المحيط لم يعد هو نفسه تمامًا كما كان قبل أن تعي بتلك المفارقة.
لماذا يبدو صف الانتظار الذي أقف فيه أبطأ من صفوف الانتظار الأخرى: مفارقة المعاينة
في يوم آخر تقف في صف لتفحص عن احتمال اصابتك بفيروس [كورونا مثلًا] في إحدى العيادات الطبية. نسبة دقة الفحص تبلغ 99٪ والنتيجة كانت ايجابية [يعني أنك مصاب بالفيروس]. الآن، ما هي احتمالية إصابتك بالفيروس؟ الإجابة البديهية هي 99٪. لكن هل هذه الاجابة صحيحة؟ المعلومات التي نُعطاها تتعلق باحتمال أن تكون نتيجة الفحص إيجابية بشرط أن يكون الشخص مصابًا بالفيروس. ما نريد معرفته، مع ذلك، هو احتمال إصابة الشخص بالفيروس إذا كانت نتيجة الفحص إيجابية. الحدس الشائع يسبب خلطًا «التباسًا» بين هذين الاحتمالين، لكنهما مختلفان تمامًا. هذا مثال على مغالطة الافتراض المعكوس[4] أو مغالطة المدعي العام[5] .
أهمية نتيجة الفحص تعتمد على احتمالية إصابتك بالفيروس قبل إجراء الفحص. يُعرف هذا بالاحتمال القبلي[6] . بشكل أساس، لدينا مزاحمة بين مدى ندرة الفيروس «الحد الأدنى base rate» ومدى ندرة الخطأ في الفحص. لنفترض أن هناك فرصة قدرها واحد في المائة «فرصة واحدة من كل مائة فرصة»، بناءً على معدلات الانتشار المحلية، أن شخصًا مصاب بالفيروس قبل إجراء الفحص. الآن، تذكر أن نسبة كون الفحص خاطئًا هو واحد في المائة «مرة في كل مائة مرة».
هذان الاحتمالان متساويان، لذا فإن فرصة إصابته بالفيروس عندما تكون النتيجة إيجابية هي 1 في 2 [أي 50%]، على الرغم من أن الفحص كان دقيقًا بنسبة 99٪. ولكن ماذا لو ظهرت عليه أعراض الفيروس قبل إجراء الفحص؟ في هذه الحالة، يجب علينا تحديث الاحتمال السابق إلى مستوىً أعلى من معدل الانتشار في المجتمع السكاني الذي تم فحصه. احتمالية إصابته بالفيروس حين تكون نتيجة الفحص إيجابية تزداد بنفس النسبة. يمكننا استخدام نظرية بايز Bayes لإجراء العمليات الحسابية[7] .
باختصار، غالبًا ما يخذلنا الحدس. ومع ذلك، بتطبيق طرق الاحتمال والإحصاء، يمكننا تحدي الحدس. يمكننا حتى أن نجد حلًا لما قد يبدو للكثيرين أنه أعظم الأسرار لديهم جميعًا - لماذا يبدو أننا كثيرًا ما نجد أنفسنا عالقين في المسار أو خط الانتظار الأبطأ. حدسيًا، ولدنا سيئي الحظ. الإجابة المنطقية على لغز المسار الأبطأ Slower Lane «انظر[8] و[9] » هي أن هذا المسار هو بالضبط المسار الذي يجب أن نتوقع أن نكون فيه!
عندما يخفق الحدس، يمكننا دائمًا استخدام الاحتمالات والإحصاءات للبحث عن الإجابات الحقيقية.