آخر تحديث: 28 / 1 / 2022م - 12:28 م

عندما يخفق الحدس، كيف نستخدم الاحتمالات والإحصاءات لنصل إلى إجابات حقيقية

عدنان أحمد الحاجي *

1 أكتوبر 2021

المترجم: عدنان أحمد الحاجي

المقالة رفم 303 لسنة 2021

When intuition fails، how to use probability and statistics to find the real answers

1 October 2021

الكثير من تفكيرنا فاسد لأنه يقوم على حدس خاطئ، كما يقول البروفيسور لايتون فوغان ويليامز Leighton Vaughan Williams. ولكن باستخدام إطار الاحتمالات وأدواتها والإحصاءات، بين البروفسور لايتون كيف يمكننا التغلب على هذه المشكلة لتقديم حلول للعديد من مشاكل ومفارقات العالم الحقيقي.

عندما يتعلق الأمر بحالات كانتظار حافلة، غالبًا ما يكون حدسنا خاطئًا، كما يقول البروفيسور لايتون فوغان ويليامز.

تخيل حافلة تصل إلى محطة الحافلات كل 30 دقيقة في المتوسط وأنت تصل إلى تلك المحطة دون أي فكرة عن متى غادرت الحافلة السابقة لها. كم من الوقت تتوقع أن تنتظر حتى تصل الحافلة التالية؟ حدسيًا، نصف ال 30 دقيقة «أي 15 دقيقة» يبدو هذا صحيحًا من الناحية الحدسية، لكنك ستكون محظوظًا جدًا لو انتظرت فقط مدة مقدارها 15 دقيقة.

لنفترض، على سبيل المثال، أن نصف الوقت الذي تصل فيه الحافلات في فاصل زمني مدته 20 دقيقة ونصف الوقت بفاصل زمني قدره 40 دقيقة. المعدل الإجمالي الآن هو 30 دقيقة. ولكن من وجهة نظرك، فاحتمالية وصولك المحطة خلال فترة الأربعين دقيقة أكثر بمرتين من احتمالية وصولك خلال فترة ال 20 دقيقة.


مفارقة المعاينة هي وهم إحصائي ربما لم تسمع به من قبل. إنه مصدر ارتباك شائع وسبب عرَضي للخطأ وفرصة لتصميم تجريبي ذكي[1] .


هذا صحيح في كل حالة إلا عندما تصل الحافلات بفواصل زمنية محددة مدتها 30 دقيقة. كلما زاد الانتشار dispersion حول متوسط الوقت، كلما زاد مقدار وقت الانتظار المتوقع على متوسط الانتظار. هذه هي ”مفارقة المعاينة / الملاحظة / المراقبة، Inspection Paradox [2]  «انظر المثال في[3] “، التي تنص على أنه عندما تقوم ”بمعاينة“ عملية ما، فمن المحتمل أن تجد أن الأشياء تستغرق «أو تدوم» وقتًا أطول من متوسطها ”غير الملحوظ“. ما يبدو وكأن تمادي سوء حظ هو ببساطة كشف قوانين الاحتمالات والإحصاءات عن مجراها الطبيعي.

بمجرد أن تكون عارفًا «واعيًا» بها، يبدو أن المفارقة موجودة في كل مكان.

على سبيل المثال، لنفترض أنك تريد إجراء مسح استقصائي لمتوسط عدد الطلاب في الصف في احدى الجامعات. لنفترض أن عدد الطلاب في الصف في الجامعة إما 10 أو 50 طالبًا، وهناك عدد متساوٍ من الصفوف فيها هذان الاحتمالان، لذا فإن متوسط عدد طلاب الصف الإجمالي هو 30 طالبًا [المترجم: حاصل جمع 10+50 مقسوم على [3] ]. ولكن عند اختيار طالب بشكل عشوائي / اعتباطي، فمن المحتمل أن يأتي الطالب / ة من صف مكون من 50 طالبًا أكثر من أن يأتي من صف فيه 10 طلاب. لذلك، لكل طالب يرد على استفسارك «في المسح الاستقصائي» ان متوسط عدد طلاب الصف هم ”10 طلاب“، سيكون هناك خمسة طلاب يجيبون بأن هناك ”50 طالبًا“ كمتوسط لعدد طلاب الصف. متوسط عدد طلاب الصف الذي سينتج من الاستطلاع الذي قمت به سيكون أقرب إلى 50 طالبًا، من أن يكون أقرب من 30 طالبًا. 

لذا فإن إجراء معاينة لعدد طلاب الصفوف يزيد بشكل كبير من المتوسط المتحصل عليه مقارنة بالمتوسط الحقيقي لعدد طلاب الصفوف التي لم تتم معاينتها. الحالة الوحيدة التي فيها يتطابق متوسط عدد طلاب الصفوف التي جرت معاينتها مع تلك التي لم تجرى معاينتها هي عندما يكون عدد طلاب الصفوف متساويًا.

بمجرد أن تعرف عن ”مفارقة المعاينة“، فإن محيطنا وإدراكنا الحسي بمكاننا في هذا المحيط لم يعد هو نفسه تمامًا كما كان قبل أن تعي بتلك المفارقة.


لماذا يبدو صف الانتظار الذي أقف فيه أبطأ من صفوف الانتظار الأخرى: مفارقة المعاينة

في يوم آخر تقف في صف لتفحص عن احتمال اصابتك بفيروس [كورونا مثلًا] في إحدى العيادات الطبية. نسبة دقة الفحص تبلغ 99٪ والنتيجة كانت ايجابية [يعني أنك مصاب بالفيروس]. الآن، ما هي احتمالية إصابتك بالفيروس؟ الإجابة البديهية هي 99٪. لكن هل هذه الاجابة صحيحة؟ المعلومات التي نُعطاها تتعلق باحتمال أن تكون نتيجة الفحص إيجابية بشرط أن يكون الشخص مصابًا بالفيروس. ما نريد معرفته، مع ذلك، هو احتمال إصابة الشخص بالفيروس إذا كانت نتيجة الفحص إيجابية. الحدس الشائع يسبب خلطًا «التباسًا» بين هذين الاحتمالين، لكنهما مختلفان تمامًا. هذا مثال على مغالطة الافتراض المعكوس[4]  أو مغالطة المدعي العام[5] .

أهمية نتيجة الفحص تعتمد على احتمالية إصابتك بالفيروس قبل إجراء الفحص. يُعرف هذا بالاحتمال القبلي[6] . بشكل أساس، لدينا مزاحمة بين مدى ندرة الفيروس «الحد الأدنى base rate» ومدى ندرة الخطأ في الفحص. لنفترض أن هناك فرصة قدرها واحد في المائة «فرصة واحدة من كل مائة فرصة»، بناءً على معدلات الانتشار المحلية، أن شخصًا مصاب بالفيروس قبل إجراء الفحص. الآن، تذكر أن نسبة كون الفحص خاطئًا هو واحد في المائة «مرة في كل مائة مرة».

 هذان الاحتمالان متساويان، لذا فإن فرصة إصابته بالفيروس عندما تكون النتيجة إيجابية هي 1 في 2 [أي 50%]، على الرغم من أن الفحص كان دقيقًا بنسبة 99٪. ولكن ماذا لو ظهرت عليه أعراض الفيروس قبل إجراء الفحص؟ في هذه الحالة، يجب علينا تحديث الاحتمال السابق إلى مستوىً أعلى من معدل الانتشار في المجتمع السكاني الذي تم فحصه. احتمالية إصابته بالفيروس حين تكون نتيجة الفحص إيجابية تزداد بنفس النسبة. يمكننا استخدام نظرية بايز Bayes لإجراء العمليات الحسابية[7] .

باختصار، غالبًا ما يخذلنا الحدس. ومع ذلك، بتطبيق طرق الاحتمال والإحصاء، يمكننا تحدي الحدس. يمكننا حتى أن نجد حلًا لما قد يبدو للكثيرين أنه أعظم الأسرار لديهم جميعًا - لماذا يبدو أننا كثيرًا ما نجد أنفسنا عالقين في المسار أو خط الانتظار الأبطأ. حدسيًا، ولدنا سيئي الحظ. الإجابة المنطقية على لغز المسار الأبطأ Slower Lane «انظر[8]  و[9] » هي أن هذا المسار هو بالضبط المسار الذي يجب أن نتوقع أن نكون فيه!

عندما يخفق الحدس، يمكننا دائمًا استخدام الاحتمالات والإحصاءات للبحث عن الإجابات الحقيقية.

مصادر من داخل وخارج النص

[1] - https://towardsdatascience.com/the-inspection-paradox-is-everywhere-2ef1c2e9d709

[2] - http://allendowney.blogspot.com/2015/08/the-inspection-paradox-is-everywhere.html

[3] - مفارقة المعاينة Inspection Paradox: أحد الأمثلة عليها هو المفارقة الواضحة في عدد طلاب الصفوف الدراسية. افترض أنك سألت طلاب الجامعة عن عدد الطلاب في صفوفهم الدراسية، وقمت بحساب متوسط الإجابات. قد تكون النتيجة 56 طالبًا. ولكن لو سألت إدارة الجامعة عن متوسط عدد طلاب الصف، فقد تقول 31 طالبًاً. يبدو أن أحد الطرفين يكذب، لكن يمكن أن يكون كلاهما على حق. هذا ليس بالضرورة خطأ. إذا كنت ترغب في معرفة تجربة الطلاب بصورة كمية، فالمتوسط في كل الطلاب قد يكون ذا مغزى من الناحية الإحصائية أكثر من المتوسط في كل الصفوف الدراسية. لكن عليك أن تكون واضحًا بشأن ما تقيسه وكيف تسجله وتسجله. عندما تقوم باستطلاع آراء الطلاب، فإنك تقوم بالإفراط في أخذ عينات oversampking من الصفوف الكبيرة: لو كان هناك 10 طلاب في الصف، فلديك 10 فرص لأخذ عينة من هذا الصف؛ ولو كان هناك 100 طالب في الصف، فلديك 100 فرصة لأخذ عينة. بشكل عام، إذا كان عدد طلاب الصف هو «س»، فسيُمثل بشكل زائد في العينة بمقدار العامل factor س. " ترجمناه من نص ورد على هذا العنوان:

http://allendowney.blogspot.com/2015/08/the-inspection-paradox-is-everywhere.html

[4] - ”نفي المقدمات، أو ما يعرف أيضًا بالخطأ العكسي أو مغالطة افتراض المعكوس، هي مغالطة منطقية صورية. وهي الاستناد على صحة قول ما كدليل على صحة معكوسه. أو بمعنى آخر، إذا كانت مقدمة معينة تؤدي إلى نتيجة معينة، فالمغالطة هنا هي افتراض غياب النتيجة في حالة عدم صحة المقدمة. وفي العادة تتخذ الصيغة الآتية: إذا كانت س تؤدي إلى ص، إذن فبطلان الشرط س يفضي بالضرورة إلى بطلان ص. وجميع الحجج التي تتخذ مثل هذه الصياغة باطلة. أو بلغة المنطقالصوري، فتلك الحجج ليست قوية بما فيه الكفاية حتى تستند عليها الاستنتاجات المزعومة، حتى لو صحت المقدمات المذكورة“ مقتبس من نص ورد على هذا العنوان:

https://ar.wikipedia.org/wiki/نفي_المقدمات

[5] - ”مغالطة المدعي العام هي مغالطة في الاستدلال الإحصائي الذي ينطوي على اختبار أحد الأحداث، كتطابق الحمض النووي مثلِا [أو تطابق حدثين، مثلا، لم يتصل بي منذ ثلاثة أيام، فلا بد أنه لا يحبني]. من المفارقات أن تكون النتيجة الإيجابية في الاختبار نتيجة خاطئة أكثر من كونها حدوثًا فعليًا، هذه المغالطة يستخدمها المدعي العام عادة للمبالغة في احتمال اتهام المتهم الجنائي بالذنب. وبالمثل، يمكن استخدام المغالطة لدعم مزاعم أخرى أيضًا - بما في ذلك براءة المدعى عليه.“ مستقاة بتصرف من نص ورد على هذا العنوان

https://emirate.wiki/wiki/Prosecutor%27s_fallacy

.

[6] - ”احتمال قبلي «A Priori Probability»: هو الاحتمال الذي يُستنتج قبل تلقي أي معلومات جديدة، معتمداً على الاستدلال الاستنتاجي، أحد أنواع التفكير المنطقي، على سبيل المثال لحساب الاحتمال المسبق لرمي 2 أو 4 أو 6 في النرد، يقسم عدد النتائج المرغوبة 3 على عدد النتائج المحتملة 6، وبذلك تكون النتيجة 50%. بصفة عامة، فإن الاحتمال القبلي يبقى ثابتاً بغض النظر عن الشخص الذي يستنتج الاحتمالات لأنه يعتمد على التفكير الموضوعي، وذلك بعكس الاحتمال الذاتي الذي يختلف من شخص لآخر، بسبب استناده إلى الخبرة أو الحكم الشخصي“ مقتبس من نص ورد على هذا العنوان:

https://hbrarabic.com/المفاهيم - الإدارية/احتمال - قبلي/

[7] - ”في نظرية الاحتمالات والإحصاء، تصف مبرهنة بايز Bayes «التي تعرف أيضا بقانون بايز أو قاعدة بايز» احتمال وقوع حدث، بناءً على المعرفة المسبقة بالظروف التي قد تكون ذات صلة بالحدث. على سبيل المثال، إذا كان السرطان مرتبطًا بالتقدم في العمر، فعند استخدام مبرهنة بايز، يمكن استخدام عمر الشخص لإجراء تقييم لاحتمال إصابته بالسرطان أكثر دقة مما يمكن عمله دون معرفة عمر الشخص. التطبيقات العديدة لمبرهنة بايز هو الاستدلال البايزي Bayesian وهي أحد طرق الاستدلال الإحصائي. عند تطبيق الاستدلال البايزي، قد يكون للاحتمالات التي تنطوي عليها مبرهنة بايز «Bayesian interpretation of probability» مدلول مختلف عن المفهوم التكراري للاحتمالات «Frequentist interpretation of probability». باستخدام التفسير البايزي للاحتمالات «Bayesian interpretation of probability»، فإن النظرية تبين إلى أي درجة يجب أن تتغير درجة اعتقادنا في أمر ما «وهو ما نعبر عنه على شكل احتمال حدوث هذا الأمر» بعد الأخذ في الاعتبار الأدلة الجديدة التي أصبحت متوفرة. لذلك فان الاستدلال البايزي يعد مفهومًا أساسيًا في الإحصاء البايزي.“ مقتبس من نص ورد على هذا العنوان:

https://ar.wikipedia.org/wiki/مبرهنة_بايز

[8] - ”أثناء قيادتك سيارتك على الطريق السريع، هل سبق لك أن تساءلت عن حقيقة أن السيارات في المسار الآخر تبدو أنها أسرع السيارت التي في مسارك؟ قد تفسر ذلك بالتذرع بقانون مورفي «“ لو أن هناك احتمال حدوث عطل ما فسوف يحدث على أي حال ”، الذي اكتشفه إدوارد أ. مورفي جونيور في عام 1949». ومع ذلك، فإن ورقة بحثية حديثة في مجلة Nature ألفها تيبشراني Tibshiran وردينير Redelmeier تسعى إلى تفسير أعمق. وفقًا للمؤلفين، تصيب السائقون أوهام منهجية تجعلهم يعتقدون خطأً أنهم سيكونون أفضل حالًا في المسار الآخر. في الورقة هذه، نوضح أن حجتهم أخفقت في مراعاة تأثير الاختيار المهم «8» - أي أن السيارات في المسار التالي تسير في الواقع بشكل أسرع!“ ترجمناه من نص ورد على هذا العنوان

https://plus.maths.org/content/os/issue17/features/traffic/index

[9] - https://ar.wikipedia.org/wiki/تحيز_الاختيار

المصدر الرئيس

https://www.ntu.ac.uk/about-us/news/news-articles/2021/10/expert-blog-when-intuition-fails، -how-to-use-probability-and-statistics-to-find-the-real-answers