الفصل العاشر

قانون الأرقام الصغيرة

تكشف دراسة عن عدد حالات الإصابة بسرطان الكلى في ٣١٤١ مقاطعة في الولايات المتحدة عن نمط لافت؛ فالمقاطعات ذات المعدل الأقل في الإصابة بسرطان الكلى في معظمها هي تلك الريفية قليلة السكان، وتقع في ولايات مناصرة للجمهوريين بشكل عام في الغرب الأوسط، وفي الجنوب، وفي الغرب. ماذا تستنتج من ذلك؟

كان عقلك نشطًا للغاية في الثواني القليلة الأخيرة، وكان النظام ٢ هو النظام الذي يعمل بصورة أساسية. بحثت في ذاكرتك واعيًا وصغت الفرضيات. كان هناك بعض الجهد المبذول. اتسعت حدقة عينيك، وتزايد معدل ضربات قلبك كثيرًا. في المقابل، لم يكن النظام ١ عاطلًا عن النشاط؛ فقد اعتمد عمل النظام ٢ على الحقائق والاقتراحات المسترجعة من الذاكرة الترابطية. ربما رفضت فكرة أن سياسات الجمهوريين توفِّر الحماية ضد الإصابة بسرطان الكلى. من المحتمل للغاية أنك انتهى بك المطاف بالتركيز على حقيقة أن المقاطعات التي توجد بها معدلات منخفضة للإصابة بسرطان الكلى تعتبر في معظمها ريفية. علَّق عالما الإحصاء الفَطِنان هوارد وينر وهاريس زورلنج، اللذان استقيت منهما هذا المثال، على ذلك قائلين: «من السهولة بمكان، بل من المغري أيضًا، استنباط أن معدلات الإصابة المنخفضة بالسرطان إنما ترجع مباشرةً إلى الحياة النظيفة المتوفرة في أسلوب الحياة الريفي؛ فلا يوجد تلوث جوي، ولا تلوث مائي، ويمكن الحصول على أطعمة طازجة دون إضافات.» يبدو هذا منطقيًّا تمامًا.

انظر الآن إلى المقاطعات التي تعتبر معدلات الإصابة بالسرطان فيها الأعلى. تميل هذه المقاطعات المريضة إلى أن تكون ريفية في معظمها، قليلة السكان، وتقع في ولايات مناصرة للجمهوريين بشكل عام في الغرب الأوسط، وفي الجنوب، وفي الغرب. في سخرية، يعلق وينر وزورلنج على ذلك قائلين: «من السهولة بمكان استنباط أن معدلات الإصابة المرتفعة بالسرطان إنما ترجع مباشرةً إلى فقر أسلوب الحياة في المناطق الريفية؛ فلا يجري الحصول على رعاية طبية جيدة، كما تتضمن الوجبات نسبة عالية من الدهون، فضلًا عن شرب كميات كبيرة من الكحول والتبغ.» بالطبع، هناك شيء خطأ. لا يستطيع أسلوب الحياة في المناطق الريفية تقديم تفسير لمعدلات الإصابة المرتفعة والمنخفضة جدًّا معًا بسرطان الكلى.

لا يتمثل العامل الرئيسي هنا في أن المقاطعات كانت ريفية أو جمهورية في معظمها؛ بل في أن المقاطعات الريفية تضم أعدادًا صغيرة من السكان. ولا يدور الدرس الرئيسي الذي نتعلمه هنا حول علم الأوبئة، بل حول العلاقة الصعبة بين عقولنا وعلم الإحصاء. يبرع النظام ١ كثيرًا في أحد أشكال التفكير؛ فهو يحدد آليًّا ودون جهد الصلات السببية بين الأحداث، وفي بعض الأحيان حتى عندما تكون الصلات واهية. عندما يُقال لك عن المقاطعات التي تزداد فيها معدلات الإصابة، تفترض في الحال أن هذه المقاطعات مختلفة عن المقاطعات الأخرى لسبب ما، وأن ثمة سببًا لا شك يفسِّر هذا الاختلاف. في المقابل، مثلما سنرى، لا يبرع النظام ١ على الإطلاق عندما يواجه حقائق «إحصائية محضة»، التي تغير احتمالية وقوع النتائج لكنها لا تتسبب في حدوثها.

بطبيعة الحال ليست الحادثة العشوائية الواحدة سهلة التفسير، لكن من الممكن لمجموعات من الأحداث العشوائية أن تسير على نحو منتظم إلى حد كبير. تخيَّل إناءً كبيرًا يحتوي على كرات، نصفها أحمر، والنصف الآخر أبيض. ثم، تخيَّل شخصًا صبورًا للغاية (أو روبوتًا) يسحب دون أن ينظر أربع كرات من الإناء، ويسجِّل عدد الكرات الحمراء في العينة، ويلقي الكرات في الإناء مرة أخرى، ثم يكرر ذلك مجددًا، مرات عدة. إذا لخَّصت النتائج، فستجد أن النتيجة «كرتان حمراوان، وكرتان بيضاوان» تحدث (تقريبًا) ست مرات أكثر من نتيجة «أربع كرات حمراء» أو «أربع كرات بيضاء». تمثل هذه العلاقة حقيقة رياضية. تستطيع توقع نتيجة أخذ عينات متكررة من إناء على نفس القدر من الثقة مثلما تتوقع ماذا سيحدث إذا ضربت بيضة بمطرقة. بينما لا يمكنك توقع جميع تفاصيل كسر قشرة البيضة، يمكنك أن تتأكد من الفكرة العامة. هناك فرق: يغيب شعور الرضاء في وجود علاقة سببية عندما تمر بخبرة التفكير في مطرقة تضرب بيضة تمامًا عندما تفكر في عملية أخذ العينات.

ترتبط حقيقة إحصائية بمثال السرطان. من الإناء نفسه، يتبادل شخصان صبوران للغاية الأدوار في عد الكرات. بينما يسحب جاك أربع كرات في كل مرة، تسحب جيل سبع كرات. يسجل كلاهما في كل مرة أنهما يلاحظان عينة متجانسة، جميعها أبيض أو جميعها أحمر. إذا أمضى جاك وجيل وقتًا أطول، فسيلاحظ جاك نتائج شديدة التطرف أكثر من جيل، بمعامل ٨ (النسب المتوقعة هي ١٢٫٥٪ و١٫٥٦٪). مرة أخرى، لا توجد مطرقة، ولا علاقة سببية، بل توجد حقيقة رياضية. يؤدي أخذ عينة من أربع كرات إلى نتائج متطرفة أكثر من أخذ عينة تتكون من سبع كرات.

تخيَّل الآن سكان الولايات المتحدة باعتبارهم يمثلون كرات في إناء كبير. بعض الكرات عليها رمزان يشيران إلى سرطان الكلى. تسحب عينات من الكرات وتملأ كل مقاطعة بالسكان بناءً على ذلك. العينات الريفية أقل عددًا من العينات الأخرى. مثلما في لعبة جاك وجيل، تعتبر النتائج المتطرفة (معدلات الإصابة المرتفعة جدًّا/المنخفضة جدًّا بالسرطان) أكثر احتمالًا في وجودها في المقاطعات الأقل سكانًا. هذا هو كل ما هناك في القصة.

بدأنا من حقيقة تستدعي سببًا؛ يختلف وقوع حالات الإصابة بسرطان الكلى بصورة واسعة عبر المقاطعات، وهي اختلافات منهجية. يعتبر التفسير الذي قدمته إحصائيًّا. توجد النتائج المتطرفة (المرتفعة والمنخفضة على حد سواء) على نحو محتمل أكثر في العينات الصغيرة منها في العينات الكبيرة. ليس هذا التفسير سببيًّا. بينما لا يسبب أو يمنع التعداد الصغير للسكان في إحدى المقاطعات الإصابة بالسرطان، فهو يسمح فقط بوجود حالات إصابة بالسرطان بمعدلات أعلى (أو أقل) بكثير من معدلات وقوعها في عينة سكانية أكبر. لعل الحقيقة الأعمق تتمثل في عدم وجود شيء لتفسيره. لا تحدث حالات إصابة بالسرطان في واقع الأمر بمعدلات أكثر أو أقل من المعدل الطبيعي في مقاطعة ما عدد سكانها صغير؛ بل تبدو هذه المعدلات أكبر أو أصغر في سنة معينة لأنها مسألة مردها العينة نفسها. إذا كررنا التحليل في العام التالي، فبينما سنلاحظ النمط العام نفسه للنتائج المتطرفة في العينات الصغيرة، لن تكون معدلات الإصابة بالسرطان مرتفعة هذا العام بالضرورة في المقاطعات التي كان السرطان شائعًا فيها العام الماضي. إذا كان هذا هو الحال، فلا تعتبر الفروق بين المقاطعات الكثيفة السكان والمقاطعات الريفية حقائق، بل ما يطلق عليه العلماء النتائج المصطنعة، وهي ملاحظات تنشأ بصورة كاملة من خلال جانب ما من جوانب أسلوب بحثي؛ في هذه الحالة، من خلال الفروق في حجم عينة البحث.

ربما أدهشتك القصة التي أخبرتك إياها، لكن لم يكن ذلك كشفًا. فأنت تعلم منذ وقت طويل أن نتائج العينات الكبيرة تستحق ثقة أكثر فيها من العينات الأصغر، وحتى أولئك الأشخاص الذين لا يعلمون كثيرًا عن علم الإحصاء سمعوا عن قانون الأرقام الكبيرة هذا. لكن ليست المعرفة مسألة قبول أو رفض، وربما تجد أن العبارات التالية تنطبق عليك:

لا يبرز ملمح «قليل السكان» على الفور باعتباره ملمحًا ذا صلة عند قراءتك قصة الإصابة بمرض السرطان.
دُهشت على الأقل قليلًا بسبب حجم الاختلاف بين عينات تتكون من أربع كرات وعينات تتألف من سبع كرات.
حتى الآن، يجب أن تبذل بعض الجهد العقلي للتأكد من أن العبارتين التاليتين تشيران إلى المعنى نفسه تمامًا:
- العينات الكبيرة أكثر دقة من العينات الصغيرة.
- تفرز العينات الصغيرة نتائج متطرفة أكثر من العينات الكبيرة عادةً.

بينما يوجد شيء من الحقيقة في العبارة الأولى، فإنك لا تفهمها بالكامل إلا إذا فهمت العبارة الثانية بشكل حدسي.

خلاصة الأمر: بينما كنت تعلم أن نتائج العينات الكبيرة أكثر دقة، ربما تدرك الآن أنك لم تكن تعلم ذلك جيدًا. إنك لست وحدك. أظهرت الدراسة التي أجريتها أنا وعاموس معًا أنه حتى الباحثون ذوو المهارات المتطورة يمتلكون أفكارًا حدسية غير متطورة وفهمًا غير متزن لآثار أخذ العينات.

قانون الأرقام الصغيرة

بدأ تعاوني مع عاموس في بدايات السبعينيات من القرن العشرين من خلال مناقشة ادعاء أن الأشخاص الذين لم يتلقوا تدريبًا في علم الإحصاء يعتبرون «علماء إحصاء حدسيين» جيدين. أخبرني عاموس مثلما أخبر طلابي عن باحثين في جامعة ميشيجان كانوا متفائلين بصورة عامة حول الإحصاء الحدسي. كان رأيي مخالفًا تمامًا لذلك الادعاء، وهو ما جعلني آخذ الأمر على محمل شخصي. كنت قد اكتشفت حديثًا أنني لم أكن إحصائيًّا حدسيًّا جيدًا، ولم أكن أعتقد أنني أسوأ من الآخرين.

بالنسبة إلى عالم نفس باحث، ليس الاختلاف في أخذ العينات مسألة مثيرة للاهتمام، بل عبء ثقيل وعقبة مكلفة، يتحول معها كل مشروع بحثي إلى مقامرة. هب أنك تريد تأكيد الفرضية القائلة إن مفردات فتاة تبلغ من العمر ستة أعوام أكثر من مفردات صبي في العمر نفسه. تعتبر الفرضية صحيحة في إطار مجتمع العينة؛ إذ يعتبر متوسط مفردات الفتيات أكبر من متوسط مفردات الصبية. في المقابل، تختلف الفتيات والصبية كثيرًا، ومن خلال الصدفة قد يمكنك اختيار عينة لا يعتبر فيها الفرق بين الفتيات والصبية حاسمًا، أو قد تختار عينة قد يسجل الصبية فيها معدلات أعلى من الفتيات. إذا كنت باحثًا، فستعتبر هذه النتيجة مكلفة؛ نظرًا لأنك أهدرت الوقت والجهد، كما عجزت عن تأكيد فرضية كانت صحيحة في واقع الأمر. يعتبر الاستعانة بعينة كبيرة بما يكفي الطريق الوحيد لتقليل المخاطر. يترك الباحثون الذين يجمعون عينات صغيرة للغاية أنفسهم تحت رحمة الصدفة.

يمكن حساب مخاطر الخطأ بالنسبة لأي حجم عينة محدد من خلال إجراء بسيط للغاية. تقليديًّا، لا يُجري علماء النفس الحسابات لاتخاذ قرار بشأن حجم عينة، بل يركنون إلى حكمهم، الذي يُعتبر عادة قاصرًا. أظهر بحث كنت قد قرأته قبل وقت قصير من نقاشي مع عاموس الخطأ الذي ارتكبه (ولا يزال يرتكبه) الباحثون من خلال ملاحظة لافتة. أشار صاحب البحث إلى أن علماء النفس يختارون عادةً عينات صغيرة للغاية؛ ما كان يعرضهم لخطر الفشل بنسبة ٥٠٪ في تأكيد فرضياتهم الصحيحة! لن يقبل باحث في كامل لياقته العقلية اتخاذ مثل هذه المخاطرة. كان أحد التفسيرات المقنعة لذلك هو أن قرارات علماء النفس بشأن حجم العينات كانت تعكس المفاهيم الخاطئة الحدسية السائدة حول درجة التباين في أخذ العينات.

صدمني البحث؛ نظرًا لأنه كان يفسِّر بعض المشكلات التي كنت أواجهها في بحوثي. فمثل معظم علماء النفس الباحثين، كنت عادةً أختار عينات صغيرة للغاية، وكنت أحصل على نتائج لم يكن لها أي معنى. عرفت الآن سبب ذلك. كانت النتائج العجيبة في حقيقة الأمر مجرد نتائج مصطنعة لأسلوب البحث الذي اعتمدته. كان خطئي باعثًا على الحرج على وجه الخصوص؛ نظرًا لأنني كنت أدرِّس الإحصاء وكنت أعلم طريقة حساب حجم العينات التي تقلل من مخاطر الفشل إلى مستوى مقبول. إلا أنني لم أختر قط حجم عينة من خلال إجراء عمليات حسابية. مثل زملائي، كنت أثق في التقاليد البحثية وفي حدسي في التخطيط لتجاربي، ولم أفكر أبدًا من قبل بجدية في الموضوع. عندما زار عاموس طلابي في الصف، كنت قد توصلت إلى نتيجة خلاصتها أن حدسي قاصر، وخلال المناقشة توصلنا سريعًا إلى اتفاق حول خطأ الباحثين المتفائلين في جامعة ميشيجان.

انطلقت أنا وعاموس في بحث ما إذا كنتُ أنا المخطئ الوحيد، أو ما إذا كنت واحدًا فقط ضمن أغلبية من المخطئين، من خلال التأكد مما إذا كان الباحثون الذين جرى اختيارهم نظرًا لخبرتهم الرياضية سيصنعون أخطاء مشابهة. وضعنا استقصاءً تضمن مواقف بحثية واقعية، بما في ذلك تجارب تكرارية لتجارب ناجحة. طُلب من الباحثين في الاستقصاء تحديد حجم عينات، وتقييم مخاطر الفشل التي تعرضهم قراراتهم لها، وتقديم مشورة لطلاب دراسات عليا مفترضين يخططون لإجراء بحوثهم. جمع عاموس إجابات مجموعة من المشاركين أصحاب الخبرة (بما في ذلك مؤلفو كتابين دراسيين في علم الإحصاء) خلال أحد الاجتماعات.

أطلقت أنا وعاموس على بحثنا المشترك الأول عنوان «الاعتقاد في قانون الأرقام الصغيرة». أشرنا، ساخرين، إلى أن «الحدس حيال عملية أخذ العينات العشوائي يبدو أنه يحقق قانون الأرقام الصغيرة، الذي يشير إلى أن قانون الأرقام الكبيرة ينطبق أيضًا على الأرقام الصغيرة.» طرحنا توصية قوية العبارات أيضًا مفادها أن الباحثين يجب عليهم النظر إلى «الحدس الإحصائي بعين الشك، وأن عليهم استبدال إجراء عمليات حسابية بعملية تكوين الانطباعات متى كان ذلك ممكنًا.»

انحياز تفضيل الثقة على الشك

في استطلاع للرأي عبر الهاتف لعدد ٣٠٠ من كبار السن، أبدى ٦٠٪ منهم دعمهم للرئيس.

إذا كان يجب عليك تلخيص رسالة هذه الجملة في ثلاث كلمات بالضبط، فماذا ستكون هذه الكلمات؟ ربما ستختار تقريبًا كلمات «يساند الكبار الرئيس». تمثِّل هذه الكلمات جوهر القصة. ليست تفاصيل الاستطلاع الأخرى — أن الاستطلاع أُجري عبر الهاتف باستخدام عينة مكونة من ٣٠٠ شخص — مهمة في ذاتها؛ إذ توفِّر خلفية تجذب قليلًا من الانتباه فقط. سيكون ملخصك هو نفسه إذا كان حجم العينة مختلفًا. بالطبع، سيجذب رقم خيالي انتباهك («استطلاع رأي عبر الهاتف لستة ملايين [أو ستين مليون] مصوِّت من كبار السن …») في المقابل، ربما لن يختلف رد فعلك كثيرًا إزاء عينة من ١٥٠ شخصًا وعينة من ٣٠٠٠ شخص، اللهم إلا إذا كنت متخصصًا، وهو معنى عبارة «لا يهتم الأشخاص بشكل كبير بحجم العينات».

تتضمن الرسالة حول الاستطلاع معلومات من نوعين: القصة ومصدر القصة. بداهةً، إنك تركِّز على القصة أكثر من موثوقية النتائج. في المقابل، عندما تكون الموثوقية منخفضة للغاية، فلن تتمتع القصة بالمصداقية. إذا قيل لك: «أجرت جماعة مناصرة لحزب الرئيس استطلاعًا قاصرًا ومنحازًا لإظهار أن كبار السن يؤيدون الرئيس …» فسترفض نتائج الاستطلاع بالطبع، ولن تصدقها. في المقابل، سيصبح الاستطلاع الحزبي ونتائجه المزيفة قصة جديدة حول الأكاذيب السياسية. بينما يمكنك أن تختار ألا تصدق رسالة ما في مثل هذه الحالات الجلية، هل تفرِّق بما يكفي بين «قرأت في صحيفة نيويورك تايمز …» و«سمعت عند مبرد المياه …»؟ هل يستطيع النظام ١ الخاص بك التمييز بين درجات التصديق؟ يشير مبدأ «ما تراه هو كل ما هناك» إلى أن ذلك غير ممكن.

مثلما أشرت سابقًا، لا يميل النظام ١ إلى الشك. يقمع النظام ١ الغموض ويبني تلقائيًّا قصصًا متماسكة قدر الإمكان. ستنتشر العلاقات الترابطية التي تثيرها الرسالة كما لو كانت صحيحة، إلا إذا جرى نفي الرسالة في الحال. يستطيع النظام ٢ ممارسة الشك؛ نظرًا لأنه يمكنه أن يحتفظ بإمكانات غير متوافقة في الوقت نفسه. في المقابل، تعتبر عملية مواصلة الشك أصعب من الانزلاق إلى مجال اليقين. يعتبر قانون الأرقام الصغيرة أحد تجليات انحياز عام يفضِّل اليقين على الشك، وهو ما سيظهر في أكثر من شكل في الفصول التالية.

يعتبر الانحياز القوي تجاه الاعتقاد بأن العينات الصغيرة تشبه كثيرًا المجتمع الذي جرى أخذ العينة منه؛ جزءًا أيضًا من قصة أكبر. فنحن نميل إلى المبالغة في اتساق وتماسك ما نرى. يشبه الإيمان المبالغ فيه من جانب الباحثين فيما يمكن تعلمه من بضع ملاحظات بشكل كبير؛ تأثير الهالة، وهو الشعور بأننا نعرف ونفهم شخصًا لا نعرف عنه في الواقع إلا قليلًا جدًّا. يسبق النظام ١ الحقائق في بناء صورة ثرية بناءً على شذرات من الأدلة. ستعمل آلية القفز إلى النتائج كما لو كانت تؤمن بقانون الأرقام الصغيرة. عمومًا، ستولد تمثيلًا للواقع منطقيًّا أكثر.

السبب والصدفة

تبحث آلية التداعي عن الأسباب. وتتمثل الصعوبة التي نواجهها مع النتائج الإحصائية المتسقة في أنها تستدعي اللجوء إلى أسلوب تناول مختلف. فبدلًا من التركيز على كيفية وقوع حدث قائم، تُرجع الرؤية الإحصائية الواقعة إلى ما كان بالإمكان أن يحدث بدلًا منها. لم يتسبب شيء على وجه الخصوص في أن تكون الواقعة على ما هي عليه؛ إذ انتخبتها الصدفة من بين بدائلها.

يعرضنا ميلنا للتفكير السببي إلى ارتكاب أخطاء كبيرة في تقييم عشوائية الأحداث العشوائية حقًّا. على سبيل المثال، خذ جنس ستة أطفال رُضَّع وُلدوا تتابعيًّا في أحد المستشفيات. يعتبر تتابع ميلاد الأولاد والبنات عشوائيًّا بداهةً؛ فلا تعتمد أحداث ميلاد الأطفال بعضها على بعض، ولا يؤثر عدد الأولاد والبنات الذين ولدوا في المستشفى في الساعات القليلة الماضية أيًّا كان على جنس الطفل التالي. خذ الآن هذه المتواليات الثلاثة الممكنة:

و و و ب ب ب

ب ب ب ب ب ب

و ب و و ب و

هل تعتبر هذه المتواليات محتملة فعلًا؟ الإجابة الحدسية — بالطبع لا! — خاطئة. نظرًا لأن أحداث الميلاد لا يعتمد بعضها على بعض، ونظرًا لأن نتائج ميلاد الأولاد والبنات تتساوى (تقريبًا) في احتمال وقوعها؛ تتساوى أي متوالية ممكنة لأحداث الميلاد الستة مع أي متوالية أخرى. على الرغم من معرفتك بصحة هذا الاستنتاج، يظل استنتاجًا مضادًّا للحدس؛ نظرًا لأن المتوالية الثالثة فقط هي التي تبدو عشوائية. مثلما كان متوقعًا، يجري اعتبار المتوالية «و ب و و ب و» أكثر احتمالًا في وقوعها من المتواليتين الأخريين. نحن كائنات تبحث عن أنماط، كائنات تؤمن بوجود تماسك في العالم، لا تظهر الأنماط المتكررة فيه (مثل متوالية مكونة من ست بنات) بالمصادفة فقط، بل تعتبر نتاج عملية سببية آلية أو نية أحد الأشخاص. فنحن لا نتوقع أن نرى أنماطًا متكررة تنشأ عن عملية عشوائية، وعندما نكتشف ما يبدو أنه قاعدة، نرفض سريعًا فكرة أن العملية عشوائية حقًّا. تُصدِر العمليات العشوائية متواليات كثيرة تُقنع الناس بأن العملية ليست عشوائية على أي حال. ربما ترى لماذا كان لافتراض وجود السببية ميزة تطورية. تعتبر السببية جزءًا من اليقظة العامة التي ورثناها عن أسلافنا. نظل بصورة آلية في حالة ترقب لإمكانية تغيُّر البيئة من حولنا. بينما قد تظهر الأسود في البرية في أوقات عشوائية، سيكون من الأكثر أمنًا ملاحظة والاستجابة لوجود زيادة ظاهرية في معدلات ظهور جماعات من الأسود، حتى لو كان ذلك يرجع بالفعل إلى تأرجح عملية عشوائية.

يترتب على سوء الفهم الشائع للعشوائية في بعض الأحيان آثار كبيرة. في بحثنا حول التمثيلية، أشرنا أنا وعاموس إلى عالم الإحصاء ويليام فيلر، الذي بيَّن السهولة التي يرى الأشخاص من خلالها الأنماط المتكررة فيما لا توجد أي أنماط متكررة. أثناء عملية القصف الصاروخي الكثيفة للندن في الحرب العالمية الثانية، كان يُعتقد عمومًا أن عملية القصف لم تكن عشوائية؛ نظرًا لوجود خريطة بأماكن القصف كشفت عن وجود فراغات لافتة بين أماكن القصف. اعتقد البعض أن الجواسيس الألمان كانوا موجودين في المواقع التي لم تُضرب. كشف تحليل إحصائي متأنٍّ أن توزيع الضربات كان نموذجًا لما يحدث في أي عملية عشوائية، كما كان نموذجيًّا أيضًا في إثارة انطباع قوي بأن عملية القصف لم تكن عشوائية. يقول فيلر: «بالنسبة إلى العين غير المدربة، تبدو العشوائية كما لو كانت نمطًا متكررًا أو ميلًا للارتباط.»

سرعان ما سنحت لي فرصة لتطبيق ما تعلمته من فيلر. نشبت حرب أكتوبر في عام ١٩٧٣، وكانت مساهمتي في جهود الحرب تتمثل في تقديم المشورة إلى عدد من كبار الضباط في القوات الجوية الإسرائيلية للتوقف عن إجراء تحقيق. سارت الحرب في البداية على نحو غاية في السوء بالنسبة إلى إسرائيل؛ نظرًا للأداء الجيد غير المتوقع لصواريخ أرض-جو المصرية. كانت الخسائر كبيرة، وبدت غير متساوية التوزيع. قيل لي إن سربي طائرات انطلقا من القاعدة الجوية نفسها، خسر أحدهما أربع طائرات فيما لم يخسر السرب الآخر أي طائرة. أُجري تحقيق أملًا في معرفة ما أخطأ فيه السرب المكلوب. بينما لم يوجد سبب مسبق للاعتقاد بأن أحد السربين كان أكثر كفاءة من السرب الآخر، كما لم توجد أي اختلافات في عمليات كل منهما، اختلفت بالفعل حياة الطيارين بأكثر من طريقة عشوائية، بما في ذلك، مثلما أذكر، عدد المرات التي ذهب فيها الطيارون إلى منازلهم بين المهام وشيء آخر حول الاستعدادات. كانت مشورتي أن القيادة يجب أن تتقبل أن النتائج المختلفة إنما ترجع إلى الحظ المحض، وأن إجراء مقابلات مع الطيارين للتحقيق معهم يجب أن يتوقف. عللت ذلك بأن الحظ هو الإجابة الأكثر احتمالًا، وأن البحث العشوائي عن سبب غير ظاهر لا رجاء فيه، وأنه في الوقت نفسه لا داعي أن يشعر الطيارون في السرب الذي وقعت فيه خسائر بوطأة الشعور بأنهم وأصدقاءهم كانوا مخطئين.

بعدها بسنوات، تسبب عاموس وطالباه توم جيلوفيتش وروبرت فالون في إحداث ضجة من خلال دراستهم حول حالات سوء إدراك العشوائية في لعبة كرة السلة. تعتبر «حقيقة» أن لاعبي كرة السلة يكونون محظوظين بشكل أكبر في أيام معينة أمرًا مقبولًا لدى اللاعبين، والمدربين، والمشجعين. يعتبر هذا الاستدلال مغريًا: يُحرز أحد اللاعبين نقاطًا بشكل متتابع ولا تستطيع الحيلولة دون تكوين حكم سببي بأن هذا اللاعب محظوظ اليوم، مع ميل متزايد ومؤقت للتسجيل. يتكيف اللاعبون في كلا الفريقين مع هذا الرأي. يميل زملاؤه في الفرقة إلى تمرير الكرة إليه، بينما يميل دفاع الفريق الآخر إلى مضاعفة الرقابة عليه. أفضى تحليل آلاف المتواليات من الرميات إلى نتيجة محبطة؛ لا يوجد شيء اسمه يوم حظ لأحد لاعبي كرة السلة المحترفين، سواء في تصويب الكرة من أنحاء الملعب أو في التسجيل من الرميات الحرة. بالطبع، بينما يكون بعض اللاعبين أكثر دقة من الآخرين، تفي متتاليات الرميات الناجحة والفاشلة بجميع اختبارات العشوائية. لا يوجد يوم الحظ إلا في أعين الناظرين، الذين يسارعون بانتظام إلى ملاحظة الترتيب والسببية في العشوائية. يعتبر يوم الحظ وهمًا إدراكيًّا هائلًا ومنتشرًا.

يعتبر رد الفعل العام تجاه هذا البحث جزءًا من القصة. التقطت الصحافة نتائج البحث نظرًا لغرابتها، وكان رد الفعل هو عدم التصديق. عندما سمع المدرب الشهير لفريق بوسطن سلتيكس، ريد أورباك، عن جيلوفيتش ودراسته، أجاب قائلًا: «من هذا الرجل؟ لقد أجرى دراسة، وماذا في هذا؟ لا أعبأ على الإطلاق بما يقول.» يعتبر الميل لملاحظة وجود أنماط متكررة في العشوائية مسألة طاغية، أكثر تأثيرًا من رجل يجري دراسة.

يؤثر وهم وجود أنماط متكررة على حياتنا بطرق عديدة بعيدًا عن ملاعب كرة السلة. كم من سنوات النجاح يجب أن تنتظر قبل الوصول إلى قناعة بأن أحد المستشارين الاستثماريين ماهر بشكل غير عادي؟ كم عدد الاستحواذات الناجحة اللازمة حتى يقرر مجلس الإدارة أن رئيس المجلس لديه حنكة استثنائية فيما يتعلق بمثل هذه الصفقات؟ تتمثل الإجابة البسيطة عن هذه الأسئلة في أنك إذا سرت خلف حدسك، فستخطئ كثيرًا عن طريق إساءة تصنيف أحد الأحداث العشوائية باعتباره حدثًا منهجيًّا. فنحن نرغب كثيرًا في رفض الاعتقاد بأن معظم ما نراه في الحياة عشوائي.

بدأتُ هذا الفصل بمثال حول حالات الإصابة بالسرطان في الولايات المتحدة. يظهر المثال في كتاب موجه إلى معلمي الإحصاء، لكنني عرفت به من خلال بحث ممتع قام به عالما الإحصاء اللذان أشرت إليهما قبلًا، هوارد وينر وهاريس زورلنج. ركَّز هذا البحث على استثمار مبلغ ضخم، حوالي ١٫٧ مليار دولار أمريكي، منحته مؤسسة جيتس لمتابعة النتائج المثيرة حول خصائص أكثر المدارس نجاحًا. سعى الكثير من الباحثين وراء سر التعليم الناجح من خلال تحديد أكثر المدارس نجاحًا؛ أملًا في اكتشاف ما يميزها عن المدارس الأخرى. تتمثل إحدى نتائج هذا البحث في أن أكثر المدارس نجاحًا، في المتوسط، حجمها صغير. في استقصاء شمل ١٦٦٢ مدرسة في بنسلفانيا، على سبيل المثال، كانت ست مدارس صغيرة الحجم من بين أفضل ٥٠ مدرسة، وهو ما يشير إلى عملية تمثيل زائدة بمعامل ٤. شجعت هذه البيانات مؤسسة جيتس على استثمار أموال ضخمة في إنشاء مدارس صغيرة، في بعض الأحيان من خلال تقسيم المدارس الكبيرة إلى وحدات أصغر. انضم عدد من المؤسسات البارزة الأخرى، مثل مؤسسة أنينبرج ومؤسسة بيو الخيرية، إلى مؤسسة جيتس، مثلما فعل برنامج التجمعات التعليمية الأصغر التابع لوزارة التعليم الأمريكية.

ربما يعتبر ذلك مقنعًا حدسيًّا بالنسبة إليك. من السهولة بمكان بناء قصة سببية تفسِّر كيف تستطيع مدارس صغيرة توفير تعليم راقٍ، ومن ثم تخريج علماء مرتفعي الأداء، من خلال منحهم المزيد من الاهتمام الشخصي والتشجيع أكثر مما قد يستطيعون الحصول عليه في مدارس أكبر حجمًا. لسوء الحظ، يعتبر التحليل السببي بلا قيمة؛ نظرًا لعدم صحة الحقائق. لو كان الإحصائيون الذين قدموا نتائجهم إلى مؤسسة جيتس سألوا عن خصائص أسوأ المدارس، فربما كانوا سيجدون أن المدارس السيئة أيضًا تميل إلى أن تكون أصغر في حجمها من المتوسط. حقيقة الأمر أن المدارس الصغيرة ليست أفضل في المتوسط، بل هي ببساطة أكثر شذوذًا عن المتوسط. إذا كان في الأمر معنى، مثلما يرى وينر وزورلنج، تميل المدارس الكبيرة إلى إنتاج نتائج أفضل، خاصة في الصفوف العليا حيثما يكون وجود تنوع في خيارات المناهج أمرًا ذا قيمة.

بفضل التطورات الأخيرة في علم النفس الإدراكي، نرى بوضوح الآن ما استطعت أنا وعاموس أن نلمحه فقط؛ وهو أن قانون الأرقام الصغيرة يعد جزءًا من قصتين أكبر تدوران حول آليات عمل العقل:

يعتبر الاعتقاد المبالغ فيه في أهمية العينات الصغيرة مجرد مثال واحد على وهم أكثر عمومية؛ وهو أننا نولي مزيدًا من الانتباه إلى محتوى الرسائل أكثر من المعلومات حول مصداقيتها؛ وبناءً عليه ينتهي بنا المطاف إلى رؤية للعالم حولنا أكثر بساطة وتماسكًا مما تبرر البيانات نفسها. فالقفز إلى النتائج رياضة أكثر أمانًا في عالم من صنع خيالنا مما هي عليه في الواقع.
يقدِّم علم الإحصاء العديد من الملاحظات التي بينما يبدو أنها تتطلب وجود تفسيرات سببية لها، لكنها لا تخضع بالفعل لمثل هذه التفسيرات. ترجع العديد من الحقائق في العالم إلى المصادفة، بما في ذلك عمليات أخذ العينات. تعتبر التفسيرات السببية للأحداث التي تقع بالمصادفة خطأ حتمًا.

في الحديث عن قانون الأرقام الصغيرة

«نعم، أنتجت شركة الإنتاج ثلاثة أفلام ناجحة منذ تولي رئيس مجلس الإدارة الجديد المسئولية، لكن من المبكر للغاية إعلان أن رئيس مجلس الإدارة الجديد سيحقق المزيد من النجاحات لاحقًا.»

«لن أصدق أن المضارب الجديد في البورصة شخص عبقري قبل أن أستشير عالم إحصاء يمكنه وضع تقديرات حول احتمالية أن تكون عبقريته مجرد مصادفة.»

«تعتبر عينة الملاحظات صغيرة جدًّا بما يمنعنا من استخلاص أي نتائج. دعنا لا نسير وفق قانون الأرقام الصغيرة.»

«أخطط للاحتفاظ بنتائج التجربة سرية حتى نحصل على عينة أكبر بما يكفي، وإلا فسنواجه ضغطًا للوصول إلى نتيجة في وقت مبكر جدًّا.»