الملحق أ: إصدار الأحكام في ظل عدم اليقين: طرق الاستدلال والانحيازات

عاموس تفرسكي ودانيال كانمان

(نشرت هذه المقالة في الأساس في مجلة «ساينس»، المجلد رقم ١٨٥، في عام ١٩٧٤. وقد تم تنفيذ البحث تحت رعاية وكالة مشروعات الأبحاث المتطورة التابعة لوزارة الدفاع الأمريكية، وتحت رقابة مكتب الأبحاث البحرية الأمريكية بمقتضى عقد رقم N00014-73-C-0438 مع معهد أوريجون للأبحاث في يوجين. كما دُعم البحث من قبل هيئة البحث والتطوير التابعة للجامعة العبرية بالقدس، إسرائيل.)

•••

يُبنى الكثير من القرارات على معتقدات تتعلق باحتمالية وقوع أحداث يحيطها عدم اليقين، مثل نتيجة انتخابات، أو إدانة متهم، أو القيمة المستقبلية للدولار. وعادة ما يتم التعبير عن هذه المعتقدات في عبارات من قبيل: «أعتقد أن …» «من المحتمل أن …» «من غير المحتمل أن …» وما إلى ذلك. في بعض الأحيان يتم التعبير عن المعتقدات المتعلقة بأحداث يحيطها الشك في صيغة عددية كتوقعات أو احتمالات ذاتية. ما الذي يحدد مثل هذه المعتقدات؟ كيف يقيِّم الناس احتمالية وقوع حدث يحيطه الشك أو قيمة كمية مشكوك فيها؟ يوضح هذا المقال أن الناس يعتمدون على عدد محدود من المبادئ الاستدلالية التي تحوِّل المهام المعقدة لتقييم الاحتمالات والتكهن بالقيم إلى عمليات تقييمية أكثر بساطة. وتعد هذه الطرق الاستدلالية مفيدة للغاية بشكل عام، ولكنها أحيانًا ما تؤدي إلى أخطاء بالغة ومنهجية.

يشبه التقييم الذاتي للاحتمال التقييم الذاتي للكميات المادية على غرار المسافة أو الحجم. وهذه الأحكام جميعًا قائمة على بيانات ذات مصداقية محدودة تتم معالجتها وفقًا لقواعد استدلالية. على سبيل المثال، البعد الواضح لأحد الأجسام يتحدد جزئيًّا بمدى وضوحه؛ فكلما كان الشيء منظورًا بشكل حاد وواضح، بدا أقرب. ولهذه القاعدة قدر من المصداقية؛ لأن الأجسام البعيدة في أي مشهد تكون رؤيتها أقل وضوحًا من الأجسام القريبة، إلا أن الاعتماد على هذا المبدأ يؤدي إلى أخطاء منهجية في تقدير المسافات، وعلى الأخص ما يحدث في معظم الأحيان من المبالغة في تقدير المسافة حينما تكون الرؤية ضعيفة لأن الخطوط المحددة للأجسام تُرى مشوشة. وعلى الجانب الآخر يتم تقدير المسافة بأقل من حقيقتها حين تكون الرؤية جيدة لأنه يمكن رؤية الأجسام بوضوح. وهكذا يؤدي الاعتماد على الوضوح كدلالة على المسافة إلى تحيزات شائعة. ويوجد مثل هذه الانحيازات أيضًا في الحكم الحدسي على الاحتمال. ويصف هذا المقال ثلاث طرق استدلالية يتم توظيفها لتقييم الاحتمالات والتنبؤ بالقيم، ويتم تقييم الانحيازات التي تؤدي إليها هذه الاستدلالات عدديًّا، ومناقشة المضامين التطبيقية والنظرية لهذه الملاحظات.

التمثيل

ينتمي الكثير من الأسئلة الاحتمالية التي ينشغل بها الناس لأحد الأنواع التالية: ما مدى احتمالية انتماء الشيء (أ) للفئة (ب)؟ ما مدى احتمالية انبثاق الحدث (أ) من العملية (ب)؟ ما مدى احتمالية أن تُفضي العملية (ب) إلى الحدث (أ)؟ في سياق الإجابة عن مثل هذه الأسئلة، يعتمد الناس عادة على الاستدلال بالتمثيل، الذي تقيَّم فيه الاحتمالات بالدرجة التي يعد بها (أ) تمثيلًا ﻟ (ب)؛ أي بدرجة التشابه بين (أ) و(ب). على سبيل المثال، عندما تكون (أ) تمثيلًا ﻟ (ب) بدرجة كبيرة، تُقدَّر احتمالية أن تكون (أ) منبثقة من (ب) بأنها عالية. على الجانب الآخر، إذا كانت (أ) لا تشبه (ب)، تُقدَّر احتمالية أن تكون (أ) منبثقة من (ب) بأنها منخفضة.

ولمثال توضيحي للحكم أو التقييم بالتمثيل، فكر في شخص وصفه جار سابق له كالتالي: «يتسم ستيف بالخجل والانطواء الشديدين، ودائمًا ما يساعد الآخرين، ولكنه لا يشغل نفسه كثيرًا بالناس أو بعالم الواقع. ولأنه يتصف بالتأنق والحِلم، فإنه يهتم بالنظام والترتيب، وشديد الاهتمام بالتفاصيل.» كيف يقيِّم الناس احتمالية أن يكون ستيف من العاملين في مهنة معينة من بين قائمة من المهن الممكنة (كأن يكون مزارعًا، أو مندوب مبيعات، أو طيارًا، أو أمين مكتبة، أو طبيبًا)؟ كيف يرتب الناس هذه المهن من الأعلى إلى الأقل ترجيحًا؟ في الاستدلال بالتمثيل، تُقيَّم احتمالية أن يكون ستيف أمين مكتبة، على سبيل المثال، بدرجة تمثيله أو قربه من القالب النمطي لأمين المكتبة. والواقع أن الأبحاث الخاصة بالمشكلات من هذا النوع قد أظهرت أن الناس يرتبون المهن بالاحتمالية وبالتشابه على النحو نفسه بالضبط.¹ وهذا النهج في التعامل مع تقييم الاحتمالية يؤدي إلى أخطاء خطيرة؛ لأن التشابه، أو التمثيل، لا يتأثر بعوامل عديدة ينبغي أن تؤثر على تقديرات الاحتمالية.

انعدام الحساسية تجاه الاحتمالية المسبقة للنتائج: من العوامل التي ليس لها تأثير على التمثيل ولكن يفترض أن يكون لها تأثير كبير على الاحتمالية؛ الاحتمالية المسبقة للنتائج، أو الحد الأدنى لتكرارها. في حالة ستيف، على سبيل المثال، ينبغي أن تدخل حقيقة وجود عدد أكبر بكثير من المزارعين مقارنة بأمناء المكتبات ضمن الكتلة السكانية في أي تقدير منطقي لاحتمالية أن يكون ستيف أمين مكتبة وليس مزارعًا. غير أن الاعتبارات الخاصة بالحد الأدنى لتكرار الحدث لا تؤثر على تطابق ستيف مع القوالب النمطية لأمناء المكتبات والمزارعين. ومن ثم فإذا كان الناس يقيِّمون الاحتمال بالتمثيل، فسوف يتم تجاهل الاحتمالات المسبقة. وقد اختُبِرت تلك الفرضية في تجربة تم خلالها التلاعب بالاحتمالات المسبقة؛² فتم إطلاع أفراد التجربة على توصيفات موجزة لشخصية العديد من الأفراد، زُعِمَ أنهم قد اختيروا كعينة عشوائية من بين مجموعة تتكون من ١٠٠ مهني ما بين مهندسين ومحامين. طُلِبَ من أفراد التجربة، لكل وصف، تقييم احتمالية أن يكون خاصًّا بمهندس وليس بمحامٍ. وفي إحدى الحالات التجريبية، أُخبر أفراد التجربة بأن المجموعة التي استمدت منها التوصيفات تألفت من ٧٠ مهندسًا و٣٠ محاميًا. وفي حالة أخرى، أُخبر أفراد التجربة بأن المجموعة تألفت من ٣٠ مهندسًا و٧٠ محاميًا. من المفترض أن يكون احتمال انتساب أي وصف لمهندس وليس لمحامٍ أعلى في الحالة الأولى، حيث توجد أغلبية المهندسين، عنه في الحالة الثانية، حيث توجد أغلبية المحامين. وعلى وجه الخصوص، يمكن من خلال تطبيق قاعدة بايز توضيح أن نسبة هذين الاحتمالين ينبغي أن تكون (٠٫٧ / ٠٫٣)^٢، أو ٥٫٤٤ لكل وصف. ولكن في انتهاك صارخ لقاعدة بايز، أصدر أفراد التجربة في الحالتين نفس أحكام الاحتمالية. وعلى ما يبدو أن تقييم أفراد التجربة لاحتمالية انتساب وصف بعينه لمهندس وليس لمحامٍ جاء وفق درجة تمثيل هذا الوصف للقالبين النمطيين، دون الكثير من الاعتبار أو أي قدر من الاعتبار للاحتمالات المسبقة للفئتين.

لقد استخدم أفراد التجربة الاحتمالات المسبقة بشكل صحيح حين لم يكن لديهم أي معلومات أخرى. ففي غياب وصف للشخصية، كان حكمهم لاحتمال أن يكون شخص ما مجهول مهندسًا يساوي ٠٫٧ و٠٫٣ على التوالي في حالتي الحد الأدنى للتكرار. غير أن الاحتمالات المسبقة تم تجاهلها حين تم تقديم وصف للشخصية، حتى عندما لم يكن هذا الوصف يحمل أي معلومات تمامًا. وتوضح الاستجابات للوصف التالي هذه الظاهرة:

دِك رجل في الثلاثين من عمره. وهو متزوج وليس لديه أطفال. يتعهد هذا الرجل ذو الكفاءة والدافعية العالية أن يكون ناجحًا في مجاله. وهو يحظى بحب زملائه.

أُعدَّ هذا الوصف بحيث لا ينقل أي معلومات متعلقة بمسألة ما إذا كان دِك مهندسًا أم محاميًا؛ وبالتالي يفترض أن تكون احتمالية كون دِك مهندسًا مساويةً لنسبة المهندسين في المجموعة، وكأن وصفًا لم يقدم. غير أن أفراد التجربة قدَّروا أن احتمال كون دِك مهندسًا يساوي ٠٫٥، بغض النظر عما إذا كانت النسبة المعلنة للمهندسين في المجموعة ٠٫٧ أو ٠٫٣. ومن الواضح أن استجابة الناس تختلف عندما لا يُمنحون أي أدلة أو حين يُمنحون أدلة لا قيمة لها؛ فحين لا تقدم أدلة محددة، يستفاد من الاحتمالات المسبقة بشكل صحيح؛ أما عند تقديم أدلة بلا قيمة، يتم تجاهل الاحتمالات المسبقة.³

انعدام الحساسية تجاه حجم العينة: لتقييم احتمالية الحصول على نتيجة بعينها في عينة مستمدة من مجموعة سكانية معينة، عادة ما يطبق الناس الاستدلال بالتمثيل؛ بمعنى أنهم يقيِّمون احتمال نتيجة عينة ما، مثل أن متوسط الطول في عينة عشوائية غالبًا ما سيكون ٦ أقدام بالنسبة للرجال، بدرجة تشابه هذه النتيجة مع المعيار الموازي (أي مع متوسط الطول بين مجموعة الرجال). ولا يعتمد تشابه عينة إحصائية مع معيار مجموعة ما على حجم العينة، وبالتالي إذا كانت الاحتمالات تقيَّم بالتمثيل، فسوف تكون الاحتمالية التي يتم الحكم عليها لعينة عشوائية ما منفصلة بشكل أساسي عن حجم العينة. وبالفعل حين قام أفراد التجربة بتقييم توزيعات متوسط الطول لعينات بأحجام متنوعة، توصلوا إلى توزيعات متطابقة. على سبيل المثال، كان لاحتمالية الحصول على متوسط طول أعلى من ٦ أقدام نفس القيمة لعينات مكونة من ١٠٠٠، و١٠٠، و١٠ رجال.⁴ بالإضافة إلى ذلك، أخفق أفراد التجربة في تقدير دور حجم العينة حتى عندما تم التأكيد عليه في صياغة السؤال. تأمل السؤال التالي:

ثمة مدينة معينة يخدمها مستشفيان. في المستشفى الكبير يولد حوالي ٤٥ طفلًا كل يوم، وفي المستشفى الأصغر يولد حوالي ١٥ طفلًا كل يوم. وكما تعلم، فإن حوالي ٥٠٪ من إجمالي عدد المواليد من الصبية. غير أن النسبة الدقيقة تتغير من يوم لآخر.

في بعض الأحيان قد تكون أعلى من ٥٠٪، وفي أحيان أخرى تكون أقل.

على مدى عام، سجَّل كل مستشفى منهما الأيام التي زادت فيها نسبة الصبية من إجمالي المواليد على ٦٠٪. أيُّ المستشفيين تعتقد أنه قد سجل عددًا أعلى من مثل هذه الأيام؟

المستشفى الكبير (٢١)

المستشفى الأصغر (٢١)

نفس العدد تقريبًا (أي في حدود ٥٪ من أحدهما الآخر) (٥٣)

تمثل القيم التي بين الأقواس عدد الطلاب الجامعيين الذين اختاروا كل إجابة.

قدَّر معظم أفراد التجربة أن احتمالية الحصول على نسبة صبية تزيد على ٦٠٪ ستتساوى في المستشفى الصغير والكبير؛ ربما لأن هذين الحدثين وُصِفا بنفس الإحصائية، ومن ثم يمثلان السكان عامة على نحو متساوٍ. في المقابل، تقضي نظرية اختيار العينات بأن يكون العدد المتوقع للأيام التي تزيد فيها نسبة المواليد من الصبية عن ٦٠٪ أكبر بكثير في المستشفى الصغير عنه في المستشفى الكبير؛ لأن العينة الكبيرة أقل احتمالًا للابتعاد عن ٥٠٪. وهذا المفهوم الأساسي للإحصائيات ليس جزءًا من مستودع بداهات الأفراد بشكل واضح.

وقد أشير إلى انعدام مماثل للحساسية تجاه حجم العينة في أحكام الاحتمالية اللاحقة؛ أي احتمالية أن تكون العينة قد اختِيرت من مجموعة دون الأخرى. تأمل المثال التالي:

تخيل جرَّة مليئة بالكرات، ثلثاها بلون والثلث بلون آخر. قام أحد الأفراد بسحب ٥ كرات من الجرة، ووجد ٤ منها حمراء وواحدة بيضاء. قام فرد آخر بسحب ٢٠ كرة ووجد ١٢ منها حمراء و٨ بيضاء. أيٌّ منهما ينبغي أن يشعر بمزيد من الثقة بأن الكرات الحمراء تمثل ثلثي الجرة فيما تشكل الكرات البيضاء ثلثها الآخر وليس العكس؟ ما الاحتمالات التي ينبغي أن يعطيها كلٌّ منهما؟

في هذه المسألة، يكون الاحتمال اللاحق الصحيح هو ٨ إلى ١ للعينة ٤ : ١، و١٦ إلى ١ للعينة ١٢ : ٨، بما يعني افتراض تساوي الاحتمالات السابقة. غير أن معظم الناس يرون أن العينة الأولى تقدم دليلًا أقوى بكثير لفرضية أن الجرة يغلب عليها اللون الأحمر؛ نظرًا لأن نسبة الكرات الحمراء أكبر في العينة الأولى عنها في العينة الثانية. مرة أخرى تتحدد الأحكام الحدسية هنا بنسبة العينة ولا تتأثر بشكل جوهري بحجم العينة، والذي يلعب دورًا بالغ الأهمية في تحديد الاحتمالات اللاحقة الفعلية.⁵ إلى جانب ذلك، تعتبر التقديرات الحدسية للاحتمالات اللاحقة أقل مغالاة بكثير من القيم الصحيحة. وقد لوحظ الاستخفاف بتأثير الأدلة بشكل متكرر في مسائل من تلك النوعية.⁶ وأُطلق على ذلك «المحافظة».

الفهم الخاطئ للفرص: يتوقع الناس أن سلسلةً متتابعةً من الأحداث ناشئةً عن عملية عشوائية سوف تمثل السمات الأساسية لتلك العملية حتى عندما يكون التسلسل قصيرًا. عند التفكير في قذف العملة لمعرفة ما إذا كانت قد سقطت على وجه الصورة أم وجه الكتابة، على سبيل المثال، يعتبر الناس أن التسلسل ص ك ص ك ك ص أكثر ترجيحًا من التسلسل ص ص ص ك ك ك الذي لا يبدو عشوائيًّا، وكذلك أكثر ترجيحًا من التسلسل ص ص ص ص ك ص الذي لا يمثل عدالة عملية قذف العملة.⁷ ومن ثم يتوقع الناس أن السمات الأساسية للعملية سوف يتم تمثيلها، ليس فقط على المستوى العام من خلال التسلسل بأكمله، ولكن أيضًا على المستوى الموضعي في كل جزء من أجزائه. غير أن التسلسل موضعي التمثيل ينحرف بشكل ممنهج عن توقع الاحتمال؛ فهو يحتوي على الكثير جدًّا من التبديلات والقليل جدًّا من الدورات. ومن العواقب الأخرى للاعتقاد في التمثيل الموضعي مغالطة المقامر الشهيرة. فبعد مراقبة جولة طويلة من تكرار اللون الأحمر على عجلة الروليت، على سبيل المثال، يعتقد معظم الناس خطأً أن اللون الأسود قد صار واجبًا الآن؛ ربما لأن ظهور اللون الأسود سوف يؤدي إلى تسلسل أكثر تمثيلًا من ظهور المزيد من الأحمر. تعتبر الفرصة بصفة عامة عملية ذاتية التصحيح يؤدي فيها انحراف في أحد الاتجاهات إلى انحراف في الاتجاه المعاكس لاستعادة التوازن. في الواقع إن الانحرافات لا «تُصحَّح» مع تكشُّف عملية الفرصة، بل تُموَّه فقط.

ولا تقف المفاهيم الخاطئة للفرص عند حدود أفراد التجربة السذج؛ فقد كشفت دراسة عن البداهات الإحصائية لعلماء النفس المحنكين في مجال البحث⁸ عن وجود اعتقاد ممتد فيما قد يسمى «قانون الأرقام الصغيرة»، الذي تكون حتى العينات الصغيرة بمقتضاه ممثلة للمجموعات المستمدة منها إلى حد كبير. وقد عكست إجابات هؤلاء الباحثين التوقع بأن فرضية صحيحة بشأن مجموعة ما سوف تُمثَّل بنتيجة على قدر من الأهمية إحصائيًّا في أي عينة دون الانتباه كثيرًا لحجمها. ونتيجة لذلك وضع الباحثون قدرًا أكبر من اللازم من الثقة في نتائج العينات الصغيرة وبالغوا بشكل صارخ في تقدير إمكانية استنساخ النتائج على نحو متكرر. ويؤدي هذا التحيز في الإجراء الفعلي للأبحاث إلى اختيار عينات ذات أحجام غير كافية والمبالغة في تفسير النتائج.

انعدام الحساسية تجاه إمكانية التنبؤ: أحيانًا ما يُطلب من الناس وضع تكهنات رقمية مثل التكهن بالقيمة المستقبلية لسهم ما، أو قدر الطلب على إحدى السلع، أو نتيجة مباراة لكرة القدم. ومثل هذه التكهنات غالبًا ما تتم من خلال التمثيل. على سبيل المثال، لنفترض أن شخصًا أُعطي وصفًا لشركة ما وطُلب منه التكهن بربحيتها المستقبلية. إذا كان وصف الشركة إيجابيًّا للغاية، فإن التكهن بربحية عالية للغاية سوف يكون ممثلًا لأقصى حد لهذا الوصف؛ أما إذا كان الوصف متواضعًا، فإن الأداء المتواضع سوف يكون الأكثر تمثيلًا له. ولا تتأثر درجة إيجابية الوصف بموثوقية الوصف، ولا تتأثر كذلك بالدرجة التي يتيح بها وضع تكهن دقيق. وعلى ذلك، فإذا كان الناس يضعون تكهناتهم فقط في إطار إيجابية الوصف، فلن يكون لتكهناتهم أي حساسية تجاه موثوقية الأدلة والدقة المتوقعة للتكهن.

وهذا الأسلوب في الحكم والتقييم ينتهك النظرية الإحصائية القياسية التي يتم فيها التحكم في مغالاة التكهنات ومداها عن طريق اعتبارات قابلية التنبؤ. فحين تكون قابلية التنبؤ صفرًا، ينبغي أن يوضع نفس التكهن في جميع الحالات. على سبيل المثال، إذا كانت توصيفات الشركات لا تقدم أي معلومات متعلقة بالربحية، ينبغي التكهن بنفس القيمة (مثل متوسط الربح) لجميع الشركات. وبالطبع إذا كانت قابلية التنبؤ تامة، فسوف تكون القيم المتوقعة مطابقة بالطبع للقيم الفعلية وسوف يكون مدى التكهنات مساويًا لمدى النتائج. وبشكل عام، كلما ارتفعت قابلية التنبؤ، اتسع مدى القيم المتوقعة.

وقد أظهر العديد من الدراسات الخاصة بالتكهن العددي أن التكهنات الحدسية تنتهك هذه القاعدة، وأن أفراد التجربة يظهرون القليل من الاهتمام أو لا يهتمون على الإطلاق بأيٍّ من اعتبارات قابلية التنبؤ.⁹ في إحدى هذه الدراسات، تم إطلاع أفراد التجربة على العديد من الفقرات كلٌّ منها يصف أداء طالب جامعي يتدرب على التدريس أثناء أحد دروس التدريب. طُلب من أفراد الدراسة تقييم جودة الدرس الوارد وصفه في الفقرة بنسب مئوية، بالنسبة لمجموعة محددة. وطُلب من أفراد آخرين التنبؤ، أيضًا بالنسب المئوية، بوضع كل طالب بعد خمس سنوات من درس التدريب. وقد جاءت الأحكام التي تكونت تحت ظروف الحالتين متطابقة، بما يعني أن التكهن بمعيار بعيد (نجاح أحد المعلمين بعد خمس سنوات) كان مطابقًا لتقييم المعلومات التي بُني عليها التكهن (جودة درس التدريب). وقد كان الطلاب الذين وضعوا هذه التكهنات — بلا شك — على وعي بصعوبة التنبؤ بكفاءة التدريس على أساس درس تجريبي واحد يسبق خمس سنوات من الخبرة؛ غير أن تكهناتهم كانت مبالغة مثل تقييماتهم.

وهم الصحة: كما رأينا، غالبًا ما يكوِّن الناس تكهناتهم عن طريق اختيار النتيجة (كمهنة معينة على سبيل المثال) الأكثر تمثيلًا للمُدخل (كوصف أحد الأشخاص على سبيل المثال). وتعتمد ثقتهم في تكهنهم بالأساس على درجة التمثيل (أي على جودة التطابق بين النتيجة المختارة والمُدخل) دون الكثير من الاعتبار، أو بدون أي اعتبار، للعوامل التي تقيد دقة التكهن. وهكذا يظهر الناس ثقة كبيرة في تكهنهم أن شخصًا ما يعمل أمين مكتبة حين يتم إعطاؤهم وصفًا لشخصيته يطابق القالب النمطي لأمناء المكتبات، حتى إذا كان الوصف هزيلًا، أو غير موثوق، أو قديمًا. والثقة غير المضمونة التي تتولد من خلال وجود توافق جيد بين النتيجة المتوقعة والمعلومات المدخلة يمكن تسميتها بوهم الصحة. ويستمر هذا الوهم حتى عندما يكون القائم بإصدار الحكم على دراية بالعوامل التي تقيد دقة تكهناته. ولعل من الملاحظات الشائعة أن علماء النفس الذين يجرون مقابلات اختيار غالبًا ما تراودهم ثقة جمة في تكهناتهم، حتى عندما يكونون على علم بالدراسات السابقة العديدة التي توضح أن مقابلات الاختيار عرضة للخطأ إلى حد كبير. ولعل الاعتماد المتواصل على المقابلات العيادية من أجل الاختيار، على الرغم من الإثباتات المتكررة لعدم كفايتها، هو أكبر شاهد على قوة هذا التأثير.

ويعد الاتساق الداخلي لنمط ما من المدخلات من العوامل الأساسية المحددة لثقة الشخص في التكهنات القائمة على هذه المدخلات. على سبيل المثال، يبدي الناس مزيدًا من الثقة في التكهن بالمتوسط النهائي لمجموع الدرجات لطالب كانت درجاته للعام الدراسي الأول معظمها جيد عما يبدونه في التكهن بمتوسط تقدير طالب تباينت تقديراته في العام الأول ما بين امتياز ومقبول. وفي أغلب الأحيان تُلاحَظ أنماط عالية الاتساق حين تكون متغيرات المدخل متكررة أو متلازمة إلى حد كبير. وبناء عليه يميل الناس إلى الثقة بشكل كبير في التكهنات القائمة على متغيرات المدخلات المكررة. غير أن النتيجة الأولية في إحصائيات التلازم تؤكد أنه في ظل وجود متغيرات مدخلات ذات صحة معلنة يمكن للتكهن القائم على العديد من مثل هذه المدخلات أن يحقق دقة أعلى حين تكون منفصلة أحدها عن الآخر مما يحدث عندما تكون مكررة أو متلازمة. ومن ثم فإن التكرار ضمن المدخلات يقلل من مستوى الدقة حتى عندما يزيد مستوى الثقة، وغالبًا ما يثق الناس في التكهنات التي يحتمل جدًّا أن تكون غير دقيقة.¹⁰

المفاهيم الخاطئة للارتداد: هب أن مجموعة كبيرة من الأطفال يخضعون للاختبار في نسختين متكافئتين من اختبار القابلية للتعلم. إذا اختار أحد الأشخاص عشرة أطفال من بين أفضل من أبلوا في إحدى نسختي الاختبار، فعادة ما سوف يجد أداءهم في النسخة الثانية مخيبًا إلى حد ما. والعكس بالعكس، إذا اختار شخص عشرة أطفال من بين أصحاب أسوأ أداء في إحدى النسختين، فسوف يجد أداءهم، بشكل عام، أفضل نوعًا ما في النسخة الأخرى. على نحو أكثر تعميمًا، فكر في متغيرين (س) و(ص) لهما نفس التوزيع. إذا اختار شخص أفرادًا ينحرف متوسط نقاطهم في المتغير (س) عن متوسط المتغير (س) ﺑ (ع) وحدات، فإن متوسط نقاطهم في المتغير (ص) عادة ما سوف ينحرف عن متوسط المتغير (ص) بأقل من (ع) وحدات. توضح هذه الملاحظات ظاهرة عامة تعرف بالارتداد نحو المتوسط والتي وُثِّقت لأول مرة على يد جالتون قبل أكثر من ١٠٠ عام.

في مسار الحياة العادي، يقابل الفرد العديد من أمثلة الارتداد نحو المتوسط، في المقارنة بين أطوال الآباء والأبناء، أو بين ذكاء الأزواج والزوجات، أو بين أداء الأفراد في اختبارات متتالية. على الرغم من ذلك، لا يكوِّن الناس بداهات صحيحة بشأن هذه الظاهرة. فهم، أولًا، لا يتوقعون الارتداد في العديد من السياقات حيث يكون حدوثه حتميًّا. ثانيًّا، حين يدركون حدوث الارتداد، غالبًا ما يخترعون تفسيرات سببية زائفة له.¹¹ ونحن نرى أن ظاهرة الارتداد ستظل مستعصية على الفهم؛ لأنها لا تتوافق مع اعتقاد أن النتيجة المتوقعة ينبغي أن تكون ممثلة للمُدخل إلى أقصى حد، ومن ثم فإن قيمة متغير النتيجة ينبغي أن تكون مبالغة مثل قيمة متغير المدخل.

ويمكن للإخفاق في إدراك أهمية الارتداد أن تكون له عواقب ضارة، كما هو موضح من خلال الملاحظة التالية.¹² في مناقشة بجلسة تدريب على الطيران، أشار المدربون المحنكون إلى أن الثناء على هبوط سلس بشكل استثنائي عادة ما يتبعه هبوط أضعف في المحاولة التالية، بينما يتبع النقد القاسي بعد هبوط وعر تحسن في المحاولة التالية عادة. وخلص المدربون إلى أن المكافآت اللفظية تضر بعملية التعلم، فيما تكون العقوبات اللفظية مفيدة على عكس العقيدة السيكولوجية المتفق عليها. ليس لهذا الاستنتاج ما يبرره؛ نظرًا لوجود ظاهرة الارتداد نحو المتوسط. فكما في حالات أخرى من الاختبار المتكرر، غالبًا ما يتبع أيَّ أداء هزيل تحسنٌ، وأي أداء متميز يأتي بعده تدهور في الأداء، حتى إذا لم يستجب المدرب لإنجاز المتدرب في المحاولة الأولى. ونظرًا لأن المدربين كانوا يثنون على المتدربين بعد عمليات الهبوط الجيدة ويلومونهم بعد عمليات الهبوط الرديئة، فقد توصلوا إلى الاستنتاج الخاطئ والمضر: أن العقاب أكثر فاعلية من المكافأة.

وبناءً عليه يؤدي الإخفاق في فهم تأثير الارتداد بالفرد إلى المبالغة في تقدير فاعلية العقاب والاستهانة بفاعلية المكافأة. وعادة ما تستخدم المكافآت في التفاعل الاجتماعي، وكذلك في التدريب، حين يكون الأداء جيدًا، فيما تستخدم العقوبات عادة حين يكون الأداء سيئًا. ومن ثم فإنه بالارتداد فقط يميل السلوك في الأغلب الأعم إلى التحسن بعد العقاب وإلى التدهور بعد المكافأة. وبالتالي تتلخص الحالة الإنسانية، بمحض المصادفة فقط، في أن الفرد غالبًا ما يُكافأ لمعاقبة الآخرين، ويعاقَب في الغالب لمكافأة الآخرين. ولا يعي الناس بشكل عام هذا المأزق. بل إن الدور المراوغ للارتداد في تحديد التبعات الظاهرة للمكافأة والعقاب يبدو أنه قد أغفله دارسو هذا المجال.

التوفُّر

ثمة مواقف يقيِّم فيها الناس تكرار فئة أو احتمال وقوع حدث ما بالسهولة التي يمكن أن تخطر بها المواقف أو الأحداث بالذهن. على سبيل المثال، قد يقيِّم أحدهم خطر الإصابة بالأزمة القلبية بين الأشخاص متوسطي العمر من خلال استرجاع مثل هذه الوقائع بين معارف الشخص. بالمثل، قد يقيِّم أحدهم احتمالية فشل مشروع تجاري من خلال تخيل الصعوبات المتعددة التي قد يواجهها. وهذا الاستدلال الحُكمي يسمى التوفر. ويعد التوفر دليلًا مفيدًا لتقييم التكرار أو الاحتمالية؛ لأن أمثلة الفئات الكبيرة عادة ما تسترجع بشكل أفضل وأسرع من أمثلة الفئات الأقل تكرارًا. غير أن التوفر يتأثر بعوامل أخرى خلاف التكرار والاحتمالية. وبالتالي يؤدي الاعتماد على التوفر إلى انحيازات يمكن التنبؤ بها ونوضح بعضًا منها فيما يلي:

الانحيازات الناجمة عن إمكانية استرجاع الأمثلة: حين يقيَّم حجم الفئة بتوفر أمثلته، سوف تبدو الفئة، التي يسهل استرجاع أمثلتها، أكثر عددًا من فئة لها معدل تكرار مساوٍ ولكن أمثلتها أقل قابلية للاسترجاع. وفي عرض عملي أولي لهذا التأثير، استمع أفراد التجربة لقائمة من الشخصيات المعروفة من كلا الجنسين، ومن ثم طُلب منهم تقييم ما إذا كانت القائمة قد ضمت أسماء رجال أكثر من النساء. وقد تم عرض قوائم مختلفة على مجموعات مختلفة من أفراد التجربة. وفي بعض القوائم كان الرجال أكثر شهرة من النساء نسبيًّا، وفي البعض الآخر كانت النساء أكثر شهرة من الرجال نسبيًّا. وفي كل قائمة من القوائم كان الأفراد يقدرون خطأ أن الفئة (النوع) التي ضمت الشخصيات الأشهر هي الأكثر عددًا.¹³

إلى جانب الشهرة، توجد عوامل أخرى، مثل الوضوح؛ تؤثر على قابلية استرجاع الأمثلة. على سبيل المثال، ربما يكون تأثير رؤية منزل يحترق على الاحتمالية الذاتية لوقوع مثل هذه الحوادث أكبر من تأثير القراءة عن حريق في الجريدة المحلية. علاوة على ذلك، من المحتمل أن تكون الوقائع الحديثة أكثر توفرًا نسبيًّا من الأحداث السابقة. ولعل من الخبرات الشائعة ما يحدث من تصاعد الاحتمالية الذاتية لوقوع حوادث المرور مؤقتًا حين يرى أحدهم سيارة منقلبة على جانب الطريق.

الانحيازات الناجمة عن فاعلية مجموعة البحث: لنفترض أن أحدهم اختار كلمة كعينة من أحد النصوص الإنجليزية بشكل عشوائي. هل من المرجح أن تبدأ الكلمة بحرف r أم أن يكون حرف r هو الحرف الثالث من الكلمة؟ يتعامل الناس مع هذه المشكلة باسترجاع الكلمات التي تبدأ بحرف r (مثل road) والكلمات التي يقع فيها حرف r في الموضع الثالث (مثل car)، ومن ثم يقيِّمون التكرار النسبي بمدى السهولة التي تتبادر بها الكلمات من النوعين إلى الذهن. ونظرًا لأن البحث عن الكلمات بحرفها الأول أسهل كثيرًا من البحث عنها بحرفها الثالث، فإن معظم الناس يحكمون بأن الكلمات التي تبدأ بحرف ساكن معين أكثر عددًا من الكلمات التي يظهر فيها نفس الحرف الساكن في المركز الثالث، بل إنهم يحكمون بذلك حتى بالنسبة للحروف الساكنة، مثل r أو k، التي يكثر ظهورها في المركز الثالث عن الأول.¹⁴

وتختلف مجموعات البحث التي تُستدعَى باختلاف المهام. لنفترض، على سبيل المثال، أنك مطالب بتقدير مدى تكرار ظهور الكلمات التي تعبر عن المعاني المجردة (فكرة، حب) والكلمات التي تعبر عن الأشياء المادية (باب، ماء) في اللغة المكتوبة. ثمة طريقة عادية للإجابة عن هذا السؤال؛ هي البحث عن سياقات يمكن للكلمة أن تَرِد فيها. يبدو من الأسهل التفكير في سياقات تُذكر فيها كلمة ذات معنى مجرد (كالحب في القصص الغرامية) من التفكير في السياقات التي تذكر فيها كلمة ذات معنى مادي ما (مثل كلمة باب). فإذا كان الحكم على تكرار الكلمات يُقدَّر بمدى توفر السياقات التي تظهر فيها، فسوف يكون الحكم بأن الكلمات المعنوية أكثر عددًا نسبيًّا من الكلمات المادية. وقد لوحظ هذا الانحياز في دراسة حديثة¹⁵ أظهرت أن معدل تكرار ظهور الكلمات المجردة قد قُدِّر بأنه أعلى كثيرًا من معدل تكرار الكلمات المادية، فيما تعادلا في معدل التكرار الموضوعي. وكذلك قُدِّر أن الكلمات المجردة تظهر في مجموعة أكبر كثيرًا من السياقات من الكلمات المادية.

انحيازات إمكانية التخيل: أحيانًا ما يضطر المرء لتقييم تكرار فئة لا تختزن أمثلتها في الذاكرة، ولكن يمكن تكوينها وفقًا لقاعدة معينة. في مثل هذه المواقف يقوم الشخص عادة بتكوين العديد من الأمثلة وتقييم معدل التكرار أو الاحتمالية وفق مدى السهولة التي يمكن بها تكوين الأمثلة ذات الصلة. غير أن سهولة تكوين الأمثلة لا تعكس دائمًا معدل تكرارها الفعلي، ومن ثم يكون هذا الأسلوب في التقييم عرضة للانحيازات. لتوضيح ذلك، تأمل مجموعة من ١٠ أشخاص يشكلون لجانًا من ٢

٨. كم عدد اللجان المختلفة التي يمكن تشكيلها من ع أعضاء؟ يتم حساب الإجابة الصحيحة لهذه المسألة بواسطة المعامل الثنائي (١٠/ع) الذي يصل إلى حد أقصى قدره ٢٥٢، حيث ع = ٥. من الواضح أن عدد اللجان المكونة من ع أعضاء يساوي عدد اللجان المكونة من (١٠ – ع)؛ لأن أي لجنة مكونة من ع أعضاء تحدد مجموعة فريدة من عدد (١٠ – ع) أفراد غير أعضاء.

إحدى الطرق للإجابة عن هذا السؤال دون عمليات حسابية هي تكوين لجنة مكونة من k أعضاء ذهنيًّا وتقييم عددهم بمدى السهولة التي يخطرون بها على الذهن. وتعد اللجان المكونة من عدد قليل من الأعضاء — لنقُل ٢ — أكثر توفرًا من اللجان المكونة من عدة أعضاء، لنقل ٨. وأبسط أسلوب لتكوين اللجان هو تقسيم المجموعة إلى مجموعات منفصلة. تستطيع أن تدرك سريعًا أن من السهل تكوين خمس لجان منفصلة في كلٍّ منها عضوان، بينما يستحيل تكوين حتى لجنتين منفصلتين من ٨ أعضاء. وبالتالي إذا كان التكرار يُقيَّم بإمكانية التخيل، أو بالتوفر من أجل التكوين، فسوف تبدو اللجان الصغيرة أكثر عددًا من اللجان الكبيرة، على عكس الدالة الصحيحة ذات الشكل الجرسي. وحقيقة، حين كان يُطلب من أفراد التجربة تقييم عدد اللجان المتباينة ذات الأحجام المتنوعة، كانت تقديراتهم عبارة عن دالة رتيبة متناقصة لحجم اللجنة.¹⁶ على سبيل المثال، كان التقدير المتوسط لعدد اللجان المكونة من عضوين يساوي ٧٠، بينما كان تقدير اللجان المكونة من ٨ أعضاء يساوي ٢٠ (والإجابة الصحيحة في كلتا الحالتين هي ٤٥).

تلعب إمكانية التخيل دورًا مهمًّا في تقييم الاحتمالات في المواقف الواقعية؛ فالخطورة التي تحيط ببعثة استكشافية مغامرة، على سبيل المثال، تقدَّر بتخيل المخاطر التي لا تملك البعثة ما يؤهلها للتعامل معها. وإذا ما تم تخيل العديد من مثل هذه الصعوبات بوضوح، فمن الممكن أن نجعل البعثة تبدو خطيرة إلى أقصى حد، على الرغم من أن السهولة التي يتم بها تخيل الكوارث لا تحتاج لأن تعكس احتماليتها الفعلية. والعكس بالعكس، قد يستهان بقدر الخطورة التي تنطوي عليها البعثة إلى حد كبير إذا كان من الصعب تصور بعض من المخاطر المحتملة أو التي لا تخطر بالعقل فحسب.

التلازم الوهمي: وصف كلٌّ من تشابمان وتشابمان¹⁷ انحيازًا مثيرًا في الحكم على معدل تكرار وقوع حدثين مع بعضهما؛ فقد قدَّما لعدد من القضاة معلومات تتعلق بالعديد من المرضى النفسيين الافتراضيين. تألفت المعلومات الخاصة بكل مريض من تشخيص إكلينيكي ورسم لشخص رسمه المريض. بعد ذلك قام المحكمون بتقدير معدل التكرار الذي جاء به كل تشخيص (مثل جنون الاضطهاد أو الشك) مصحوبًا بملامح متعددة من الرسم (مثل العيون ذات الشكل الغريب). بالغ أفراد الدراسة بشكل ملحوظ في الاستهانة بمعدل تكرار ظهور التلازمات الطبيعية، مثل الشك والعيون الغريبة. وأُطلق على هذا التأثير التلازم الوهمي. لقد قام أفراد الدراسة في أحكامهم الخاطئة على المعلومات التي تم تعريضهم لها «بإعادة اكتشاف» جزء كبير من المعرفة السريرية الشائعة برغم افتقارها للأساس، والمتعلقة بتفسير اختبار رسم الشخوص. وقد كان تأثير التلازم الوهمي مقاومًا لأقصى حد للمعلومات المتناقضة، وظل باقيًا حتى عندما كان التلازم بين العَرَض والتشخيص سلبيًّا، وأعاق المحكمين عن اكتشاف العلاقات التي كانت قائمة في الواقع.

ويقدم التوفر تفسيرًا طبيعيًّا لتأثير التلازم الوهمي؛ فمن الممكن بناء الأحكام الخاصة بمدى تكرار الظهور المتلازم لحدثين على أساس قوة العلاقة الترابطية بينهما. فحين يكون الارتباط قويًّا، من المحتمل استنتاج أن الحدثين كثيرًا ما كانا يقترنان. وبالتالي سوف يكون الحكم بأن التلازمات القوية قد ظهرت معًا بشكل متكرر. ووفقًا لهذه النظرية، يعود التلازم الوهمي بين الشك ورسم العين الغريب، على سبيل المثال، لحقيقة أن الشك يرتبط على الفور بالعيون أكثر من ارتباطه بأي جزء آخر من الجسم.

لقد علمتنا خبرة الحياة الطويلة أن أمثلة الفئات الكبيرة، بشكل عام، تُسترجع بشكل أفضل وأسرع من أمثلة الفئات الأقل تكرارًا؛ وأن الأحداث المحتملة أسهل في تخيلها من الأحداث المستبعدة؛ وأن العلاقات الترابطية بين الأحداث تُعزَّز حين تتزامن الأحداث بشكل متكرر. ونتيجة لذلك، يملك الإنسان تحت تصرفه إجراء (هو الاستدلال بالتوفر) لتقييم تعددية فئة ما، أو احتمالية حدث ما، أو تكرار الأحداث المتزامنة، عن طريق السهولة التي يمكن بها إجراء العمليات الذهنية ذات الصلة من استرجاع، أو تكوين، أو ربط. غير أن هذا الإجراء التقييمي القيم يسفر عن أخطاء منهجية، مثلما أظهرت الأمثلة السابقة.

التعديل والارتساء

في كثير من المواقف يضع الناس تقديرات عن طريق البدء من قيمة أولية معدلة بحيث تعطي الإجابة النهائية. قد يتم اقتراح القيمة الأولية، أو نقطة البدء، من خلال صيغة المسألة، أو قد تكون نتيجة عملية حسابية جزئية. وفي كلتا الحالتين، عادة ما تكون التعديلات غير كافية؛¹⁸ أي إن نقاط البدء المختلفة تعطي تقديرات مختلفة منحازة للقيم الأولية. ونطلق على هذه الظاهرة: الارتساء.

التعديل غير الكافي: في تجربة لتوضيح تأثير الارتساء، طُلِب من أفراد التجربة تقدير كميات مختلفة مصاغة في شكل نسب مئوية (على سبيل المثال، نسبة الدول الأفريقية في الأمم المتحدة) تم تحديد عدد ما بين صفر و١٠٠ لكل كمية، عن طريق تدوير عجلة حظ في حضور أفراد التجربة. طُلب من أفراد التجربة الإشارة أولًا إلى كون الرقم أعلى أم أقل من قيمة الكمية، ثم تقدير قيمة الكمية بالتحرك إلى أعلى أو إلى أسفل من الرقم المحدد. وقد اختلفت الأرقام المحددة لكل كمية باختلاف المجموعة، وكان لهذه الأرقام الاعتباطية تأثير ملحوظ على التقديرات. على سبيل المثال، كانت التقديرات المتوسطة لنسبة الدول الأفريقية في الأمم المتحدة ٢٥ و٤٥ بالنسبة للمجموعات التي تلقت رقمي ١٠ و٦٥ على التوالي كنقاط بدء. ولم تساهم المكافآت على الدقة في الحد من تأثير الارتساء.

ولا يحدث الارتساء فقط حين يتم إعطاء نقاط البدء لفرد التجربة، ولكن أيضًا حين يبني هذا الفرد تقديراته على نتيجة عملية حسابية غير مكتملة. وثمة دراسة للتقدير العددي الحدسي توضح هذا التأثير. فقد قامت مجموعتان من طلاب المرحلة الثانوية، خلال ٥ ثوانٍ، بتقييم تعبير عددي كان مكتوبًا على السبورة. فقدرت المجموعة الأولى حاصل العملية:

٨ × ٧ × ٦ × ٥ × ٤ × ٣ × ٢ × ١

بينما قدرت المجموعة الثانية حاصل العملية:

١ × ٢ × ٣ × ٤ × ٥ × ٦ × ٧ × ٨

للإجابة سريعًا على مثل هذه الأسئلة، قد يجري الناس بعض خطوات العملية الحسابية ويقدرون الناتج بالاستكمال الخارجي أو التعديل. ونظرًا لأن التعديلات عادة ما لا تكون كافية، فلا بد أن يؤدي هذا الإجراء إلى تقدير أقل من القيمة. إلى جانب ذلك، نظرًا لأن حاصل الخطوات القليلة الأولى من عملية الضرب (التي تُجرى من اليمين إلى اليسار) أعلى في التسلسل التنازلي منه في التسلسل التصاعدي، فلا بد أن يكون تقدير حاصل التعبير الأول أعلى من الأخير. وقد تأكد كلا التنبؤين؛ فكان التقدير المتوسط للتسلسل التصاعدي ٥١٢، بينما كان التقدير المتوسط للتسلسل التنازلي ٢٢٥٠. والإجابة الصحيحة هي ٤٠٣٢٠.

التحيزات في تقييم الأحداث المتصلة والمنفصلة: في دراسة أجراها مؤخرًا بار هيليل،¹⁹ منح أفراد التجربة الفرصة للرهان على حدث من اثنين. وقد استخدمت ثلاثة أنواع من الأحداث: (أ) الأحداث البسيطة، مثل سحب كرة حمراء من حقيبة تحتوي على ٥٠٪ من الكرات الحمراء و٥٠٪ من البيضاء. (ب) أحداث متصلة، مثل سحب كرة حمراء سبع مرات متعاقبة، مع إعادتها مرة أخرى، من حقيبة تحتوي على ٩٠٪ من الكرات الحمراء و١٠٪ من البيضاء. (ﺟ) أحداث منفصلة، مثل سحب كرة حمراء على الأقل مرة واحدة خلال سبع محاولات متتالية، مع إعادتها، من حقيبة تحتوي على ١٠٪ من الكرات الحمراء و٩٠٪ من البيضاء. في هذه المسألة فضلت أغلبية كبيرة من أفراد التجربة الرهان على الحدث المتصل (الذي تبلغ احتماليته ٠٫٤٨) عن الرهان على الحدث البسيط (الذي تبلغ احتماليته ٠٫٥٠). كذلك فضل أفراد التجربة الرهان على الحدث البسيط بدلًا من الرهان على الحدث المنفصل، الذي بلغت احتماليته ٠٫٥٢. وبناء عليه يكون معظم أفراد التجربة قد راهنوا على الحدث الأقل احتمالية في كلتا المقارنتين. ويوضح هذا النمط من الاختيارات نتيجة عامة. وتشير دراسات الاختيار بين المراهنات ودراسات الحكم على الاحتمالية إلى أن الناس يميلون للمبالغة في تقدير احتمالية الأحداث المتصلة²⁰ والتقليل من قدر احتمالية الأحداث المنفصلة. وتُفسَّر هذه التحيزات كتأثيرات للارتساء. وتقدم الاحتمالية المعلنة للحدث الأساسي (كالنجاح في أي مرحلة) نقطة بدء طبيعية لتقدير احتماليات لكلٍّ من الأحداث المتصلة والمنفصلة على حد سواء. ولما كان التعديل من نقطة البدء عادة ما لا يكون كافيًا، فإن التقديرات النهائية تظل شديدة القرب من احتماليات الأحداث الأساسية في كلتا الحالتين، مع ملاحظة أن الاحتمالية الكلية لحدث متصل أقل من احتمالية كل حدث أساسي، بينما الاحتمالية الكلية للحدث المنفصل تعد أعلى من احتمالية كل حدث أساسي. وبالتالي ونتيجة للارتساء، سوف يُغالى في تقدير الاحتمالية الكلية في المسائل المتصلة ويُبخَس قدرها في المسائل المنفصلة.

وللتحيزات في تقييم الأحداث المعقدة أهمية خاصة في سياق التخطيط. فاستكمال مشروع ما بنجاح، مثل تطوير منتج جديد، عادة ما يكون ذا طبيعة متصلة؛ فلكي يكون المشروع ناجحًا، لا بد أن تتحقق سلسة من الأحداث. وحتى عندما يكون وقوع كل واحد من هذه الأحداث محتملًا للغاية، يمكن لاحتمالية النجاح الكلية أن تكون منخفضة للغاية إذا كان عدد الأحداث كبيرًا. والنزعة العامة للمبالغة في تقدير احتمالية الأحداث المتصلة تؤدي إلى تفاؤل لا مبرر له عند تقدير احتمال نجاح خطة ما أو إنجاز أحد المشروعات في موعده. والعكس بالعكس؛ إذ عادة ما تُواجَه بنيات منفصلة عند تقييم المخاطر. فأي منظومة معقدة، مثل مفاعل نووي أو جسم إنسان، سوف تختل وظائفها إذا أصاب القصور أيًّا من مكوناتها الأساسية. حتى عندما تكون احتمالية القصور في كل مكون ضئيلة، يمكن أن تكون احتمالية حدوث قصور كلي عالية إذا زادت المكونات. فبسبب الارتساء، يميل الناس للتقليل من تقدير احتماليات القصور أو الفشل في الأنظمة المعقدة. ومن ثم يمكن في بعض الأحيان الاستدلال على اتجاه تحيز الارتساء من بنية الحدث. فبنية الأحداث المتصلة الأشبه بالسلسلة تؤدي إلى المبالغة في التقدير، فيما تؤدي بنية الأحداث المنفصلة الأشبه بالقمع إلى التقدير البخس.

الارتساء في تقييم التوزيعات الاحتمالية الذاتية: غالبًا ما يكون الخبراء مطالبين في تحليل القرار بالتعبير عن معتقداتهم بشأن كمية ما، مثل قيمة متوسط مؤشر داو جونز في يوم معين، في شكل توزيع احتمالي. يتم تكوين مثل هذا التوزيع عادة عن طريق مطالبة الشخص باختيار قيم الكمية التي تتفق مع النسب المئوية المحددة للتوزيع الاحتمالي الذاتي الخاص به. على سبيل المثال، قد يطلب من القائم بالتقييم أن يختار عددًا، X₉₀، تساوي احتماليته الذاتية بأن يكون أعلى من قيمة متوسط مؤشر داو جونز ٠٫٩٠؛ بمعنى أنه ينبغي أن يختار القيمة X₉₀ بحيث يكون على استعداد لتقبل احتمالية قدرها ٩ إلى ١ بألا يتجاوز متوسط المؤشر هذه القيمة. ويمكن بناء التوزيع الاحتمالي الذاتي لقيمة متوسط مؤشر داو جونز من خلال الكثير من مثل هذه التقديرات الموازية للنسب المئوية المختلفة.

ومن خلال جمع التوزيعات الاحتمالية الذاتية للعديد من الكميات المختلفة، يمكن اختبار المحكم لقياس صحة معايرته. وتتم المعايرة الصحيحة (أو الخارجية) للمحكم في سلسلة من المسائل إذا كان ∏٪ تمامًا من القيم الصحيحة للكميات الخاضعة للتقييم يقل عن قيمه المعلنة التي نسبتها X∏. على سبيل المثال، ينبغي أن تقل القيم الصحيحة عن X₀₁ بالنسبة ﻟ ١٪ من الكميات وتزيد على X₉₉ بالنسبة ﻟ ١٪ من الكميات. وبناء عليه ينبغي أن تقع القيم الصحيحة في فاصل الثقة ما بين X₀₁ وX₉₉ في ٩٨٪ من المسائل.

وقد حصل العديد من الباحثين²¹ على توزيعات احتمالية للعديد من الكميات من عدد كبير من المحكمين. وكان في هذه التوزيعات إشارة إلى وجود انحرافات كبيرة ومنهجية عن المعايرة الصحيحة. ففي معظم الدراسات كانت القيم الفعلية للكميات الخاضعة للتقييم إما أصغر من X₀₁ أو أكبر من X₉₉ لحوالي ٣٠٪ من المسائل؛ بمعنى أن أفراد الدراسة يصرحون بفواصل ثقة ضيقة على نحو مبالغ فيه تعكس قدرًا من اليقين يفوق ما تبرره المعلومات المتاحة عن الكميات الخاضعة للتقييم. وهذا التحيز شائع بالنسبة لأفراد التجارب السذج والمحنكين على السواء، ولا يتم التخلص منه بإدخال قواعد احتساب نقاط ملائمة تقدم حوافز للمعايرة الخارجية. ويمكن أن نعزو هذا التأثير، ولو جزئيًّا على الأقل، إلى الارتساء.

ولاختيار X₉₀ لقيمة متوسط مؤشر داو جونز، على سبيل المثال، من الطبيعي البدء بالتفكير في أفضل تقدير لمؤشر داو جونز لدى الشخص وتعديل هذه القيمة صعودًا. فإذا لم يكن هذا التعديل — مثل معظم التعديلات الأخرى — كافيًا، فإن X₉₀ لن تكون قيمة صارمة بما يكفي. وسوف يظهر تأثير ارتساء مماثل في اختيار القيمة X₁₀، التي يتم الحصول عليها افتراضًا من خلال تعديل أفضل تقدير لدى الشخص هبوطًا. وبالتالي سوف يكون فاصل الثقة بين X₁₀ وX₉₀ ضيقًا أكثر من اللازم، وسوف يكون التوزيع الاحتمالي المُقَيَّم محكمًا أكثر من اللازم. ولتأييد هذا التفسير، يمكن توضيح أن الاحتمالات الذاتية تتغير بشكل منهجي عن طريق إجراء لا يعمل فيه أفضل تقدير للكمية لدى الشخص كمرساة تركيز.

ويمكن الحصول على التوزيعات الاحتمالية الذاتية لكمية معينة (متوسط مؤشر داو جونز) بطريقتين مختلفتين: (أ) بمطالبة فرد التجربة باختيار قيم داو جونز التي توازي النسب المئوية المحددة للتوزيع الاحتمالي الخاص به. (ب) بمطالبة فرد التجربة بتقييم احتمالات أن تتجاوز القيمة الصحيحة لمؤشر داو جونز بعض القيم المحددة. يتساوى الإجراءان معًا شكليًّا ومن المفترض أن يعطيا توزيعات متماثلة. غير أنهما يدلان على أساليب مختلفة للتعديل من مراسي تركيز مختلفة؛ ففي الإجراء (أ)، تكون نقطة البدء الطبيعية هي أفضل تقدير للكمية لدى الفرد. أما في الإجراء (ب)، على الجانب الآخر، قد يحدث ارتساء لفرد التجربة على القيمة المقررة في السؤال. أو بدلًا من ذلك، قد يحدث الارتساء على الفرص المتساوية، أو احتمال ٥٠ إلى ٥٠، الذي يعد نقطة بدء طبيعية في تقييم الاحتمال. وفي كلتا الحالتين يفترض أن يعطي الإجراء (ب) احتمالات أقل تطرفًا من الإجراء (أ).

للمقارنة بين الإجراءين، تم عرض مجموعة من ٢٤ كمية (مثل مسافة الطيران من نيودلهي إلى بكين) على مجموعة من الأفراد قاموا بوضع تقدير إما X₁₀ أو X₉₀ لكل مسألة. فيما تلقت مجموعة أخرى متوسط التقييم للمجموعة الأولى لكل كمية من اﻟ ٢٤. وطُلب منهم تقييم احتمالات أن تكون كل قيمة من القيم المحددة قد تجاوزت القيمة الصحيحة للكمية المعنية. في غياب أي تحيز، ينبغي أن يسترجع أفراد المجموعة الثانية الاحتمال المحدد للمجموعة الأولى؛ أي ٩ : ١. غير أنه إذا عملت الاحتمالات المتساوية أو القيمة المقررة كمراسي تركيز، ينبغي أن يكون الاحتمال المقرر من قبل المجموعة الثانية أقل تطرفًا؛ أي أقرب إلى ١ : ١. وبالفعل كان متوسط الاحتمالات التي قررتها تلك المجموعة، في كل المسائل، هو ٣ : ١. حين اختُبِرت تقييمات المجموعتين من أجل المعايرة الخارجية، وُجد أن الأفراد في المجموعة الأولى كانوا أكثر تطرفًا بما يتفق مع الدراسات السابقة. فالأحداث التي حددوا لها احتمالية قدرها ٠٫١٠ قد حصلت فعليًّا في ٢٤٪ من الحالات. في المقابل، كان الأفراد في المجموعة الثانية في شدة التحفظ. وقد تم الحصول فعليًّا في ٢٦٪ من الحالات على متوسط الاحتمالية الذي حددوه للأحداث، وهي ٠٫٣٤. وتوضح هذه النتائج الطريقة التي تعتمد فيها درجة المعايرة على إجراء الاستدعاء.

مناقشة

عُني هذا المقال بالتحيزات المعرفية التي تنشأ عن الاعتماد على الاستدلال القائم على الحُكم. ولا يمكن أن نعزو هذه التحيزات إلى تأثيرات تحفيزية، مثل التفكير التواق أو تحريف التقييمات والأحكام بالمكافآت والعقوبات. وبالفعل، فقد ظهر العديد من أخطاء الحكم الفادحة التي أشير إليها من قبل على الرغم من حث أفراد التجارب على تحري الدقة ومكافأتهم على الإجابات الصحيحة.²²

ولا يقتصر الاعتماد على الاستدلال وشيوع التحيزات على الأشخاص العاديين؛ فالباحثون المحنكون معرضون أيضًا لنفس التحيزات؛ حين يفكرون ببداهة دون إعمال للعقل. على سبيل المثال، لوحظت النزعة للتنبؤ بالنتيجة التي تمثل المعلومات على النحو الأفضل، إلى جانب عدم إيلاء الاهتمام الكافي للاحتمالات السابقة، في الأحكام البديهية للأفراد الذين تلقوا تدريبًا مكثفًا في الإحصاء.²³ وعلى الرغم من أن من يملكون الخبرة والمعرفة الإحصائية يتجنبون الأخطاء الأولية، مثل مغالطة المقامر، فإن أحكامهم البديهية عرضة لمغالطات مماثلة في مسائل أكثر تعقيدًا وأقل شفافية.

وليس ثمة مفاجأة في الاحتفاظ بالطرق الاستدلالية المفيدة مثل التمثيل والتوفر، على الرغم من أنها أحيانًا ما تؤدي إلى أخطاء في التنبؤ أو التقدير. وربما ما هو مفاجئ هو إخفاق الناس في الاستدلال — من خلال خبرة الحياة — على القواعد الإحصائية الأساسية مثل الارتداد نحو المتوسط، أو تأثير حجم العينة على متغيرية اختيار العينات. وعلى الرغم من أن الجميع يتعرضون خلال مسار الحياة الطبيعي للعديد من الأمثلة التي كان يمكن استخلاص هذه القواعد منها، فإن قلة قليلة من الأشخاص هم من يكتشفون بمفردهم مبادئ اختيار العينات والارتداد. فالمبادئ الإحصائية لا تُكتَسب من الخبرات اليومية؛ نظرًا لعدم تشفير الأمثلة ذات الصلة بالشكل الملائم. على سبيل المثال، لا يكتشف الناس أن السطور المتتالية في نص ما تختلف أكثر في متوسط طول الكلمة من الصفحات المتتالية؛ لأنهم ببساطة لا ينتبهون لمتوسط طول الكلمة للسطور أو الصفحات الفردية. وبناء عليه لا يتعلم الناس العلاقة بين حجم العينة ومتغيرية اختيار العينة، على الرغم من وفرة المعلومات اللازمة لتعلم ذلك.

كذلك يفسر الافتقار لوجود شفرة مناسبة سبب عدم اكتشاف الناس عادة للتحيزات في أحكامهم على الاحتمالية. ربما يكون بإمكان أي شخص أن يعرف ما إذا كانت أحكامه قد تمت معايرتها خارجيًّا عن طريق الاحتفاظ بسجل لنسبة الأحداث التي تقع فعليًّا من بين تلك الأحداث التي يحدد لها نفس الاحتمالية. غير أنه ليس من الطبيعي تجميع الأحداث وفقًا لاحتماليتها المقدرة. وفي غياب مثل هذا النوع من التجميع، يستحيل على أي فرد أن يكتشف، على سبيل المثال، أن ٥٠٪ فقط من التنبؤات التي حدد لها احتمالية قيمتها ٠٫٩٠ أو أعلى هي التي تتحقق فعليًّا.

وللتحليل التجريبي للتحيزات المعرفية آثار مترتبة فيما يتعلق بالدور النظري والتطبيقي للاحتمالات المقدرة. فنظرية القرار الحديثة²⁴ تعتبر الاحتمالية الذاتية بمثابة الرأي المقدر كميًّا لشخص مثالي. وعلى وجه التحديد تتعين الاحتمالية الذاتية لحدث محدد بمجموعة الرهانات المتعلقة بهذا الحدث والتي يكون مثل هذا الشخص على استعداد لتقبلها. ويمكن اشتقاق مقياس متناغم، أو متماسك داخليًّا، للاحتمالية الذاتية نيابة عن أحد الأفراد إذا كانت اختياراته بين الرهانات تتفق مع مبادئ معينة؛ أي مع بديهيات النظرية. والاحتمالية المشتقة ذاتية من حيث أن الأفراد المختلفين يُسمَح لهم بوضع احتمالات مختلفة لنفس الحدث. ولعل الإسهام الأكبر لهذا المنهج هو أنه يقدم تفسيرًا ذاتيًّا صارمًا للاحتمالية يمكن تطبيقه على الأحداث الفريدة وله أساس راسخ في نظرية عامة من نظريات القرار العقلاني.

ربما ينبغي الإشارة إلى أنه بينما يمكن استخلاص الاحتمالات الذاتية في بعض الأحيان من التفضيلات بين الرهانات، فإنها لا تتشكل بهذه الطريقة في الأحوال العادية؛ فالشخص الذي يراهن على الفريق (أ) دون الفريق (ب) إنما يفعل ذلك لاعتقاده بأن الفريق (أ) أقرب للفوز؛ فهو لا يستخلص هذا الاعتقاد من تفضيلاته في الرهان. وهكذا فإن الاحتمالات الذاتية، في واقع الأمر، تحدد التفضيلات بين الرهانات ولا تُشتَق منها، كما في النظرية البديهية للقرار العقلاني.²⁵

وقد قادت الطبيعة الذاتية الأصيلة للاحتمالية العديد من الطلاب إلى الاعتقاد بأن التماسك، أو الاتساق الداخلي، هو المعيار السليم الوحيد الذي ينبغي تقييم الاحتمالات الخاضعة للتقدير وفقًا له. فمن منظور النظرية الرسمية للاحتمالية الذاتية، تتساوى أي مجموعة من تقديرات الاحتمالات المتسقة داخليًّا مع أي مجموعة أخرى من حيث الجودة. وهذا المعيار غير مرضٍ بشكل تام؛ لأن أي مجموعة متجانسة داخليًّا من الاحتمالات الذاتية قد تتعارض مع معتقدات أخرى يحملها الفرد. فكر في شخص تعكس احتمالاته الذاتية لجميع النتائج الممكنة للعبة قذف العملة وجود مغالطة المقامر. بمعنى أن تقديره لاحتمال ظهور وجه الصورة في إحدى مرات القذف يزداد مع عدد المرات المتعاقبة التي ظهر فيها وجه الكتابة والتي سبقت تلك المرة. إن أحكام مثل هذا الشخص يمكن أن تكون متسقة داخليًّا، ومن ثم مقبولة كاحتمالات ذاتية كافية وفقًا لمعيار النظرية الرسمية. غير أن هذه الاحتمالات تتعارض مع الاعتقاد العام بأن العملة لا ذاكرة لها، ومن ثم ليس لديها القدرة على توليد تبعيات متتالية. إن التجانس الداخلي ليس كافيًا لاعتبار الاحتمالات الخاضعة للتقدير كافية أو عقلانية؛ إذ لا بد أن تكون الأحكام متوافقة مع شبكة المعتقدات الكاملة التي يؤمن بها الشخص. وللأسف لا يمكن أن يكون هناك إجراء رسمي بسيط لتقييم مدى توافق مجموعة تقديرات الاحتمال مع منظومة المعتقدات الخاصة بالشخص المحكم. غير أن المحكم العقلاني سوف يكافح من أجل إيجاد التوافق، على الرغم من أن الاتساق الداخلي يمكن إنجازه وتقييمه بصورة أسهل. وسوف يحاول على وجه الخصوص أن يجعل تقديراته وأحكامه للاحتمالات متوافقة مع معارفه بشأن الموضوع، ومع قوانين الاحتمال، واستدلالاته وتحيزاته التقييمية.

ملخص

بيَّن هذا المقال ثلاث طرق استدلالية يستعان بها في تكوين الأحكام تحت وطأة عدم اليقين؛ وهي: (١) التمثيل، الذي عادة ما يستعان به حين يطلب من الناس تقييم احتمال أن يكون الشيء أو الحدث (أ) منتميًا لفئة أو عملية (ب). (٢) توفر الأمثلة أو السيناريوهات، والتي غالبًا ما توظَّف حين يُطلب من الناس تقييم تكرار فئة ما، أو مدى معقولية تطور معين. (٣) التعديل من مرساة تركيز، والذي عادة ما يستعان به في التنبؤ العددي حين تتوفر قيمة ذات صلة. إن هذه الطرق الاستدلالية اقتصادية للغاية وعادة ما تثبت فاعليتها، ولكنها تؤدي إلى أخطاء منهجية يمكن التنبؤ بها. ويمكن عن طريق تطوير فهم أفضل لهذه الطرق الاستدلالية وللتحيزات التي تؤدي إليها تحسين الأحكام والقرارات في المواقف التي يكتنفها الشك.

هوامش

(1) D. Kahneman and A. Tversky, “On the Psychology of Prediction,” Psychological Review 80 (1973): 237–51.

(2) Ibid.

(3) bid.

(4) D. Kahneman and A. Tversky, “Subjective Probability: A Judgment of Representativeness,” Cognitive Psychology 3 (1972): 430–54.

(5) Ibid.

(6) W. Edwards, “Conservatism in Human Information Processing,” in Formal Representation of Human Judgment, ed. B. Kleinmuntz (New York: Wiley, 1968), 17–52.

(7) Kahneman and Tversky, “Subjective Probability.”

(8) A. Tversky and D. Kahneman, “Belief in the Law of Small Numbers,” Psychological Bulletin 76 (1971): 105–10.

(9) Kahneman and Tversky, “On the Psychology of Prediction”.

(10) Ibid.

(11) Ibid.

(12) Ibid.

(13) A. Tversky and D. Kahneman, “Availability: A Heuristic for Judging Frequency and Probability,” Cognitive Psychology 5 (1973): 207–32.

(14) Ibid.

(15) R. C. Galbraith and B. J. Underwood, “Perceived Frequency of Concrete and Abstract Words,” Memory & Cognition 1 (1973): 56–60.

(16) Tversky and Kahneman, “Availability.”

(17) L. J. Chapman and J. P. Chapman, “Genesis of Popular but Erroneous Psychodiagnostic Observations,” Journal of Abnormal Psychology 73 (1967): 193–204; L. J. Chapman and J. P. Chapman, “Illusory Correlation as an Obstacle to the Use of Valid Psychodiagnostic Signs,” Journal of Abnormal Psychology 74 (1969): 271–80.

(18) P. Slovic and S. Lichtenstein, “Comparison of Bayesian and Regression Approaches to the Study of Information Processing in Judgment,” Organizational Behavior & Human Performance 6 (1971): 649–744.

(19) M. Bar-Hillel, “On the Subjective Probability of Compound Events,” Organizational Behavior & Human Performance 9 (1973): 396–406.

(20) J. Cohen, E. I. Chesnick, and D. Haran, “A Confirmation of the Inertial-ψ? Effect in Sequential Choice and Decision,” British Journal of Psychology 63 (1972): 41–46.

(21) M. Alpert and H. Raiffa, unpublished manuscript; C. A. Stael von Holstein, “Two Techniques for Assessment of Subjective Probability Distributions: An Experimental Study”, Acta Psychologica 35 (1971): 478–94; R. L. Winkler, “The Assessment of Prior Distributions in Bayesian Analysis,” Journal of the American Statistical Association 62 (1967): 776–800.

(22) Kahneman and Tversky, “Subjective Probability”; Tversky and Kahneman, “Availability.”

(23) Kahneman and Tversky, “On the Psychology of Prediction”; Tversky and Kahneman, “Belief in the Law of Small Numbers.”

(24) L. J. Savage, The Foundations of Statistics (New York: Wiley, 1954).

(25) Ibid.; B. de Finetti, “Probability: Interpretations,” in International Encyclopedia of the Social Sciences, ed. D. E. Sills, vol. 12 (New York: Macmillan, 1968), 496–505.