المعاملة بالمثل | نظرية الألعاب: مقدمة قصيرة جدًّا

(١) الألعاب المتكررة

في لعبةٍ من جولةٍ واحدة، لا تستطيع أليس أن تَعِدَ بوب أنها سوف تُسدي إليه خدمةً غدًا إذا هو أسدَى إليها خدمةً اليوم؛ لأننا افترضنا ضمنًا أنهما لن يلتقيَا أبدًا مرةً أخرى. وأبسط حالةٍ يمكن أن ينشأ فيها مفهوم المعاملة بالمثل تقتضي أن يلعب نفس اللاعبَيْن نفس اللعبة مرارًا وتكرارًا.

(١-١) التكرار ذو الأفق المحدود

نَخْلص في لعبة معضلة السجينين إلى حقيقة أن التعاون لا يكون عقلانيًّا بالضرورة؛ فهل يثبت خطأُ هذا الاستنتاج غير السارِّ إذا لعبت أليس وبوب اللعبة مرارًا وتكرارًا؟ إذا كان من المعروف عمومًا أن أليس وبوب سيلعبان معضلة السجينين كل يوم طوال الأسبوع القادم، فإن الاستنتاج العكسي يُحتِّم أنَّ الإجابة «لا». ولهذا السبب نفسه يوصف رجال السياسة بأنهم عاجزون عندما تُوشِك فترة ولايتهم على الانتهاء.

يوم السبت — وهو آخر يوم في الأسبوع — ستلعب أليس وبوب لعبة معضلة السجينين العادية، التي فيها تقتضي العقلانيةُ لعبَ «صقر». وفي يوم الجمعة، سيَعْلمان أنَّه ما من شيءٍ يفعلانِه اليوم من شأنه أن يؤثِّر فيما سيحدث غدًا؛ لذلك، سيلعبان «صقر» يوم الجمعة. وبالعمل بترتيبٍ عكسيٍّ خلال كل يومٍ من أيام الأسبوع، نجد أن اللاعبين العقلانيين سيلعبون دائمًا «صقر» (يوجد أيضًا بين توازنات ناش ما هو ليس لعبة فرعية تامة، لكنه يتطلَّب لعب «صقر» على مسار التوازن).

(١-٢) التكرار غير المحدود

هل علينا أن نستنتج أن التعاون العقلاني مستحيل حتى عند تكرار لعبة معضلة السجينين؟ سيكون هذا استنتاجًا متسرِّعًا؛ لأنه من غير الواقعي أن نفترض أن أليس وبوب على يقينٍ من أنهما لن يتعاملا معًا مرةً أخرى بعد يوم السبت القادم. فالعلاقات في الحياة الواقعية غالبًا ما تكون ذات نهايةٍ مفتوحة؛ أيْ بلا حدودٍ زمنيةٍ ثابتة؛ لذا، ماذا يحدث في لعبة معضلة السجينين المتكررة لو أنه من غير المعروف عمومًا أنَّ أليس وبوب لن يلتقيا مجددًا؟ الإجابة هي أن التعاون العقلاني يصبح الآن ممكنًا.

في أبسط نموذج للعبة، تعتقد أليس وبوب دائمًا أن ثَمَّةَ احتمالًا أكيدًا أنهما سيلعبان معضلة السجينين مرةً أخرى على الأقل، بصرف النظر عن عدد المرات التي لعباها في الماضي. وإذا كان هذا الاحتمال كبيرًا بالقدر الكافي، واللاعبان مهتمَّين بعوائدهما المستقبلية، فإنَّ توازنات ناش للُّعبة المتكررة ستكون كثيرة. وفي بعض هذه التوازنات، يُؤخذ دائمًا بالخيار «حمامة» على مسار التوازن.

لِفهْم ذلك، يكفي النظر إلى استراتيجية «عدم التسامح»، التي تقتضي أن تلعب أليس «حمامة» دائمًا في لعبة معضلة السجينين في نموذجها المتكرر اللامتناهي إلا إذا لعب بوب «صقر» دائمًا. وإذا لعبَ «صقر»، فوفقًا لاستراتيجية «عدم التسامح»، على أليس أن تنتقم بالتحوُّل الدائم إلى «صقر» هي أيضًا. وإذا استخدم كلا اللاعبَيْن استراتيجية «عدم التسامح»، فلن يحثَّ أيٌّ منهما الآخر على لعب «صقر»؛ وبذلك سيلعب كلاهما «حمامة» طوال الوقت. لكن هل يمثل الزوجُ («عدم التسامح»، «عدم التسامح») حالةً من توازن ناش؟

في ضوء كل الردود المُثلى لاستراتيجية «عدم التسامح»، على بوب ألَّا يكون هو البادئَ بلعب «صقر». وإذا لعب «صقر»، فإن أفضل مسارٍ للعائد يمكنه الحصول عليه مستقبلًا هو ٣، ١، ١، ١، …، وهو ما يُعد أسوأ من مسار العائد ٢، ٢، ٢، … الذي يحصل عليه بلعب «حمامة» دائمًا. وبما أن استراتيجية «عدم التسامح» تحثُّ دائمًا على لعب «حمامة» عند المطابقة مع نفسها، فإن هذا يستتبع أن اختيار بوب ﻟ «عدم التسامح» هو الرد الأمثل على اختيار أليس ﻟ «عدم التسامح». وبما أن الشيء نفسه ينطبق على أليس، فإن الزوج («عدم التسامح»، «عدم التسامح») يمثل أحد توازنات ناش للُعبة معضلة السجينين في نموذجها المتكرر اللامتناهي.

(١-٣) العقاب

إنَّ النقاد الذين يعتقدون خطأً أن نظرية الألعاب ترفض فكرة أن الناس إيثاريُّون بطبيعتهم يستاءون أحيانًا من فكرة أن التعاون ربما لا يحدث أحيانًا دون التهديد بالعقاب. ولا يرحبون باستراتيجية «عدم التسامح» على وجه التحديد؛ لأنها تُعاقب أيَّ انحرافٍ عن مسار التوازن بإصرارٍ بالغ.

هؤلاء النقاد محقُّون إلى الحد الذي يكون فيه التهديد بالعقاب جزءًا رئيسيًّا من مفهوم التعاون «المتبادل». إذا قالت أليس لبوب إنها ستُسدي إليه خدمةً لو أنه أسدى إليها خدمة، فإننا نفهم من ذلك ضمنًا أنها لن تسديَ إليه خدمةً إلا إذا أسدى إليها خدمة. والناسُ عادةً لا يُقدِّمون خدمةً إلا إذا كانوا يتوقَّعون خدمةً في المقابل؛ ومن ثَمَّ، تُسحَب الخدمة في حال عدم ردِّها. وأحيانًا يمكن أن يُقدِم الشخص على الإيذاء إن لم تُرَد إليه الخدمة التي قدَّمها من قبل. ومع ذلك، فإن العقوبات المبالَغ فيها — كالموضَّحة في استراتيجية «عدم التسامح» — لا نصادفها إلا في حالاتٍ متطرِّفة في الحياة الواقعية. وتكون العقوبات اليومية متناسبةً مع حجم الإساءة.

شكل ٥-١: تنظيف الشعر المتبادل بين قرود الشمبانزي.

إننا معتادون على الاستجابة على نحوٍ لائقٍ للعقوبات الصغيرة التي تتسبَّب فيها إساءاتٌ بسيطة تَصدر عنا، لدرجة أننا نادرًا ما نلاحِظ حتى أننا نستجيب لها على الإطلاق؛ فالإشارات اللاشعورية الصادرة عمَّن حولنا تُترجَم تلقائيًّا إلى سلوكٍ دون أي تحكُّمٍ واعٍ؛ فلا يتم العقاب دائمًا، وإنما ما يحدث معظم الوقت هو سحب عنصر المكافأة (أو الثواب) قليلًا. ومن أمثلة ذلك أن ينأى الآخر بجانبه قليلًا، وتبدو التحيات جافةً على نحوٍ ملحوظ، ولا تلتقي الأعين وإنما تزوغ في مكانٍ آخر. وهذه كلُّها تحذيرات بأنك في موقف خطر؛ حيث تشير تلك التحذيرات إلى أن الأمر سوف يترتب عليه استبعادٌ اجتماعي أشد وقعًا إذا لم تصحِّح أوضاعك.

(١-٤) الإيثار

إنَّ حقيقة أن خبراء نظرية الألعاب يعتقدون أن التعاون المتبادَل يوجد بمعدلٍ أكبر مما ندركه بالفعل؛ لا تشير ضمنًا إلى أنهم يرَوْن أن التعاون مستحيل من دون تطبيق مفهوم المعاملة بالمثل. إذا كانت لدى الأشخاص تفضيلات إيثارية بقدرٍ كافٍ، فإن التعاون العقلاني يمثِّل مشكلةً إذن في ألعاب الجولة الواحدة. على سبيل المثال، إذا كانت لدى أليس وبوب تفضيلات نفعية تجعلهما يرغبان في زيادة مجموع عوائدهما معًا بدلًا من عوائد كلٍّ منهما منفردًا، فسيكون توازن ناش لكليهما أن يلعبا «حمامة» في لعبة معضلة السجينين. (سوف نصادف هذه الحالة بالضبط عندما تكون أليس وبوب توءمين متماثلين في لعبة «صقر/حمامة» في الفصل الثامن).

أما عن مدى اهتمام الناس بعضهم ببعض، فهو سؤال تجريبي تقف نظرية الألعاب صامتةً أمامه بالضرورة. وفي رأيي على الرغم من أن المزيج البشري يحتوي بوضوحٍ على بعض نماذج الخير مثل دكتور جيكل في رواية «قضية الدكتور جيكل والسيد هايد الغريبة»، فإنني لا أحبذ الانضمام إلى مدينةٍ فاضلةٍ ترفض وجود نماذج الشر من أمثال السيد هايد.

تصلح مثل هذه المدن الفاضلة كنقطةِ بدايةٍ ننطلق منها، لكن الإيجابيات الأصلية تزول علانيةً عندما يستجيب اللاعبون دون وعيٍ لدوافعهم الفردية؛ فهنا، على سبيل المثال، يشرح مأمور الضرائب لماذا أوضح استطلاعُ رأيٍ ارتفاع نسبة من يرَوْن أن التَّهرب الضريبي أمرٌ مقبول من ١١٪ إلى ١٧٪ على مدار السنوات الخمس الماضية: «إنه إحساس أساسي بالعدل؛ فثَمَّةَ مَنْ يمتثلون للقانون، ويرَوْن آخرين يخالفونه، ومع مرور الوقت، يشعرون أنهم مغفلون» (مارك إفريت في «يو إس إيه توداي»، ٨ أبريل ٢٠٠٤). لذلك، تُواصِل مصلحة الضرائب الأمريكية أعمال المراجعة والتدقيق على افتراض أن الجميع تقريبًا سيجد عذرًا في النهاية يبرِّر به تهرُّبه الضريبي إذا لم يُقابَلوا بضوابط ووسائل ردعٍ كافية.

(٢) نظرية القطيع

هل يمكن لاستراتيجياتٍ أخرى غير «عدم التسامح» أن تدعم التعاون العقلاني في نموذج لعبة معضلة السجينين المتكرر إلى ما لا نهاية؟ ماذا عن التعاون العقلاني في الألعاب المتكررة الأخرى؟

على الرغم من أن إجابة نظرية الألعاب عن هذه الأسئلة تشكِّل ما يسمَّى ﺑ «نظرية القطيع»، فلا وجود لمفهوم «القطيع»؛ فبعد أن نشَر ناش أفكاره عن توازن ناش، وجد بوب أومان أن جميع مَنْ لهم صلة بهذا الأمر يبدو أنهم على درايةٍ بالمعاني المتضمَّنة في الألعاب المتكررة؛ ولذلك قرَّر أن أفكاره عن الموضوع يجب أن يُنظر إليها على أنها تنتمي إلى عقلية القطيع.

أوضح ديفيد هيوم سابقًا جدوى التبادلية عام ١٧٣٩، لكنني لا أتوقَّع أن أومان كان يعرف أي شيءٍ عن أعمال هيوم. وبالمثل، لم يكن عالِم الأحياء روبرت تريفرز على درايةٍ بأفكار أومان عندما أعاد إنتاج هذه الأفكار تحت اسم «الإيثار المتبادَل» بعد ٢٠ عامًا من ذلك. ولم تتوقف محاولات إعادة استكشاف هذه الفكرة إلا مع نشْر أكسلرود لعمله «تطوُّر التعاون» عام ١٩٨٤، تمامًا كما توقفت محاولات استكشاف أمريكا بعد رحلة كولومبوس عام ١٤٩٢.

(٢-١) لعبة الثقة المصغَّرة

عندما كنتُ طفلًا، أذكر أنني كنتُ أتساءل: لماذا يسلِّم أصحابُ المتاجرِ البضائعَ بعد أن تُدفَع إليهم قيمتها. لماذا لا يأخذون المال فحسب؟

يطلِق علماء الاقتصاد على ذلك «مشكلة التحفُّظ». ومثالي المفضَّل هو سوق الألماس بأنتويرب؛ فالتجار يُعطُون الألماس — وهو شيءٌ ثمينٌ للغاية — من أجل فحصه ولا يطلبون إيصالًا. لماذا لا يتعرَّضون للغش والاحتيال؟ أبسط تفسيرٍ لذلك وجدتُه في العدد ٢٩ من جريدة «نيويورك تايمز» الصادر بتاريخ أغسطس ١٩٩١. فعندما سُئل تاجر عن سبب اعتماده على أمانة صاحب محل الأنتيكات الذي يبيع بضاعته مقابل عمولة، أجابَ التاجر الذي لا يعلم شيئًا عن استراتيجية «عدم التسامح» قائلًا: «من المؤكَّد أنني أثق فيه؛ فالمرء يعلم الأشخاص الذين يمكنه الوثوق بهم في هذه المهنة. والذين يخونونه يُسقطهم من حساباته ولا يتعامل معهم مرةً أخرى.»

إنَّ لعبة الثقة المصغَّرة هي نموذج من الألعاب التي تُلقي الضوء على مسألتَي الثقة والسُّمعة هاتين. عندما تُقدِّم أليس خدمةً إلى بوب، وهي واثقةٌ من أنه سيبادلها المعاملة بالمثل من خلال دفعه مقابل هذه الخدمة، فإن نوع المأزق هنا يكون هو نفسه الموجود في لعبة الاختطاف في شكل ٣-٢. ولمعرفة السبب، كلُّ ما عليك هو أن تعيد تسمية استراتيجية «إطلاق السراح» لأليس باستراتيجية «التقديم» واستراتيجية «الْتزام الصمت» لبوب باستراتيجية «الدفع».

بما أنَّ لعبة الاختطاف تتضمَّن حالةً فريدة من توازن اللعبة الفرعية التامة، فالأمر ينطبق أيضًا على لعبة الثقة المصغَّرة. لن تُقدِّم أليس الخدمة لأنها تتوقع أن بوب لن يدفع. لكن تقول لنا نظرية القطيع إن كل زوج من العوائد في المنطقة المظلَّلة تظليلًا كثيفًا في شكل ٥-٢ يمثل نتائج توازن ناش للُّعبة «المتكررة» اللامتناهية، بما في ذلك زوج العائد (٢، ١) الذي ينشأ عندما تُقدِّم أليس خدمةً دائمًا ويدفع بوب دائمًا.

شكل ٥-٢: نظرية القطيع. توضح المناطقُ المظلَّلةُ الأماكنَ التي تمثل عوائد التعاون في لعبة معضلة السجينين ولعبة الثقة المصغَّرة. وهذه هي أزواج العوائد التي استطاع اللاعبان الاتفاق عليها في حال أصبحت المساومات السابقة للَّعب قابلة للتنفيذ. توضح المثلثات المظلَّلة على نحوٍ كثيف أزواج العوائد لكل لعبة، التي توضح نظرية القطيع أنها متوافرة كنتائج في حالة التوازن في النماذج المتكررة من اللعبتين عندما يتحلَّى كلا اللاعبَيْن بقدرٍ كافٍ من الصبر.

لفهم السبب في جدوى نظرية القطيع ونجاحها، من المفيد السؤال عن الاحتمالات التي ستُتاح لكلٍّ من أليس وبوب إذا تفاوضَا مقدمًا على الطريقة التي سيلعبان بها لعبة الثقة المصغَّرة. وأحد الاحتمالات القائمة أنهما ربما يتفقان على أيٍّ من أزواج العوائد الموضحة في شكل ٣-٢. وتقع هذه الأزواج من العوائد في زوايا المثلث المظلَّل في شكل ٥-٢، ويمكن تحقيق النقاط المتبقية في المثلث كحلول وُسطى يحصل عليها اللاعبان من خلال رمْي العملات أو لعِب الأدوار. على سبيل المثال، يقع زوج العائد الذي ينتج في حال اتفاق أليس وبوب على أن تُقدِّم أليس الخدمة دائمًا فيما يدفع بوب لنصف الوقت فقط في مكانٍ وسطٍ بين الزوجين (صفر، ٢) و(٢، ١). ونظرًا لأن المثلث المظلَّل يتضمَّن كل الحلول الوُسطى الممكنة التي من المحتمَل أن يتفق عليها أليس وبوب، فإنه يُسمَّى منطقة العوائد التعاونية للعبة الثقة المصغَّرة.

إنَّ المشكلة في رواية المساومة أنها لا تنجح إلا بوجود وكيلٍ خارجيٍّ من نوعٍ ما، يكون على استعدادٍ لتنفيذ أي عقودٍ ربما يُبرمها كلٌّ من أليس وبوب وتكون لديه القدرة على تنفيذها. ومن دون هذا الوكيل الخارجي، يكون أي اتفاقٍ بين أليس وبوب ضربًا من «المراقبة الذاتية»؛ بمعنى أنه يجب أن يكون الأفضل للَّاعب أن يحافظ على الاتفاق شريطة أن يَلقى المعاملة نفسها من اللاعب الآخر؛ وبناءً على ذلك، لا تتوافر أي اتفاقاتٍ قابلةٍ للتطبيق سوى توازنات ناش؛ ومن ثَمَّ، فالاحتمال الوحيد أمام اللاعبين العقلانيين في لعبة الثقة المصغَّرة ذات الجولة الواحدة؛ هو النتيجة غير الفعالة التي لا تُقدِّم فيها أليس الخدمةَ لأن بوب لن يدفع. ولكن ماذا يحدث في حال تكرار اللعبة لعددٍ غير محددٍ من المرات؟

إنَّ توازن ناش في اللعبة المتكررة هو دائمًا أن نظل نلعب توازن ناش للُّعبة ذات الجولة الواحدة، لكن نظرية القطيع تشير إلى وجود المزيد من التوازنات دائمًا. إذا كان اللاعبان يتحلَّيان بالقدر الكافي من الصبر وسعة الصدر، وثَمَّةَ احتمال كبير لتكرار اللعبة ولو لمرةٍ واحدةٍ على الأقل، فإن أي زوج عوائد داخل منطقة عوائد التعاون يكون بمنزلة نتيجةٍ من نتائج توازن ناش، شريطة أن يدفع لكلا اللاعبَيْن قيم أدنى الأقصى أو ما يزيد عنها.

إنَّ الحُجة الأساسية سهلةٌ للغاية، حتى إنه لم يكن مستغربًا أن يكتشفها كلُّ مَن درسوا الألعاب المتكررة بعد أن نشر ناش فكرة توازنه عام ١٩٥١. اخترْ أيَّ اتفاقٍ محتمَلٍ داخل منطقة عوائد التعاون. لتحويل هذا الاتفاق إلى نتيجةٍ لتوازن ناش، نحتاج فقط إلى أن نعاقب أيَّ لاعبٍ يَحِيد عن الاستراتيجية التي يجب أن يتبعها كلا اللاعبَيْن لتنفيذ الاتفاق. وتحقيقًا لأغراض هذه الحُجة، فإن الأسهل هو استخدام العقوبة الصارمة التي تتميَّز بها استراتيجية «عدم التسامح»، والتي فيها يُعاقَب للأبد أيُّ انحرافٍ بأكثر الطرق الصارمة المتاحة.

ما أقسى عقابٍ تستطيع أليس أن تُنزِله ببوب؟ أسوأ عقاب هو ألا تدعَ أمامه خيارًا سوى الحصول على عائد أدنى الأقصى الخاص به؛ لأنه سيستجيب لمحاولتها تقليلَ عائده باختيار الإجابة التي تعظِّم عائده في ضوء اختيارها لاستراتيجية العقاب. في معضلة السجينين، عائد أدنى الأقصى لكلا اللاعبَيْن هو صفر. وفي لعبة الثقة المصغَّرة، عائد أدنى الأقصى لأليس هو واحد، وعائد أدنى الأقصى لبوب هو صفر؛ ولذلك، توضح المناطق المظلَّلة تظليلًا كثيفًا في شكل ٥-٢ كل الاتفاقيات النابعة من المراقبة الذاتية للنماذج المتكرِّرة اللامتناهية من معضلة السجينين ولعبة الثقة المصغَّرة. ولا توجد اتفاقات أخرى يمكن دعمها كنتائج لتوازن ناش.

(٢-٢) ما مواضع الخطأ المحتمَل؟

على الرغم من سهولة إثبات ذلك، أعتقد أن نظرية القطيع ربما تُجسِّد أهم رأيٍ في الفلسفة السياسية؛ فهي تقول إننا لا نحتاج إلى وكالة إنفاذٍ خارجية — سواءٌ صورية أو حقيقية — لإنجاح التعاون. وفي أي موقفٍ متكرر، يمكننا الاستمتاع بكل ثمار التعاون بأن نصير رُقباءَ على أنفسنا.

على الرغم من ذلك، تنطوي نظرية القطيع على قصورٍ كبير؛ فهي تفترض أن أيَّ انحرافٍ عن مسار التوازن سيُلاحَظ من قِبل اللاعبين الآخرين. ومن المحتمَل ألا يكون ذلك بالافتراض السيِّئ في حالة المجموعات الصغيرة في مجتمعات الصيد وجمع الثمار التي شهدت بداية تطوُّر الثقافة البشرية. وفي القرى الصغيرة الآن، يُفترَض أن كل الناس يعرف بعضهم بعضًا. ولكن، لا ينطبق هذا بكل تأكيد على الحياة في المدن الحديثة؛ ففي المدن الكبيرة التي يجهل الناسُ فيها بعضُهم أسماء بعض، لا يمكن للمرء في أحيانٍ كثيرةٍ أن يكتشف المنحرفين ويعاقبهم على النحو الذي يمنع الاحتيال والغش؛ فنحن نبذل قصارى جهدنا، وأفضل ما لدينا هو وجود كاميرات المراقبة ورجال الشرطة والمراقبين ومفتشي الضرائب وما شابه ذلك، لكن لا أحد يمكن أن يزعم أن جهودنا في هذا الصدد تقترب بأي حالٍ من الفاعلية.

كنتُ أتمنى أن أستطيع الجزم بأن خبراء نظرية الألعاب لديهم كل الإجابات لمسألة المراقبة غير التامة، لكن هذه المسألة لا تزال موضوعًا غير مُستوفَى الدراسة على الرغم من جهود العديد من الأشخاص الماهرين. وربما يكون هذا هو جانب نظرية الألعاب الذي سيؤدي أيُّ تقدمٍ مستقبليٍّ فيه إلى تحقيق فوائد اجتماعية جمَّة.

(٣) واحدة بواحدة

يعتقد معظم علماء الاجتماع أن كلَّ ما ينبغي معرفته عن المعاملة بالمثل يتلخَّص في استراتيجية «واحدة بواحدة» للُعبة معضلة السجينين في نموذجها المتكرر اللامتناهي. فوفقًا لهذه الاستراتيجية، على اللاعب أن يبدأ بلعب «حمامة» ثم يحاكي ما فعله اللاعب الآخر في المرة الماضية؛ ومن ثَمَّ، يتحقَّق توازن ناش إذا لعب كلٌّ من أليس وبوب باستراتيجية «واحدة بواحدة» كما في حالة توازن ناش إذا لعب كلاهما «عدم التسامح»، لكن لا تفرض استراتيجية «واحدة بواحدة» معاقبةَ أيِّ انحرافٍ بقسوة، وإنما تُسامِح اللاعبين التائبين بعد أن يتراجعوا عما فعلوه بأن يلعبوا «حمامة» مرةً أخرى.

ترجع شعبية استراتيجية «واحدة بواحدة» إلى أولمبياد بوب أكسلرود، التي دُعيَ إليها علماء الاجتماع لتقديم برامج كمبيوتر لمقارنتها بعضها ببعضٍ في نموذجٍ متكررٍ لا متناهٍ لمعضلة السجينين. وبعد معرفة نتيجة جولةٍ تجريبية، قدَّم المتسابقون برامج طبقت ٦٣ استراتيجية من الاستراتيجيات المحتمَلة اللامتناهية للُّعبة.

استراتيجية «واحدة بواحدة» كانت أكثر الاستراتيجيات نجاحًا في المسابقة؛ لذلك، استمر أكسلرود في محاكاة تأثير التطوُّر على كل الاستراتيجيات المقترَحة البالغ عددها ٦٣ استراتيجية. وحَسمت حقيقةُ أن استراتيجية «واحدة بواحدة» كانت هي الأكثر استخدامًا في جميع البرامج التي صمدت في نهاية المحاكاة التطورية؛ المسألةَ بالنسبة إلى أكسلرود، الذي اقترح بعد ذلك استراتيجية «واحدة بواحدة» كنموذجٍ مناسبٍ للتعاون الإنساني بمفهومه الشامل. وفي وصف مميزات هذه الاستراتيجية، يقول أكسلرود:

إنَّ سبب النجاح الهائل لاستراتيجية «واحدة بواحدة» هو مزيجها الذي يجمع بين الكياسة والانتقام والتسامح والوضوح؛ فكياستها تمنعها من الدخول في مشكلاتٍ غير ضرورية. والانتقام يثني الجانب الآخر عن التمادي في الخيانة. والتسامح يساعد على إرساء سبل التعاون المتبادل. والوضوح يجعلها مفهومةً للاعب الآخر، ومن ثَمَّ ينشأ التعاون الطويل المدى.

إلا أن وصف استراتيجية «واحدة بواحدة» بأنها الاستراتيجية الأكثر نجاحًا في محاكاة أكسلرود فيه إساءة إلى الاستراتيجيات الأخرى؛ فقد نجحت ستٌّ من الاستراتيجيات التي دخلت الأولمبياد في العملية التطورية؛ ومن ثَمَّ فالفائز الحقيقي هو الاستراتيجية المختلطة التي تُلعَب فيها الاستراتيجيات الباقية بنفس التكرار الذي كانت موجودة به عندما استقرَّت العملية. وفي الواقع، كان معدل تكرار استراتيجية «واحدة بواحدة» في هذا المزيج المكوَّن من ست استراتيجيات أكثر بقليل من ١ / ٦. كما أن النجاح المحدود الذي حققتْه استراتيجية «واحدة بواحدة» في المحاكاة لم يكن هائلًا عندما تنوَّعت مجموعة المشتركين الأولى. وتكون استراتيجية «عدم التسامح» جيدة تمامًا عندما لا تتحيَّز مجموعة المشتركين الأولى إلى استراتيجية «واحدة بواحدة».

عرَّف أكسلرود الاستراتيجية الجيدة بأنها الاستراتيجية التي لا تبادر بلعب «صقر» أبدًا، لكن ليس صحيحًا أننا نستطيع الاعتماد على التطوُّر لإبداء سلوكٍ جيدٍ حسبما يشير. عندما يُسمَح لنسبةٍ ضئيلةٍ من الأشخاص السريعي الانخداع، الذين يستحقون أن يتعرضوا للاستغلال بسبب سذاجتهم، أن توجد في المنظومة باستمرار، تتفوَّق الاستراتيجيات المتوسطة في أدائها على استراتيجية «واحدة بواحدة». وأبسط مثالٍ على هذه الاستراتيجيات المتوسطة هي «البدء بالهجوم»، والتي تبدأ بلعب «صقر» ولا تُحوِّل نهجها إلا في حالةٍ واحدة؛ وهي إذا لعب اللاعب الخصم «صقر» في المرة الأخيرة. وتمثل استراتيجيتا «البدء بالهجوم» توازنَ ناش في النموذج المتكرر اللامتناهي من لعبة معضلة السجينين، الذي فيه يحدث التعاون بعد الجولة الأولى فقط من اللعب.

أما بالنسبة إلى الوضوح، فمن الضروري فقط لكي يتطوَّر التعاون أن تستطيع النسخة الطافرة أن تتعرَّف على نسخةٍ من نفسها.

لا يتبقَّى إذن على قائمة أكسلرود سوى الشرط الذي يقتضي أن تكون الاستراتيجية الناجحة قائمة على الانتقام. وربما يكون هذا هو الادِّعاءَ الذي تسبَّب في الجزء الأكبر من الضرر؛ لأنه ينطبق فقط في حالة التفاعلات الثنائية. على سبيل المثال، يُزعم أن المعاملة بالمثل لا يمكن أن تفسِّر تطوُّر الصداقة. وصحيحٌ أن التحالفات الهجومية الدفاعية لقرود الشمبانزي لا يمكن تفسيرها بأيٍّ من الروايات الخاصة باستراتيجية «واحدة بواحدة». فإذا كانت أليس بحاجةٍ إلى المساعدة لأنها مُصابة أو مريضة، فلن يكون لدى حلفائها أيُّ دافع لمساعدتها؛ لأنها من غير المحتمَل الآن أن تكون مفيدةً كحليفٍ في المستقبل؛ ومن ثَمَّ، فإنَّ أيَّ تهديدٍ من جانبها بسحْب تعاونها سيكون عديم الجدوى. لكن، ليس بالضرورة أن يكون اللاعب المُصاب هو الذي يعاقِب اللاعب الغشَّاش في التفاعلات التي تتضمن أفرادًا متعددين. فسيراقب الآخرون الموقف في حال تخلَّى بوب عن أليس وتركها لتواجه مصيرها منفردةً، وسيعاقبونه على غدره من خلال رفضهم لتكوين أيِّ تحالفاتٍ معه في المستقبل؛ ففي النهاية، مَنْ يريد أن يتحالف مع شخصٍ معروفٍ عنه أنه يتخلَّى عن أصدقائه عندما يكونون في محنة؟

أعتقد أن الحماس لاستراتيجية «واحدة بواحدة» مستمرٌّ لنفس الأسباب التي يستند إليها الناس في زعم أنه من العقلاني أن يحدث تعاون في لعبة معضلة السجينين ذات الجولة الواحدة؛ فهم يريدون أن يصدِّقوا أن الجنس البشرى متمسك في جوهره بأهداب الفضيلة. لكنَّ الدرسَ الحقيقيَّ الذي علينا أن نتعلمه من أولمبياد أكسلرود والكثير من نماذج المحاكاة التطوُّرية اللاحقة مُطمئِن بدرجةٍ لا متناهية. وعلى الرغم من أن ادِّعاءات أكسلرود فيما يتعلَّق باستراتيجية «واحدة بواحدة» مبالَغ فيها للغاية، فإن استنتاجه أن التطوُّر ينشأ على الأرجح من نتيجةٍ تعاونيةٍ يبدو قويًّا حقًّا؛ لذلك، لا يلزم التظاهر أننا جميعًا دكتور جيكل حتى نفسر كيف ننجح في التعامل بعضنا مع بعضٍ بعدالةٍ وإنصافٍ معظم الوقت؛ فحتى المجتمع الذي يضم الكثير من أمثال السيد هايد يستطيع أن يتعلَّم مع مرور الوقت أن يُنسِّق بأسلوبٍ متوازنٍ وفعَّالٍ في لعبةٍ متكررةٍ لا متناهية.

(٤) ظواهر طارئة

انتُقِدت أحيانًا نماذج نظرية الألعاب للعلاقات الاجتماعية بأنها اختزالية؛ لأنها لا تشير مطلقًا إلى مفاهيم مثل: السلطة واللوم والكياسة والواجب والغبطة والصداقة والشعور بالذنب والشرف والنزاهة والعدالة والوفاء والتواضع والتملُّك والفخر والشهرة والحالة الاجتماعية والثقة والفضيلة وما شابه ذلك. ويُستنتَج من ذلك أن نظرية الألعاب فرعٌ من المعرفة اللاإنسانية يتعامل مع البشر كما لو كانوا أجهزة روبوت.

صحيحٌ أن نظرية الألعاب مختزلة، شأنها شأن كل العلوم الناجحة، لكن لا يستتبع ذلك أن يعتقد خبراء نظرية الألعاب أن مفاهيم مثل السلطة أو الواجب غير ذات صلةٍ بالسلوك الإنساني، بل على العكس؛ فنحن نؤمن بأن مثل هذه المفاهيم هي ظواهر طارئة تنشأ عندما يحاول الناس أن يفهموا التوازنات التي يجدون أنفسهم يلعبونها في لعبة الحياة.

على سبيل المثال، يتمثَّل التفسير الجماعي الشائع للتوازن — الذي فيه تُقدِّم أليس الخدمة دائمًا، ويدفع بوب دائمًا في لعبة الثقة المصغَّرة — في أن بوب لن يتحمل أن يخسر الأمانة التي اشتُهر بها عندما يخدع أليس؛ لأنها سترفض أن تُقدِّم له أي خدمة في المستقبل. وعمليًّا، سيكون بوب عادةً شخصًا جديدًا، لكن ما زال يَحدث نفس التوازن؛ لأنه لا أحد غير أليس سيكون مستعدًّا للتعامل مع شخصٍ يُشتَهر بعدم الدفع.

بعيدًا عن إنكار مثل هذه الروايات، تُقدِّم نظرية الألعاب تفسيرًا دقيقًا للأسباب التي تجعلها مجديةً أحيانًا وغير مجديةٍ في أحيانٍ أخرى. على سبيل المثال، يقول نقادنا إننا مُخطِئُون بشأن لعبة الثقة المصغَّرة؛ لأن الناس ما زالوا يدفعون ما عليهم، حتى في ألعاب الجولة الواحدة التي تكون فيها شهرتهم بالأمانة غيرَ ذات صلةٍ بالموضوع. لكنني ألاحظ أن محطات الوقود تجعلك على نحوٍ متزايدٍ تَدفع مقدَّمًا نظير البنزين الذي تحصل عليه، ويرجع هذا على ما يبدو إلى أنها كثيرًا ما مرَّت بتوازُن اللعبة الفرعية التامَّة في لعبة الثقة المصغَّرة ذات الجولة الواحدة، لدرجة أنها لا ترغب في اللعب مرةً أخرى.

(٤-١) السلطة

يخبرنا ديفيد هيوم أن سلطة الباباوات والرؤساء والملوك والقضاة ورجال الشرطة وغيرهم ما هي إلا مسألة عرف وعادة. تطيع أليس الملك لأن ذلك هو العُرف السائد، ويستمر العُرف لأن الملك سيأمر بوب بمعاقبة أليس إذا لم تُطِعْه. لكن لماذا يطيع بوب الأمر بمعاقبة أليس؟ باختصار: مَنْ يحرس الحرَّاس؟

تجيب نظرية الألعاب عن هذا السؤال القديم بتوضيح أن نسخة نظرية القطيع لا تؤكِّد توازنات ناش فحسب، لكن أيضًا توازنات اللعبة الفرعية التامة. عندما يكون هذا التوازن قيد الاستخدام، فمن المثالي دائمًا أن تعاقب أي سلوك شاذٍّ يؤدِّي بنا إلى لُعبة فرعية خارج مسار التوازن. ولو انحرفتَ أنت شخصيًّا بمحاولة التهرُّب من التكلفة المترتبة على معاقبة أيِّ منحرف، فستأخذنا إلى لعبة فرعية أخرى حيث يكون الحل المثالي لِلَاعب آخر أن يعاقبك. ولو أنه فشل في ذلك، فسننتقل إلى لعبة فرعية أخرى، وهكذا للأبد.

ظنَّ إيمانويل كانط بسذاجةٍ أن السبيل إلى تأمُّل سلاسل المسئولية هذه هو أن تبدأ ارتدادًا لا نهائيًّا، لكن نظرية القطيع توضِّح أن سلاسل المسئولية يمكن أن تُصمَّم بعضها على بعض. ونظرًا لوجود عدد محدَّد من اللاعبين، فإنَّ سلاسل المسئولية هذه تكون مغلقة بالضرورة على نحوٍ لم يستطِع كانط أن يدرسه. تطيع أليس الملك؛ لأنها تخشى أن يعاقبها بوب إذا لم تفعل ذلك. ومن المحتمَل أن يطيع بوب الأمر بمعاقبة أليس؛ لأنه يخشى أن تعاقبه كارول إذا لم يفعل ذلك. ومن المحتمَل أن تطيع كارول الأمر بمعاقبة بوب؛ لأنها تخشى أن تعاقبها أليس إذا لم تفعل ذلك.

للوهلة الأولى، يبدو هذا المسار الحلزوني للمعتقدات الذاتية التأكيد هشًّا للغاية، لدرجة أنه لا يشكِّل أساسًا راسخًا لأي شيء. صحيحٌ أن المعتقدات تدور في حلقة مفرغة، لكن نظرية القطيع توضِّح أن هشاشتها ما هي إلا وهم؛ لأن السلوك المتولِّد عن المعتقدات يترسَّخ في صورة توازن لعبة فرعية تامة.

(٤-٢) الواجب

يروي لنا علماء الأنثروبولوجيا أن مجتمعات الصيد وجمع الثمار لم يكن لديها هيكل سلطة. فالطعام يُجمَع ثم يُوزَّع وفقًا لمبدأ أن الكل يشارك حسب قدراته، ويستفيد تبعًا لاحتياجاته.

كيف يمكن لعقدٍ اجتماعي كهذا أن يبقى؟ فإذا كانت آليَّةُ «واحدة بواحدة» متوافرة، فلماذا يتشارك أيُّ شخصٍ الطعامَ مع قوم ضعفاء خارج نطاق أسرهم؟ لكن ليس بالضرورة أن يلجأ كلُّ مَن يُترك ليتضوَّر جوعًا إلى إنزال العقاب نظير عدم المشاركة. ففي الفِرق الحديثة المسئولة عن توفير الغذاء، تشترك المجموعة بأسرها في معاقبة أي منحرف.

لمعرفة الآليَّة التي يمكن من خلالها إنجاح ذلك، تخيَّل عالَمًا افتراضيًّا تعيش فيه أمٌّ وابنتها فقط في أي وقت. تعيش كلُّ لاعبة فترتين: الفترة الأولى هي شبابها، والثانية هي شيخوختها. في شبابها، تخبز اللاعبة رغيفَي عيش كبيرين. بعد ذلك تلد ابنة، وتصير فورًا طاعنةً في السن. لا تقوى اللاعبات الكبيرات في السن على العمل؛ ولذلك لا ينتجن شيئًا.

يتطلَّب أحد التوازنات من كل لاعبة أن تأكل كلا الرغيفين اللذين خبزتهما في شبابها. ومن ثَم، ستحيا كلٌّ منهما حياةً بائسة عندما تتقدَّم بها السن، لكن ستُحسِن كل لاعبة اختياراتها في ضوء اختيارات الأخريات. ومن ثم كل اللاعبات سيفضِّلن استهلاك رغيف واحد في الشباب والآخر في الشيخوخة. لكن هذه النتيجة «العادلة» لا يمكن أن تُنفَّذ إلا إذا أعطت كل ابنة أحد رغيفي الخبز لأمها؛ لأن الخبز يتلف إذا لم يُستهلَك عند خبزه.

ليس بمقدور الأم أن تنتقم من ابنتها إذا تصرَّفت الابنة بأنانية، لكن من الممكن على الرغم من ذلك أن تظلَّ النتيجة العادلة أحد التوازنات المحتمَلة. ففي هذا التوازن العادل، اللاعبة الملتزمة هي التي تعطي أمَّها رغيفًا من الخبز في حالةٍ واحدة فقط؛ وهي أن تكون أمها لاعبة ملتزمة في شبابها. لذلك، يكافئ الملتزم ملتزمين آخرين، ويعاقب غير الملتزمين.

لمعرفة السبب في أن الابنة تعطي الأم رغيفًا من الخبز، افترِضْ أن أليس وبياتريس وكارول يُمثِّلْن الأم والابنة والحفيدة. إذا أهملت بياتريس أليس، فإنها تصبح غير ملتزمة؛ ولذا، تعاقِب كارول بياتريس لتتفادى أن تصبح هي الأخرى غير ملتزمة. إذا لم تصبح ملتزمة، فإنها تعاقَب من ابنتها، وهكذا. إذا اعتُبِر أن اللاعب المولود أولًا ملتزم، فإن توازن اللعبة الفرعية التامة يقتضي أن يكون الجميع ملتزمًا. ولكن، الشخص المتضرِّر لا يكون أبدًا هو الشخص الذي يُعاقَب على الإخلال بالعقد الاجتماعي. فالشخص المتضرِّر يكون في حقيقة الأمر قد مات وقت المعاقبة على الإخلال!

في الحياة الواقعية، نقول إنه من «واجب» البنات رعاية أمهاتهنَّ الضعيفات. ويوضِّح المثال كيف أن مثل هذه الواجبات يمكن أن تكون مشرِّفة في عالم عقلاني حتى لو كانت كل البنات أنانيات قاسيات القلب.

(٥) دور المشاعر

قديمًا، طُرِحَت المشاعر جانبًا بوصفها دوافع غير عقلانية متبقية من تاريخنا التطوري. ولا تزال المشاعر المستثارة اجتماعيًّا المرتبطة بالفخر والغيرة والغضب تصنَّف ضمن الخطايا السبع المُهلِكة. لكن إذا كانت هذه المشاعر مدمِّرة ذاتيًّا كما تقضي العادة، فكيف أمكَن للتطور أن يزوِّدنا بها؟ إنني متفق مع النظرة العامة السائدة حاليًّا التي ترى أننا مُخطِئُون تمامًا فيما نذهب إليه عادةً مِن زعمٍ بعدم وجود دور مفيد لردود أفعالنا الشعورية والانفعالية تجاه الأحداث الاجتماعية.

على سبيل المثال، ينشأ السيناريو المثالي للتعبير عن الغضب عندما تُعامِل أليس بوب بأسلوب غير منصف. ومن المحتمَل أن يصيبها بأذًى في ثورة غضبه على تعاملها غير العادل معه. لذلك، تتحكَّم أليس في دوافعها المكتسَبة حتى لا تثير حنقه.

بهذه الطريقة، يمكن المحافظة على توازنات فعَّالة في الألعاب المتكرِّرة دون أن يشعر اللاعبون أنهم يلعبون لعبةً متكرِّرة. وإلا، فكيف يتمكَّن الشمبانزي من المحافظة على مستوياتٍ عالية من الإيثار المتكرِّر؟ كيف يمكن للبشر أن يحذوا الحذو نفسه إذا كان علينا دائمًا أن نقضي نصف ساعة أو أكثر في حسابِ ما يتعيَّن علينا فعله قبل اتخاذ أي إجراء؟ يجب بالتأكيد أن يكون جزءٌ من تفكيرنا في هذه المواقف فطريًّا غير مكتسَب، وربما يعني الدخول في حالة شعورية ببساطةٍ هو ما نشعر به عندما تسيطر غرائزنا الفطرية وردود أفعالنا التلقائية على زمام الأمور.

(٦) الانتقام

افترِضْ أن بوب يجازف بإلحاق الأذى بنفسه في حال أن صبَّ جامَ غضبه على أليس بعد تعامُلها غير العادل معه. يمكن عندئذٍ أن يُرفض سلوكه بسهولة بوصفه غير عقلاني من قِبل المراقبين الذين لا ينتبهون إلى ملاحظة أنه لا يتعيَّن عليه بالضرورة أن يتصرَّف بأسلوب جامح في لعبةٍ ذات جولة واحدة، لكنه ربما يؤدِّي دوره في أحد التوازنات في لعبة متكرِّرة لا متناهية.

تركِّز حاليًّا التجارب التي تُجرى في لُعبة الإنذار النهائي على هذا النوع من الالتباس. لماذا لا يقبل الأشخاص المشتركون في هذه التجارب أي شيءٍ يُقدَّم إليهم في لعبة الإنذار النهائي ذات الجولة الواحدة؟ إحدى الإجابات المشهورة أنهم يغضبون ويرفضون بدافع الغيظ والحنق. ويبدو أن تحليل مستويات التستوستيرون في لُعابهم يؤكِّد أن هذا التفسير صحيحٌ بقدر المعلومات المتوافرة.

لكن لماذا يغضب المشاركون في هذه التجارب؟ أعتقد أنهم يغضبون لأن هذا هو رد الفعل المعتاد منهم على عرضٍ غير منصف في المواقف الواقعية التي نواجه فيها إنذارًا نهائيًّا. يبقى هذا السلوك ويستمر في المواقف المتكرِّرة؛ لأنها تعمل كأداةِ ضبط ومراقبة للتوازن. وينشأ هذا السلوك في الألعاب التجريبية ذات الجولة الواحدة؛ لأن المشتركين لا يقدِّرون في بادئ الأمر كيف أن اللعبة التجريبية تختلف عن ألعاب الحياة التي اعتادوا عليها. لكن لا يستتبع ذلك أننا مجرد روبوتات تحكمنا عواطفنا. فالمشتركون عادةً ما يكيِّفون سلوكهم في الألعاب ذات الجولة الواحدة التي يلعبونها في المعمل كلما اكتسبوا خبرة. وفي لعبة معضلة السجينَيْن، يحتاج المشتركون إلى عشر محاولات فقط حتى يتعلَّم ٩٠٪ منهم أن لعب «حمامة» غير مجدٍ في اللعبة ذات الجولة الواحدة.