في الثلاثينيات من القرن الماضي ، أصبح جون فون نيومان وأوسكار مورجنسترن مؤسسي فرع جديد ومثير للاهتمام من الرياضيات يسمى "نظرية الألعاب". في الخمسينيات من القرن الماضي ، أصبح عالم الرياضيات الشاب جون ناش مهتمًا بهذا الاتجاه. أصبحت نظرية التوازن موضوع أطروحته التي كتبها في سن ال 21. وهكذا ولدت استراتيجية لعبة جديدة تسمى "توازن ناش" ، والتي فازت بجائزة نوبل بعد سنوات عديدة - في عام 1994.
أصبحت الفجوة الطويلة بين كتابة أطروحة والاعتراف العام بمثابة اختبار لعالم الرياضيات. نتج عن العبقرية دون الاعتراف اضطرابات عقلية خطيرة ، لكن جون ناش كان قادرًا على حل هذه المشكلة بفضل عقله المنطقي الممتاز. فازت نظريته في توازن ناش بجائزة نوبل وتم تصوير حياته في عقل جميل.
باختصار عن نظرية اللعبة
بما أن نظرية توازن ناش تشرح سلوك الناس في ظروف التفاعل ، يجدر النظر في المفاهيم الأساسية لنظرية اللعبة.
نظرية اللعبة تدرس سلوك المشاركين (الوكلاء) من حيث التفاعل مع بعضهم البعض مثل لعبة ، عندما تعتمد النتيجة على قرار وسلوك العديد من الأشخاص.يتخذ المشارك قرارات بناءً على توقعاته حول سلوك الآخرين ، وهو ما يسمى إستراتيجية اللعبة.
هناك أيضًا إستراتيجية سائدة يحصل فيها المشارك على أفضل نتيجة لأي سلوك من المشاركين الآخرين. هذه هي أفضل استراتيجية يربح فيها اللاعب.
معضلة السجين واختراق علمي
معضلة السجين هي حالة لعبة يُجبر فيها المشاركون على اتخاذ قرارات عقلانية ، وتحقيق هدف مشترك في مواجهة تضارب البدائل. السؤال هو أي من هذه الخيارات سيختار ، محققًا المصلحة الشخصية والعامة ، فضلاً عن استحالة الحصول على كليهما. يبدو أن اللاعبين مسجونون في بيئة لعب صعبة ، مما يجعلهم في بعض الأحيان يفكرون بشكل منتج للغاية.
اكتشف عالم الرياضيات الأمريكي جون ناش هذه المعضلة. كان التوازن الذي حققه ثوريًا بطريقته الخاصة. لقد أثر هذا الفكر الجديد بشكل مشرق بشكل خاص في رأي الاقتصاديين حول كيفية قيام اللاعبين في السوق باختياراتهم ، مع مراعاة مصالح الآخرين ، مع التفاعل الوثيق وتقاطع المصالح.
من الأفضل دراسة نظرية اللعبة من خلال الأمثلة الملموسة ، لأن هذا النظام الرياضي نفسه ليس نظريًا جافًا.
مثال معضلة السجين
مثال ، قام شخصان بالسرقة ، ووقعا في أيدي الشرطة ويتم استجوابهما في زنزانات منفصلة. في الوقت نفسه ، يعرض ضباط الشرطة لكل مشارك ظروفًا مواتية يتم بموجبها إطلاق سراحه إذا شهد ضد شريكه. كل منلدى المجرمين مجموعة الاستراتيجيات التالية التي سيأخذها في الاعتبار:
- كلاهما يشهد في نفس الوقت ويحكم عليهما بالسجن لمدة 2.5 سنة.
- كلاهما صامت في نفس الوقت ويتلقى كل منهما سنة واحدة ، لأنه في هذه الحالة ستكون قاعدة الأدلة على ذنبهم صغيرة.
- أحدهما يشهد ويطلق سراحه ، والآخر صامت ويحكم عليه بالسجن 5 سنوات.
من الواضح أن نتيجة القضية تعتمد على قرار كلا المشاركين ، لكنهما لا يتفقان ، لأنهما يجلسان في زنزانات مختلفة. كما يظهر بوضوح تضارب المصالح الشخصية في النضال من أجل المصلحة المشتركة. لكل سجين خياران للعمل و 4 خيارات للنتائج.
سلسلة من الاستدلالات المنطقية
إذن ، الجاني أ يفكر في الخيارات التالية:
- أنا صامت وشريكي صامت - سنواجه كلانا سنة واحدة في السجن.
- سلمت شريكي وقام بتسليمني - كلانا سجن 2.5 سنة.
- أنا صامت وشريكي يخونني - سأحكم علي 5 سنوات في السجن وسيكون حرا.
- سلمت شريكي ، لكنه صامت - أحصل على الحرية ، ويحكم عليه بالسجن 5 سنوات.
دعونا نعطي مصفوفة من الحلول الممكنة والنتائج من أجل الوضوح.
جدول النتائج المحتملة لمعضلة السجين
السؤال هو ماذا سيختار كل متسابق
"كن صامتًا ، لا يمكنك التحدث" أو "لا يمكنك أن تصمت ، لا يمكنك التحدث"
لفهم اختيار المشارك ، عليك أن تمر بسلسلة أفكاره. باتباع المنطق الجنائي أ: إذا بقيت صامتًا وظل شريكي صامتًا ، فسنحصل على حد أدنى (سنة واحدة) ، لكننيلا أعرف كيف سيتصرف. إذا شهد ضدي ، فمن الأفضل لي أن أدلي بشهادتي ، وإلا يمكنني الجلوس لمدة 5 سنوات. أفضل الجلوس لمدة 2.5 سنة بدلاً من 5 سنوات. إذا التزم الصمت ، فأنا بحاجة إلى الشهادة ، لأنني بهذه الطريقة سأحصل على حريتي. مشارك ب
ليس من الصعب أن نرى أن الإستراتيجية المهيمنة لكل من الجناة هي الإدلاء بشهادتهم. تأتي النقطة المثلى في هذه اللعبة عندما يدلي كل من المجرمين بشهادتهما ويتسلم "جائزته" - 2.5 سنة في السجن. تسمي نظرية لعبة ناش هذا التوازن.
محلول ناش غير الأمثل
الطبيعة الثورية لوجهة نظر ناشيان هي أن مثل هذا التوازن ليس هو الأمثل عند النظر إلى الفرد المشارك ومصلحته الشخصية. بعد كل شيء ، الخيار الأفضل هو أن تبقى صامتًا وتحرر
توازن ناش هو نقطة التقاء المصالح ، حيث يختار كل مشارك الخيار الأمثل له فقط إذا اختار المشاركون الآخرون استراتيجية معينة.
بالنظر إلى الخيار عندما يكون كلا المجرمين صامتين ويتقاضيان سنة واحدة فقط ، يمكننا أن نطلق عليه خيار Pareto الأمثل. ومع ذلك ، فمن الممكن فقط إذا وافق المجرمون مسبقا. لكن حتى هذا لا يضمن هذه النتيجة ، لأن الإغراء بالانسحاب من الاتفاق وتجنب العقاب كبير. عدم وجود ثقة كاملة في بعضنا البعض وخطر إجبار 5 سنوات على اختيار الخيار مع الاعتراف. فكر فيما سيلتزم به المشاركونالخيار مع الصمت ، والعمل الجماعي ، هو ببساطة غير منطقي. يمكن استخلاص مثل هذا الاستنتاج إذا درسنا توازن ناش. الأمثلة تثبت أنك على حق فقط.
أناني أو عقلاني
أسفرت نظرية توازن ناش عن استنتاجات مذهلة دحضت المبادئ التي كانت موجودة من قبل. على سبيل المثال ، اعتبر آدم سميث سلوك كل من المشاركين أنانيًا تمامًا ، مما جعل النظام في حالة توازن. هذه النظرية كانت تسمى "اليد الخفية للسوق".
رأى جون ناش أنه إذا تصرف جميع المشاركين لمصالحهم الخاصة ، فلن يؤدي ذلك أبدًا إلى نتيجة جماعية مثالية. بالنظر إلى أن التفكير العقلاني متأصل في كل مشارك ، فإن الخيار الذي توفره استراتيجية توازن ناش يكون أكثر ترجيحًا.
تجربة ذكورية بحتة
مثال رئيسي على ذلك هو لعبة شقراء المفارقة ، والتي ، في حين أنها تبدو في غير محلها ، هي توضيح واضح لكيفية عمل نظرية لعبة ناش.
في هذه اللعبة ، عليك أن تتخيل أن شركة من الرجال الأحرار أتت إلى الحانة. في الجوار شركة فتيات ، إحداهن أفضل من الأخريات ، قل شقراء. كيف يتصرف الرجال للحصول على أفضل صديقة لأنفسهم؟
إذن ، منطق الرجال: إذا بدأ الجميع في التعرف على الشقراء ، فعلى الأرجح لن يفهمها أحد ، فلن يرغب أصدقاؤها في التعرف عليها. لا أحد يريد أن يكون البديل الثاني. ولكن إذا اختار الأولاد تجنب ذلكشقراء ، فإن احتمال أن يجد كل من الرجال صديقة جيدة بين الفتيات مرتفع.
حالة توازن ناش ليست مثالية للرجال ، لأنه ، من خلال السعي وراء مصالحهم الأنانية فقط ، سيختار الجميع الشقراء. يمكن ملاحظة أن السعي وراء المصالح الأنانية فقط سيكون بمثابة انهيار مصالح المجموعة. يعني توازن ناش أن كل شخص يتصرف في مصلحته الخاصة ، والتي هي على اتصال بمصالح المجموعة بأكملها. هذا ليس الخيار الأفضل للجميع شخصيًا ، ولكنه الأفضل للجميع ، بناءً على الاستراتيجية الشاملة للنجاح.
حياتنا كلها لعبة
صنع القرار في العالم الحقيقي يشبه إلى حد كبير لعبة تتوقع فيها سلوكيات عقلانية معينة من المشاركين الآخرين أيضًا. في العمل ، في العمل ، في فريق ، في شركة ، وحتى في العلاقات مع الجنس الآخر. من الصفقات الكبيرة إلى مواقف الحياة العادية ، كل شيء يخضع لقانون أو لآخر.
بالطبع ، مواقف اللعبة المذكورة أعلاه مع المجرمين والبار هي مجرد رسومات توضيحية ممتازة توضح توازن ناش. غالبًا ما تظهر أمثلة على مثل هذه المعضلات في السوق الحقيقي ، وهذا يعمل بشكل خاص في الحالات التي يتحكم فيها محتكران في السوق.
استراتيجيات مختلطة
في كثير من الأحيان لا نشارك في لعبة واحدة ، ولكن في عدة ألعاب في وقت واحد. اختيار أحد الخيارات في لعبة واحدة ، مسترشدًا بإستراتيجية عقلانية ، لكنك ينتهي بك الأمر في لعبة أخرى. بعد بضعة قرارات عقلانية ، قد تجد أن نتيجتك لا ترضيك. ماذاتأخذ؟
دعونا نفكر في نوعين من الإستراتيجية:
- الإستراتيجية البحتة هي سلوك المشارك الذي يأتي من التفكير في السلوك المحتمل للمشاركين الآخرين.
- الإستراتيجية المختلطة أو الإستراتيجية العشوائية هي تناوب الإستراتيجيات الخالصة بشكل عشوائي أو اختيار إستراتيجية خالصة ذات احتمالية معينة. تسمى هذه الإستراتيجية أيضًا بالعشوائية.
بالنظر إلى هذا السلوك ، نحصل على نظرة جديدة على توازن ناش. إذا قيل سابقًا أن اللاعب اختار إستراتيجية مرة واحدة ، فيمكن تخيل سلوك آخر. يمكن الافتراض أن اللاعبين يختارون استراتيجية بشكل عشوائي مع احتمال معين. الألعاب التي لا تجد توازنات ناش في الاستراتيجيات البحتة دائمًا ما يكون لها استراتيجيات مختلطة.
توازن ناش في الاستراتيجيات المختلطة يسمى التوازن المختلط. هذا هو التوازن حيث يختار كل مشارك التكرار الأمثل لاختيار استراتيجياته ، بشرط أن يختار المشاركون الآخرون استراتيجياتهم بتردد معين.
العقوبات والاستراتيجية المختلطة
يمكن العثور على مثال على استراتيجية مختلطة في لعبة كرة القدم. ربما يكون أفضل مثال على الاستراتيجية المختلطة هو ركلات الترجيح. إذن ، لدينا حارس مرمى يمكنه القفز من زاوية واحدة فقط ، ولاعب سينفذ ركلة الجزاء.
لذا ، إذا اختار اللاعب في المرة الأولى استراتيجية التسديد إلى الزاوية اليسرى ، وسقط حارس المرمى أيضًا في هذه الزاوية والتقط الكرة ، فكيف يمكن للأشياء أن تتطور في المرة الثانية؟ إذا كان اللاعبستضرب في الزاوية المقابلة ، فمن المرجح أن يكون هذا واضحًا جدًا ، لكن الضرب في نفس الزاوية ليس أقل وضوحًا. لذلك ، لا خيار أمام حارس المرمى ولا لاعب التسديد سوى الاعتماد على الاختيار العشوائي.
وهكذا ، بالتناوب بين الاختيار العشوائي واستراتيجية نقية معينة ، يحاول اللاعب وحارس المرمى الحصول على النتيجة القصوى.