Дилемма заключенного | Info-Farm.RU
В теории игр дилемма заключённого (ДВ) — игра с ненулевой суммой, в которой игроки стремятся получить выгоду, сотрудничая друг с другом или изменяя. Как во всей теории игр, предполагается, что игрок («узник») максимизирует свой собственный выигрыш, не заботясь о выгоде других.
В дилемме заключенного измена строго доминирует над сотрудничеством, поэтому единственный возможный равновесие — предательство обоих участников. Проще говоря, не важно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.
Обращаясь отдельно рационально, вместе участники приходят к нерациональному решение: если оба предадут, они получат в сумме меньше выигрыш, чем если бы сотрудничали (единственная равновесие в этой игре не ведет к Парето-оптимального решения). В этом и заключается дилемма.
В дилемме заключенного, повторяющееся игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество раньше.
Классическая дилемма заключённого
Классическая дилемма заключенного такова:
- Двое подозреваемых, А и Б, арестованы. У полиции нет достаточных доказательств для обвинения, и изолировав их друг от друга, они предлагают им одну и ту же операцию: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается, а второй получает 10 лет тюрьмы. Если оба молчат, в полиции мало доказательств, и они приговариваются к 6 месяцев. Если оба свидетельствуют против друг друга, они получают по 2 года. Каждый заключенный выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдет?
Игру можно представить в виде следующей таблицы:
Узник Б хранит молчание | Узник Б дает показания | |
---|---|---|
Узник А хранит молчание | Оба получают полгода. | А получает 10 лет Б освобождается |
Узник А дает показания | А освобождается Б получает 10 лет тюрьмы | Оба получают 2 года тюрьмы |
Дилемма появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.
Представим рассуждения одного из заключенных. Если партнер молчит, то лучше его изменить и выйти на свободу (иначе — полгода тюрьмы). Если партнер говорит, то лучше тоже свидетельствовать против него, чтобы получить 2 года (иначе — 10 лет). Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично другой заключенный приходит к тому же выводу.
С точки зрения группы (этих двух заключенных) лучше сотрудничать друг с другом, хранить молчание и получить по полгода, поскольку это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным. Это очень наглядно демонстрирует, что в игре с ненулевой суммой Парето-оптимум может быть противоположным равновесии Нэша.
Обобщенная форма
Можно раскрыть скелет игры далее, абстрагировавшись от подтекста заключенных. Обобщенная форма игры часто используется в экспериментальной экономике. Вот правила, которые дают типичную реализацию игры.
В игре — два игрока и банкир. Каждый игрок держит 2 карты: на одной написано «сотрудничать», на другой — «предать» (это стандартная терминология игры). Каждый игрок кладет одну карту перед банкиром надписью вниз (то есть никто не знает чужого решения, хотя знание чужого решения не влияет на анализ доминирования). Банкир открывает карты и выдает выигрыш.
Если оба выбрали «сотрудничать», оба получают C. Если один выбрал «предать», другой «сотрудничать» — первый получает D, второй с. Если оба выбрали «предать» — оба получают d.
Значения переменных C, D, с, d могут быть любого знака (в примере выше все меньше или равны 0). Обязательно должна соблюдаться неравенство D> C> d> c, чтобы игра была ДВ.
Сотрудничать | Изменить | |
---|---|---|
Сотрудничать | C, C | c, D |
Изменить | D, c | d, d |
Если игра повторяется, то есть играет более 1 раза подряд, общий выигрыш от сотрудничества должен быть большим суммарного выигрыша в ситуации, когда один изменяет, а другой — нет (объяснения — ниже):
- 2C> D + c
Эти правила были установлены Дугласом Гофштадтером и образуют канонический описание типичной дилеммы заключенного.
Похожая, но другая игра
Гофштадтер предположил, что люди проще понимают задачи, как задача ДВ, если она представлена в виде отдельной игры или процесса торговли. Один из примеров — «обмен закрытыми сумками»: Два человека встречаются и обмениваются закрытыми сумками, понимая, что одна из них содержит деньги, другая — товар. Каждый игрок может уважать операцию и положить в сумку то, о чем договорились, или обмануть партнера, дав пустую сумку.
В этой игре обман всегда будет наилучшим решением, означая также, что рациональные агенты никогда не играть в нее, и рынок обмена закрытыми сумками будет отсутствовать.
В вариации, популярной у программистов и хакеров каждый агент этой игры помнит предыдущие результаты (или имеет доступ к общественному мнению, «коллективной памяти»), и множество обменов повторяются длительное время.
Как указано выше, без памяти эта игра имеет мало смысла, она мало что объясняет в поведении систем и групп людей, кроме описания взаимодействий, не проходить.
Сложность создания какой-то многозначной модели может смущать, но она поднимает некоторые интересные и ценные технические и философские вопросы.
Выполнена некоторая работа по моделированию этого. Различные программисты и математики утверждают, что стратегия «око за око» — наилучшая общая стратегия, однако не было сделано серьезных академических усилий, чтобы классифицировать различные типы и распределения агентов, обучающихся с различными стратегиями.
О потенциале этой задачи свидетельствует тот факт, что в этой дискуссии еще не упоминались возможность формировать коалиции и рядиться коллективно. А как насчет агентов, которые по плату организовывали переговоры? Или агентов, которые накапливали информацию о самых операции?
Примеры из реальной жизни
Примеры с заключенными, карточной игрой и обменом закрытыми сумками могут казаться надуманными, но на самом деле есть множество примеров взаимодействия людей и животных, имеющих такую же матрицу выигрышей. Поэтому ДВ представляет интерес социальным наукам, таким как экономика, политология и социология, а также разделам биологии — этологии и эволюционной биологии. Многие природные процессы были обобщены в модели, в которых живые существа участвуют в бесконечных играх типа дилеммы заключенного. Такая широкая применимость ДВ придает этой игре значительную важность.
В политологии, например, сценарий ДВ часто используется для иллюстрации проблемы двух стран, вовлеченных в гонку вооружений. Обе заявлять, что у них есть две возможности: либо увеличить расходы на военные нужды, или сокращать вооружения. Ни одна из сторон не может быть уверена, что другая соблюдать договоренность, следовательно обе стремиться к военной экспансии.
В автоспорте яркий пример дилеммы заключенного — Формула-1, где последние 20 лет происходит гонка бюджетов команд, через какое количество машин участников сократилось с 36 в 1990 до 20 в 2003.
Случай дилеммы узника может быть найден в бизнесе. Две конкурирующие фирмы должны определиться, сколько средств тратить на рекламу. Эффективность рекламы и прибыль каждой фирмы уменьшается с ростом расходов на рекламу у конкурента. Обе фирмы принимают решение увеличить расходы на рекламу, при этом их доли рынка и, возможно, объемы продаж остаются неизменными, а прибыль сокращается. Предел гонки рекламных бюджетов — прибыль, впрочем, они могут пытаться некоторое время работать и в убыток. Фирмы могут пойти на соглашение о сокращении расходов на рекламу, но всегда есть стимул его нарушить.
В олигополистических рынках ценовая политика — это повторение ДВ. Конечно олигополисты сотрудничают друг с другом и не доводят ситуацию до ценовой войны.
Уильям Паундстоун в книге о проблеме узника описывает ситуацию в Новой Зеландии, где почтовые ящики оставляют открытыми. Газету можно взять, не заплатив за нее, но мало кто так делает, потому что большинство осознает вред, который был бы, если бы все воровали газеты. Поскольку ДВ в чистом виде одновременно для всех игроков (никто не может повлиять на решение других), эта распространенная линия рассуждений называется «магическое мышление».
Теоретический вывод ДВ — одна из причин, почему во многих странах сделка о признании вины запрещена. Часто сценарий ДВ повторяется очень точно: в интересах обеих подозреваемых признаться и свидетельствовать против другого подозреваемого, даже если оба невиновны. Возможно, наихудший случай — когда только один виноват, в этом случае виноват вряд ли признается в чем, а виноват пойдет на это и даст показания против невинного.
Многие проблемам в реальной жизни включают множество игроков. Хотя и метафорическая «трагедии общин» Ардена можно рассматривать как обобщение ДВ для множества игроков. Каждый житель общины выбирает — или пасти скот на общем пастбище и получить выгоду, истощая его ресурсы, или ограничить свой доход. Коллективный результат от общего (или частого) максимального использования пастбища — низкий доход (что ведет к разрушению общины). Однако такая игра не является формальной, так как может быть разбита на последовательность классических игр с 2 участниками.
Дилемма узника, повторяющееся
В книге «Эволюция кооперации» (1984) Роберт Акселрод исследовал расширение сценария ДВ, которое он назвал дилемма узника, повторяется (НДС). В ней участники делают опять время от времени и помнят предыдущие результаты. Акселрод пригласил академических коллег со всего мира, чтобы разработать компьютерные стратегии, чтобы соревноваться в чемпионате по НДС. Программы, вошедшие в него различались по алгоритмической сложности, начальной враждебностью, способностью к прощению и так далее.
Акселрод открыл, что если игра повторялась долго среди множества игроков, каждый с различными стратегиями, «жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более «альтруистические» стратегии работали лучше, с точки зрения собственного интереса. Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из механизмов, которые сначала чисто эгоистические, через естественный отбор.
Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простой из всех программ, участвовавших состояла всего из 4 строк кода на языке Бейсик. Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Немного лучше работает стратегия «Око за око с прощением». Когда оппонент изменяет, на следующем шаге игрок иногда в любом случае сотрудничает с небольшой вероятностью (1-5%). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится непонимание — когда решение одного игрока сообщается другому с ошибкой.
Анализируя стратегии, набравшие лучшие результаты, Акселрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат.
Хорошая
- Важнейшее условие — стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент. Почти все стратегии-лидеры были хорошими. Поэтому чисто эгоистическая стратегия с чисто эгоистических причинам не будет первой «бить» соперника.
Мстительная
- Однако успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример немстивои стратегии — всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» стратегии воспользуются этим.
Прощая
- Другая важная качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечной мести друг другу и максимизирует выигрыш.
НЕ завистливая
- Последнее качество — не являться завистливым, то есть не пытаться набрать больше очков, чем оппонент (что в принципе невозможно для «хорошей» стратегии, то есть хорошая стратегия никогда не может набрать больше очков, чем оппонент).
Итак, Акселрод пришел утопично звучащему выводу, что эгоистичные индивиды во имя их же эгоистического блага будут стремиться быть добрыми и прощая и не завистливыми.
Рассмотрим снова модель гонки вооружений. Был дан вывод, что единственная рациональная стратегия — вооружаться, даже если обе страны хотели бы тратить ВВП на масло, а не орудия. Интересно, что попытки продемонстрировать, что вывод ДВ работает на практике (делая анализ «высоких» и «низких» военных расходов между периодами, на основе предположений НДС), часто показывают, что такого поведения не происходит. Например, греческие и турецкие военные расходы меняются не в соответствии со стратегией «око за око», а скорее следуют внутренней политике). Это может быть примером рационального поведения, отличается от одноразовых и многоходовых игр.
Если в одноходовой игре в любом случае доминирует стратегия предать, то в многоходовой оптимальная стратегия зависит от поведения других участников. Например, если среди населения все друг друга обманывают, а один ведет себя по принципу «око за око», он оказывается в небольшом проигрыше из-за потери на первом ходе. В такой популяции оптимальная стратегия — всегда предавать. Если же число исповедуют принцип «око за око» больше, то результат уже зависит от их доли в обществе.
Определить оптимальную стратегию можно двумя путями:
- Равновесие Байеса-Нэша: если определено статистическое распределение поведения (например, 33% «око за око», 33% всегда обманывают и 33% всегда сотрудничают), что встречается, то стратегию можно вычислить математически. Этим подробно занимается теория эволюционной динамики.
- По методу Монте-Карло делались симуляции популяций, где индивиды с низкими результатами вымирали, а с высокими воспроизводились (использовался генетический алгоритм поиска оптимальной стратегии). Структура поведения в конечной популяции зависит от структуры в начале.
Хотя стратегия «око за око» считалась удачной простой стратегией, команда Университета Саутгемптона из Англии (под руководством профессора Николаса Дженнингса) представила новую стратегию на 20-ю годовщину Чемпионата по НДС. Эта стратегия оказалась успешной, чем «око за око». Она основывалась на взаимодействии между программами, чтобы получить максимальный счет для одной из них. Университет выставил на чемпионат 60 программ, которые распознавали друг друга по ряду действий на первых 5-10 ходах. Распознав другую, одна программа всегда сотрудничала, а другая предавала, что давало максимум очков предателю. Если программа понимала, что оппонент — не Саутгемптонского, она дальше все время изменяла ему, чтобы минимизировать результат соперника. В результате эта стратегия заняла первые три места в соревновании, как и несколько мест подряд ниже.
Хотя эта стратегия оказалась эффективной в соревновании, это было достигнуто за счет того, что в этом конкретном соревновании команда могла участвовать несколькими агентами. Если игрок может контролировать только одного агента, «око за око» оказывается лучшим. Она также придерживается правила запрета на коммуникации между игроками. То, что Саутгемптонского программы исполняли «ритуальный танец» в первые 10 ходов, чтобы узнать друг друга, только подтверждает, насколько важна коммуникация в сдвиге баланса игры.
Если НДС играет ровно N раз (какая-то известная константа N), есть еще один интересный факт. Равновесие Нэша — всегда предавать. Доводим по индукции: если оба сотрудничают, на последнем ходе выгодно предать, тогда у соперника не будет возможности отомстить. Поэтому оба предадут друг друга на последнем ходу. Раз соперник предаст на последнем ходе в любом случае, любой игрок захочет предать на предпоследнем ходу, и так далее. Чтобы сотрудничество оставалась выгодной, необходимо, чтобы будущее было неопределенным для обоих игроков. Одно из решений — делать число N случайным и подсчитывать результаты по среднему выигрышем за ход.
Дилемма заключенного — фундаментальная для некоторых теорий о взаимодействии людей и доверие. С предположение модели ДВ, что транзакция между двумя людьми требует доверия, доверительная поведение в популяциях может быть смоделирована с помощью многие гравцевои версии игры, повторяется. Это годами вдохновляло многих ученых. В 1975 году Грофман и Пул оценивали число работ, посвященных этой теме, их около 2000.
Психология обучения и теория игр
Если игроки могут оценивать возможность предательства со стороны других игроков, на их поведение влияет опыт. Простая статистика показывает, что неопытные игроки обычно ведут себя чрезмерно хорошо или плохо. Если они все время будут действовать так, то проигрывают из-за своей излишней агрессивности или лишнюю доброту. С получением большого опыта они реально оценивают вероятность измены и добиваются лучших результатов. Ранние розыгрыше сильно влияют на неопытных игроков, чем более поздние на опытных. Это пример, почему ранний опыт имеет такое влияние на молодых, и почему они особенно уязвимы к немотивированной агрессии, иногда сами становясь такими.
Можно уменьшить вероятность измены в популяции посредством сотрудничества в ранних играх, позволив укрепить доверие. Итак самопожертвование может в некоторых ситуациях усилить моральный дух группы. Если группа маленькая, на позитивное поведение с большей вероятностью ответят взаимностью, что поощрит индивидов на дальнейшее сотрудничество. Это связано с еще одной дилеммой, хорошее отношение без причины — это потерянные, которое может ухудшить моральные качества.
Эти процессы — главное поле интереса взаимного альтруизма, группового отбора, семейного отбора и этики.
Восточная философия
В боевых искусствах изучается даосское пословица, которая гласит, что:
- Отвечать добром на добро — дает добро
- Отвечать злом на зло — дает добро
- Отвечать злом на добро — дает зло
- Отвечать добром на зло — дает зло
Второе и четвертое утверждение кажутся сомнительными, особенно с позиций христианства, но дилемма заключенного объясняет их. В древнем Китае «добро» и «зло» считались незыблемыми истинами (например, их нельзя поменять местами), таким образом, эта пословица можно прочитать еще и как «плюс на минус дает минус». Есть усиленный вариант этой пословицы, где в двух последних строках выходит «двойное зло».
Библиография
(источники, названные в англоязычной статьи)
- Axelrod, Robert and Hamilton, William D. (1981). «The Evolution of Cooperation». Science, 211: 1390-1396.
- Эволюция сотрудничества, Роберт Акселрод, Basic Books, ISBN 0-465-02121-2
- Axelrod, Robert (1997). The Complexity of Cooperation. Princeton University Press. ISBN 0-691-01567-8.
- Ген Эгоизма, Ричард Доукинс (1990), второе издание — включает два раздела об эволюции сотрудничества, ISBN 0-19-286092-5
- Grofman and Pool (1975). «Bayesian Models for Iterated Prisoner’s Dilemma Games». General Systems 20: 185-94.
- Hardin, Garrett (1968). «The Tragedy of the Commons». Science, 162: 1243-1248.
- Kreps, David, Robert Wilson, Paul Milgrom, and John Roberts (1982). «Rational Cooperation in the Finitely Repeated Prisoners ‘Dilemma.» Journal of Economic Theory 27 (2): 245-52.
- Milgrom, Paul (1984). «Axelrod’s The Evolution of Cooperation». Rand Journal of Economics 15 (2): 30-59.
- Poundstone, William (1992). Prisoner’s Dilemma: John von Neumann, Game Theory, and the Puzzle of the Bomb. Doubleday. ISBN 0-385-41567-2. Обширный популярное введение, как отмечено в заголовке.
- Rapoport, Anatol and Chammah, Albert M. (1965). Prisoner’s Dilemma. University of Michigan Press. Расчет множества экспериментов, в которых играла ДВ.
- Verhoeff, Tom (1998). «The Trader’s Dilemma: A Continuous Version of the Prisoner’s Dilemma». Computing Science Notes 93/02, Кафедра математики и вычислительных систем, Технический Университет Эйндховена, Нидерланды.
- New Tack Wins Prisoner’s Dilemma
Видео по теме
Настоящая дилемма заключенного | LessWrong на русском
Однажды я понял, что обычно дилемму заключенного представляют неправильно.
В основе дилеммы заключенного лежит вот такая симметричная платежная матрица:
1:С | 1:П | |
2:С | (3,3) | (5,0) |
2:П | (0,5) | (2,2) |
Есть два игрока: Игрок 1 и Игрок 2. Каждый из них может выбрать С или П. Итоговый результат для Игрока 1 и Игрока 2 — соответственно, первое и второе число пары чисел в скобках. По причинам, которые станут понятны ниже, C означает «сотрудничать», П — «предать».
Заметим, что для участника этой игры (пусть он считает себя первым) предпочитаемые исходы выстраиваются в следующем порядке: (П, С) >> (C, С) >> (П, П) >> (С, П).
Видим, что П предпочтительнее, чем С: если второй игрок выбирает С, то первому выгоднее (П, С), чем (С, С). Если второй выбирает П, то первому выгоднее (П, П), чем (С, П). Таким образом, ты мудро выбираешь П, а так как платежная матрица симметрична, второй игрок аналогично выберет П.
Если бы вы оба были не так мудры! Каждому из вас выгоднее (С, С), чем (П, П). Поэтому вы оба предпочитаете обоюдное сотрудничество обоюдному предательству.
В теории принятия решений дилемма заключенного — одна из основ, и о ней написано огромное количество томов. Но я осмелюсь утверждать, что в традиционном представлении дилеммы заключенного есть серьезное упущение — по крайней мере, для людей.
Классическое представление дилеммы заключенного таково: ты преступник, пойманный властями вместе с сообщником. Независимо друг от друга, без возможности общаться между собой и без возможности изменить решение впоследствии, каждый из вас должен решить, давать показания против сообщника (П) или молчать (С).
В настоящий момент каждому из вас грозит год тюрьмы. Дача показаний против сообщника уменьшает твой срок на год и прибавляет другому два года.
В другом варианте, ты и незнакомец, не зная ничего друг о друге и не имея возможности узнать в будущем, единожды должны сыграть С или П, получив выигрыш в соответствии с приведенной выше платежной матрицей.
И, конечно, в классическом варианте предполагается, что ты полностью эгоистичен, т.е. не заботишься о сообщнике или об игроке в другой комнате.
И именно последнее условие, с моей точки зрения, приводит к неправильному восприятию дилеммы заключённого.
Невозможно устранить эффект знания задним числом, инструктируя присяжных вести себя так, будто они не знают, к чему привели рассматриваемые события. Аналогично, без больших усилий, подкрепленных соответствующими знаниями, психически здоровый человек не может притворяться по-настоящему эгоистичным.
У нас есть врожденные чувства честности, чести, сопереживания, симпатии и даже альтруизма. Это результат того, что наши предки длительное время приспосабливались к игре в повторяющуюся дилемму заключенного. Мы не можем полностью и честно предпочесть исход (П, С) исходу (С, С), хотя можем полностью предпочесть исход (С, С) исходу (П, П) и исход (П, П) исходу (С, П). Мысль о сообщнике, проводящем три года в тюрьме, не может совсем не трогать нас.
В закрытой комнате, где под наблюдением специалистов по экономической психологии мы играем в простую игру, мы не можем совсем не симпатизировать незнакомцу, который может сотрудничать. Мы не можем быть полностью счастливы при мысли о том, что незнакомец выбрал сотрудничать, а мы — предавать, и благодаря этому мы получим пять долларов, а он не получит ничего.
Мы инстинктивно держимся за исход (С, С) и ищем способы увериться, что этот выбор разделяет и вторая сторона. Наша невольная мысль — «как бы убедиться, что сотрудничество взаимно», а не «как бы обмануть второго, чтобы он сыграл С, в то время как я сыграю П и получу максимальный выигрыш».
Для тех, кому важны альтруизм, честь и справедливость, дилемма заключенного не содержит по-настоящему критической платежной матрицы, безотносительно финансовых исходов для игроков. (С, С) предпочтительнее, чем (П, С), и ключевой вопрос — думает ли второй игрок так же.
И людям, которые только что познакомились с теорией игр, нельзя объяснить, что они должны притворяться полностью эгоистичными. Это ничуть не легче, чем объяснить людям, познакомившимся с идеей антропоморфизма, что они должны притворяться максимизаторами скрепок.
Для настоящей дилеммы заключённого ситуация должна быть примерно такой:
Игрок 1: Человек, дружественный искусственный интеллект или другой человекоподобный разум.
Игрок 2: Недружественнный искусственный интеллект, либо инопланетянин, который озабочен лишь раскладыванием камней в правильные кучи.
Представим, что четыре миллиарда людей — не всё человечество, но значительная его часть — страдает прогрессирующим смертельным заболеванием, которое может вылечить только Вещество.
Однако Вещество возможно производить, только взаимодействуя с максимизатором скрепок из параллельного мира — с помощью Вещества еще можно делать скрепки. Максимизатора скрепок волнует количество скрепок только в его мире, а не в нашем, так что мы не можем влиять на него, предлагая изготавливать или уничтожать скрепки здесь. Мы никогда раньше не имели дело с максимизатором скрепок и никогда больше не встретим его впредь.
У человечества и максимизатора скрепок есть только один шанс добыть себе немного Вещества, потому что щель между мирами скоро захлопнется. Однако, процесс добычи вещества приводит к потере его части.
Платежная матрица выглядит так:
1:С | 1:П | |
2:С | (спасти 2 миллиарда человеческих жизней, сделать 2 скрепки) | (3 миллиарда жизней, 0 скрепок) |
2:П | (0 жизней, 3 скрепки) | (1 миллиард жизней, 1 скрепка) |
Я составил матрицу так, чтобы вызвать чувство негодования при мысли о том, что максимизатор скрепок хочет обменять миллиарды человеческих жизней на пару скрепок. Очевидно же, что максимизатор скрепок обязан отдать все Вещество нам. Но он делает не то, что обязан, а просто максимизирует количество своих скрепок.
В этом случае мы на самом деле предпочитаем исход (П, С) исходу (С, С), оставляя за скобками средства, которыми достигается цель. Мы намного охотнее предпочтем жить во вселенной, где три миллиарда людей спаслись и не было произведено ни одной скрепки, чем пожертвуем миллиардом жизней в обмен на изготовление двух скрепок. Кажется, что в этом случае сотрудничать просто неправильно. Предавать даже не кажется нечестным – ведь так велика жертва для нас и так мал выигрыш максимизатора скрепок! Уточним особо, что максимизатор скрепок не чувствует боль или удовольствие — он просто действует так, чтобы в его мире стало больше скрепок. Он не испытает радость, приобретя скрепки, не испытает боль, потеряв скрепки, и не оскорбится, если мы предадим его.
Что же ты сделаешь? Будешь ли сотрудничать, если искренне, целиком и полностью желаешь того огромного выигрыша, который можешь получить, и нисколько не озабочен ничтожной в сравнении с этим потерей второго игрока? Если предать кажется правильным, даже если второй игрок сотрудничает?
Именно так выглядит платёжная матрица для настоящей дилеммы заключённого. Настоящая дилемма заключённого — это ситуация, когда исход (П, С) кажется правильнее, чем (С, С).
Но вся остальная логика — что будет, если оба игрока так думают, и поэтому оба предадут — ничуть не меняется. Ведь максимизатор скрепок настолько же мало обеспокоен людскими смертями, болью или нашим ощущением предательства, как нас мало волнуют скрепки. Но обоим нам выгоднее (С, С), чем (П, П).
Если ты когда-нибудь гордился тем, что в дилемме заключенного выбрал сотрудничать, или однажды оспаривал вывод классической теории игр о том, что «рациональнее» предать — что ты скажешь об этой настоящей дилемме заключенного?
PS На самом деле, я не считаю, что рациональные агенты всегда должны предавать в однократной дилемме заключённого, в которой другой игрок выберет сотрудничать, если ожидает того же от вас. Я думаю, что есть ситуации, где два агента могут рационально прийти к (С, С), а не к (П, П) и получить соответствующую выгоду.
Часть своих доводов я изложил при обсуждении задачи Ньюкома. Однако, мы не можем рассуждать о том, возможно ли в этой дилемме рациональное сотрудничество, пока не избавимся от интуитивного ощущения, что исход (С,С) хорош сам по себе. Если мы хотим понять математику, мы должны научиться видеть сквозь социальный ярлык «взаимного сотрудничества». Если вы чувствуете, что с точки зрения Игрока 1 (С,С) гораздо лучше, чем (П,П), но не чувствуете, что при этом (П,С) гораздо лучше, чем (С,С), то вы пока не понимаете всю сложность этой задачи.
Ситуация типа «дилеммы заключенных» — Студопедия
Два преступника задержаны по подозрению в ограблении банка. Однако против них нехватает улик. Они могут получить небольшой срок — один год за те проступки, в отношении которых против них имеются улики (например, за хранение оружия). Задача следователя, ведущего это дело, — заставить преступников сознаться в совершении преступления. Следователь разработал два альтернативных плана проведения допроса.
Таблица 2
План А «Невидимая рука»
В | ||||||
Сознаться | Молчать | |||||
А | Сознаться | -5;-5 | -10;0 | |||
Молчать | 0;-10 | -1;-1 | ||||
Если один из преступников сознается в совершении преступления, а другой молчит, то сознавшийся получает максимальный срок — 10 лет тюремного заключения, а тот, кто не сознался, будет выпущен на волю. Если сознаются оба преступника, то они получают по 5 лет тюремного заключения. Если оба молчат, то каждый получает по одному году тюремного заключения за ношение оружия. Каждый из игроков в данной ситуации принимает решение, не имея информации о выборе другого игрока. Выигрыши игроков представлены в матрице игры. Числа в матрице означают величину отрицательной полезности, которая определяется количеством лет, проведенных в тюрьме. Соответственно (-5) означает, что преступник приговорен к пяти годам тюремного заключения, (-1) — одному году тюремного заключения, (-10) — десяти годам тюремного заключения и (0) — преступник выпущен на свободу.
Доминирующая стратегия игрока А в данной ситуации — молчать, ведь если игрок В тоже молчит, то А получает один год тюрьмы, а если В сознается, то А вообще выходит на волю. И у В также есть доминирующая стратегия — для него лучше молчать, независимо от того, какую стратегию выберет А. Результат — оба преступника молчат — является стабильным и это означает, что каждый игрок останется доволен своим выбором после того, как узнает о выборе другого игрока. Подобный стабильный результат имеет название «равновесие по Нэшу».*
Следователь не достигает своей цели — добиться от преступников признания — и придумывает другой план.
План В «Дилемма заключенных»
В | ||||||
Сознаться | Молчать | |||||
А | Сознаться | -5;-5 | 0;-10 | |||
Молчать | -10;0 | -1;-1 | ||||
Преступники снова могут выбирать одну из двух стратегий. Оба они знают, что если никто из них не сознается, то они получат минимальный срок — один год тюремного заключения за ношение оружия. Если сознаются оба преступника, то каждый из них получает 5 лет тюремного заключения. Если признается лишь один из них, тогда тот, кто даст показания, выходит на волю, а тот, кто все отрицает, получает 10 лет тюремного заключения.
В этой игре у каждого преступника есть доминирующая стратегия — сознаться. Равновесием по Нэшу в этой игре будет набор стратегий {сознаться; сознаться}, которые выбирает каждый игрок. В игре «дилемма заключенных» следование каждым игроком личной выгоде приводит к неэффективному для группы результату. Если бы оба преступника молчали, то они были бы в лучшем положении — эффективным по Парето.* Здесь равновесие по Нэшу неэффективное, ведь преступники могли бы получить по одному году, а получили по 5 лет. Но стимулы, действующие в этой игре, настолько сильны, что можно представить себе ситуацию, когда оба преступника сознаются в совершении преступления, даже если оба они невиновны.
Может быть, это стабильное неэффективное равновесие возникает потому, что преступники не смогли договориться между собой, не скоординировали свое поведение? Но даже, если бы они смогли обменяться информацией и скоординировать свое поведение на допросе у следователя, то результат был бы тем же. Никто из них не мог бы быть уверен в том, что другой преступник в последний момент не захочет получить одностороннее преимущество за счет другого игрока. Причиной того, что игроки оказываются в неэффективной ситуации, является отсутствие надежного, заслуживающего доверия обязательства («credible commitment») со стороны каждого из игроков.
Обязательство будет надежным, если одна из сторон видит, что другая сторона лишена возможности нарушить это обязательство.
Обязательсто может быть надежным в императивном смысле. Игрок не может поступить иначе потому, что его принуждают к такому поведению, или потому что он лишен свободы действий, подобно Улиссу, приказавшему привязать себя к мачте корабля, чтобы невредимым проплыть мимо побережья, где сладкоголосые сирены увлекали своим пением мореплавателей на острые прибрежные скалы. Обязательство может быть надежным также в мотивационном смысле, потому, что игрокам выгодно выполнять обязательства, которые будут самовыполняющимися. Подобное различие предложил Шепсл, на него ссылается Норт в [North, 1993, p. 13].
Планы А и В, разработанные следователем, представляют собой разные типы социального взаимодействия. В плане А индивидуального следования личной выгоде достаточно для достижения эффективного результата. Равновесие по Нэшу в этой игре эффективно по Парето. Игрокам не нужно обмениваться информацией, сотрудничать до начала игры, принуждать другого игрока и т.д. Чтобы достичь эффективного результата Парето в этой игре вообще не требуется никакого взаимодействия. Мы не случайно назвали этот сценарий допроса «невидимая рука». Эта ситуация прекрасно описывается словами Адама Смита, который утверждал, что индивид, стремящийся исключительно к собственной выгоде, направляется невидимой рукой к результату, который не входил в его намерения. Этим результатом является удовлетворение интересов общества.
В плане В (дилемма заключенных) следование личной выгоде приводит в социальную ловушку [Miller, 1992, p. 26]. Индивидуальный интерес и коллективный интерес здесь находятся в конфликте. Достичь эффективного для группы результата можно лишь, заставив игроков выбрать стратегию, которая не кажется им привлекательной. Если заставить каждого игрока выбрать альтернативу, которая не кажется ему привлекательной, то группа в целом выиграет. В этой ситуации возникает институт, который принуждает игроков выбирать непривлекательную для них стратегию чтобы они смогли достичь эффективного для группы результата.* Применительно к данному криминальному сообществу таким институтом может быть правило, действующее в мафиозной организации. Принадлежность преступников А и В к мафиозной организации меняет их выигрыши. Если один член мафиозной организации дает показания против другого члена, то доносчику грозит смерть. Мафиози А и мафиози В сравнят 10 лет тюремного заключения с возможностью быть убитым (в тюрьме или на воле), и каждый из них предпочтет 10 лет тюрьмы как более привлекательную стратегию. А не сознается, также как и В, и потенциальный смертный приговор, вынесенный мафией, поможет им достичь эффективного для данной группы преступников результата — получить по одному году тюремного заключения, вместо пяти лет, предсказанных планом «дилемма заключенных».
Институт, который позволяет достичь эффективного для группы результата в ситуации «дилемма заключенных», содержит механизм принуждения к соблюдению правил.
Ситуация типа «дилеммы заключенных» — МегаЛекции
Два преступника задержаны по подозрению в ограблении банка. Однако против них нехватает улик. Они могут получить небольшой срок — один год за те проступки, в отношении которых против них имеются улики (например, за хранение оружия). Задача следователя, ведущего это дело, — заставить преступников сознаться в совершении преступления. Следователь разработал два альтернативных плана проведения допроса.
Таблица 1 — План А «Невидимая рука»
В | |||
Сознаться | Молчать | ||
А | Сознаться | -5;5 | -10;0 |
Молчать | 0;-10 | -1;1 |
Если один из преступников сознается в совершении преступления, а другой молчит, то сознавшийся получает максимальный срок — 10 лет тюремного заключения, а тот, кто не сознался, будет выпущен на волю. Если сознаются оба преступника, то они получают по 5 лет тюремного заключения. Если оба молчат, то каждый получает по одному году тюремного заключения за ношение оружия. Каждый из игроков в данной ситуации принимает решение, не имея информации о выборе другого игрока. Выигрыши игроков представлены в матрице игры. Числа в матрице означают величину отрицательной полезности, которая определяется количеством лет, проведенных в тюрьме. Соответственно (-5) означает, что преступник приговорен к пяти годам тюремного заключения, (-1) — одному году тюремного заключения, (-10) — десяти годам тюремного заключения и (0) — преступник выпущен на свободу.
Доминирующая стратегия игрока А в данной ситуации — молчать, ведь если игрок В тоже молчит, то А получает один год тюрьмы, а если В сознается, то А вообще выходит на волю. И у В также есть доминирующая стратегия — для него лучше молчать, независимо от того, какую стратегию выберет А. Результат — оба преступника молчат — является стабильным и это означает, что каждый игрок останется доволен своим выбором после того, как узнает о выборе другого игрока. Подобный стабильный результат имеет название «равновесие по Нэшу»[1].
Следователь не достигает своей цели — добиться от преступников признания — и придумывает другой план.
Таблица 2 — План В «Дилемма заключенных»
В | |||
Сознаться | Молчать | ||
А | Сознаться | -5;-5 | 0;-10 |
Молчать | -10;0 | -1;1 |
Преступники снова могут выбирать одну из двух стратегий. Оба они знают, что если никто из них не сознается, то они получат минимальный срок — один год тюремного заключения за ношение оружия. Если сознаются оба преступника, то каждый из них получает 5 лет тюремного заключения. Если признается лишь один из них, тогда тот, кто даст показания, выходит на волю, а тот, кто все отрицает, получает 10 лет тюремного заключения.
В этой игре у каждого преступника есть доминирующая стратегия — сознаться. Равновесием по Нэшу в этой игре будет набор стратегий {сознаться; сознаться}, которые выбирает каждый игрок. В игре «дилемма заключенных» следование каждым игроком личной выгоде приводит к неэффективному для группы результату. Если бы оба преступника молчали, то они были бы в лучшем положении — эффективным по Парето.* Здесь равновесие по Нэшу неэффективное, ведь преступники могли бы получить по одному году, а получили по 5 лет. Но стимулы, действующие в этой игре, настолько сильны, что можно представить себе ситуацию, когда оба преступника сознаются в совершении преступления, даже если оба они невиновны.
Может быть, это стабильное неэффективное равновесие возникает потому, что преступники не смогли договориться между собой, не скоординировали свое поведение? Но даже, если бы они смогли обменяться информацией и скоординировать свое поведение на допросе у следователя, то результат был бы тем же. Никто из них не мог бы быть уверен в том, что другой преступник в последний момент не захочет получить одностороннее преимущество за счет другого игрока. Причиной того, что игроки оказываются в неэффективной ситуации, является отсутствие надежного, заслуживающего доверия обязательства («credible commitment») со стороны каждого из игроков.
Обязательство будет надежным, если одна из сторон видит, что другая сторона лишена возможности нарушить это обязательство.
Обязательсто может быть надежным в императивном смысле. Игрок не может поступить иначе потому, что его принуждают к такому поведению, или потому что он лишен свободы действий, подобно Улиссу, приказавшему привязать себя к мачте корабля, чтобы невредимым проплыть мимо побережья, где сладкоголосые сирены увлекали своим пением мореплавателей на острые прибрежные скалы. Обязательство может быть надежным также в мотивационном смысле, потому, что игрокам выгодно выполнять обязательства, которые будут самовыполняющимися.
Планы А и В, разработанные следователем, представляют собой разные типы социального взаимодействия. В плане А индивидуального следования личной выгоде достаточно для достижения эффективного результата. Равновесие по Нэшу в этой игре эффективно по Парето. Игрокам не нужно обмениваться информацией, сотрудничать до начала игры, принуждать другого игрока и т.д. Чтобы достичь эффективного результата Парето в этой игре вообще не требуется никакого взаимодействия. Мы не случайно назвали этот сценарий допроса «невидимая рука». Эта ситуация прекрасно описывается словами Адама Смита, который утверждал, что индивид, стремящийся исключительно к собственной выгоде, направляется невидимой рукой к результату, который не входил в его намерения. Этим результатом является удовлетворение интересов общества.
В плане В (дилемма заключенных) следование личной выгоде приводит в социальную ловушку. Индивидуальный интерес и коллективный интерес здесь находятся в конфликте. Достичь эффективного для группы результата можно лишь, заставив игроков выбрать стратегию, которая не кажется им привлекательной. Если заставить каждого игрока выбрать альтернативу, которая не кажется ему привлекательной, то группа в целом выиграет. В этой ситуации возникает институт, который принуждает игроков выбирать непривлекательную для них стратегию чтобы они смогли достичь эффективного для группы результата.* Применительно к данному криминальному сообществу таким институтом может быть правило, действующее в мафиозной организации. Принадлежность преступников Аи В к мафиозной организации меняет их выигрыши. Если один член мафиозной организации дает показания против другого члена, то доносчику грозит смерть. Мафиози А и мафиози В сравнят 10 лет тюремного заключения с возможностью быть убитым (в тюрьме или на воле), и каждый из них предпочтет 10 лет тюрьмы как более привлекательную стратегию. А не сознается, также как и В, и потенциальный смертный приговор, вынесенный мафией, поможет им достичь эффективного для данной группы преступников результата — получить по одному году тюремного заключения, вместо пяти лет, предсказанных планом «дилемма заключенных».
Итак, в ситуации «дилемма заключенных» неэффективность равновесия, являющегося результатом игры, вызывает потребность в институте, который принуждал бы игроков выбирать непривлекательную для них стратегию для достижения эффективного для группы результата.
В реальной жизни дилемма заключенных как ситуация, которая возникает единожды, не повторяясь, встречается очень редко. Многие ситуации подобного типа — это повторяющиеся ситуации, в которых игроки постоянно встречаются друг с другом (например, в международных отношениях). Поведение игроков в повторяющихся ситуациях отличается от одношаговой игры. В повторяющихся играх идет процесс обучения, игроки постепенно узнают тот тип поведения, который они могут ожидать друг от друга, каждый из игроков имеет возможность наказать нечестного партнера за его отказ от сотрудничества в прошлом, и на этой основе возникают разделяемые всеми игроками нормы поведения, конвенции, институты, позволяющие избежать выигрышей, предсказанных одношаговой игрой.
Ситуация координации
Примером института, возникающего в ситуации координации, служат правило движения на дорогах (правостороннее или левостороннее). Это простейший институт — конвенция, который сокращает неопределенность и координирует действия людей.
Таблица 3 — Координационная игра
В | |||
Правая | Левая | ||
А | Правая | 1;1 | 0;0 |
Левая | 0;0 | 1;1 |
Если автомобили движутся по разным сторонам дороги, то для того чтобы разъехаться, водителям нужно останавливаться и вести переговоры, чреватые издержками, поэтому в этом случае их выигрыши равны нулю. Если оба выбирают правую сторону дороги или оба водителя выбирают левую, то их выигрыши составляют по единице. Интересы водителей в этом игре не противоречат друг другу, они совпадают, поэтому здесь нет необходимости в принуждении. Но проблема в этой игре возникает в связи с тем, что здесь появляются два равноценных равновесия по Нэшу, и трудность заключается в том, чтобы осуществить выбор из этих двух равноценных результатов. Для того чтобы игроки скоординировали свой выбор, нужен какой-то знак, сигнал, который приведет их в фокальную точку (focalpoint).
Фокальная точка — это равновесие в координационной игре, выбираемое всеми участниками взаимодействия на основе общего знания, помогающего им скоординировать свой выбор.
Как возникает общее знание, позволяющее игрокам скоординировать свое поведение? В качестве такого знака и возникает социальная норма правостороннего (или левостороннего) движения, которая представляет собой простейшую форму института. Каким образом возникает этот институт? Возможны два основных пути его появления.
Во-первых, он может быть установлен в централизованном порядке путем указа. Примером может служить декрет, изданный после Французской революции 1789 года, который предписывал экипажам, запряженным лошадьми, ездить по правой стороне дороги. До этого декрета действовало правило левостороннего движения: экипажи ездили по левой стороне дороги, а пешеходы ходили по правой стороне. Изменение правила имело символический смысл: ездить по левой стороне было политически некорректным, потому что это ассоциировалось с привилегированными классами, движение по правой стороне было привычным для простого человека, поэтому считалось более демократичным.
Во-вторых, эта социальная норма может возникнуть эволюционным путем. В Англии не было какого-либо заметного события, которое породило бы господствующую норму левостороннего движения. Эта норма возникла как местный обычай, а потом распространялась от одного региона к другому. Это и есть второй способ появления социальной нормы: в периодически повторяющейся координационной игре найденное удачное решение, которое затем повторяется, становится нормой. В данном случае фокальная точка является результатом некоторого жизненного опыта. При этом нельзя сказать заранее, какая из норм возникнет. Но чем больше игроков следуют этой норме, тем более укоренившейся она становится.
Эти два механизма не являются взаимоисключающими. Часто общество пользуется стихийно возникшей нормой, которая затем подкрепляется законом. Так, во многих европейских странах до начала XIX века правила дорожного движения не были законодательно установлены, закон затем лишь подтвердил существующий обычай.
Ситуация неопределенности может снова возникнуть, например, при оккупации страны с определенной нормой движения страной, использующей другую норму. Подобная ситуация возникала при оккупации армией Наполеона европейских стран, где преобладающей была норма левостороннего движения. Схожая ситуация возникла в 1938 году в связи с аншлюсом Германией, страной с правосторонним движением, Австрии, где господствовала норма левостороннего движения. Выход из подобной ситуации предлагает декрет оккупационных властей, который подает сигнал о том, какое из двух возможных равновесий следует выбирать, тем самым устраняя неопределенность.
Институты с непосредственно экономическим значением, которые координируют действия людей — это, например, деньги и кредит, промышленные и технологические стандарты, типовые договоры. Шоттер выдвинул гипотезу о том, что деление времени на недели возникло в целях решения проблемы координации обмена на рынке. Деление времени на недели, по его мнению, — это социальная условность, конвенция. Он рассматривает гипотетическое аграрное общество, в котором время не дифференцировано и делится только на дни и в котором еще нет деления времени на недели. В этом обществе продукты труда необходимо обменять на рынке в городе. Возникшая проблема — чисто координационная: все экономические агенты должны прибыть в город одновременно в один и тот же день. Возникает некоторая регулярность в поведении, которую Шоттер называет социальным институтом. Дни между двумя рыночными днями — это и есть неделя. Косвенное подтверждение своей гипотезы Шоттер видит в названии дней недели в Бразилии — «первый рыночный день», «второй рыночный день».
В качестве другого примера проблемы координации можно привести ситуацию, в которой оказываются люди, желающие совершить обмен при оккупации одной страны другой и не знающие, какая из валют — оккупационной страны или оккупируемой — является законным платежным средством. Возникшая неопределенность и замешательство могут даже на некоторое время нарушить нормальный обмен и привести к возникновению бартера. Ситуацию прояснит постановление оккупационных властей, которое укажет, какое платежное средство является законным. И даже патриоты оккупированной страны будут пользоваться валютой оккупационной державы, и нет необходимости в применении специального механизма принуждения, так как интересы людей здесь совпадают и им просто нужно найти единое решение для совершения обмена.
Итак, мы видим, что в ситуации координации институт необходим вследствие множественности возможных равновесий. Институт, возникающий в этой ситуации, не нуждается в специальном механизме принуждения, людям нужен лишь знак, сигнал о том, какое из равновесий им выбрать, ведь в ситуации координации они заинтересованы в нахождении единого решения.
Ситуация неравенства
Для того чтобы выяснить суть ситуации неравенства и институтов, возникающих в ней, представим себе некое аграрное общество до установления в нем прав собственности. В этом обществе живут два пастуха А и В и есть два пастбища — 1 и 2. Пастбище 1 — более плодородное, чем пастбище 2. Расстояние от жилищ обоих пастухов до каждого из пастбищ одинаковое. Каждую весну перед пастухами встает дилемма: на какое пастбище гнать свои стада. Оба пастуха предпочитают пасти овец на более плодородном пастбище 1, но в этом случае пастбище быстро истощается, и результат будет хуже, чем в том случае, если пастухи пасли бы свои стада на разных пастбищах. Следовательно, наибольший выигрыш пастухи получают, если пасут овец на разных пастбищах. Выигрыши пастухов представлены в матрице игры.
Таблица 4 — Игра «Два пастуха»
Пастух В | |||
Пастбище 1 | Пастбище 2 | ||
Пастух А | Пастбище 1 | 2;2 | 8;4 |
Пастбище 2 | 4;8 | 1;1 |
Для решения возникшей проблемы вводится институт прав собственности. Пастух А получает в свою собственность пастбище 1, а пастух В — пастбище 2. Оба пастуха выигрывают от передачи пастбищ в частную собственности, однако пастух А выигрывает в большей степени, чем пастух В, поскольку первое пастбище более плодородное. При решении проблемы координации возникает неравенство между пастухами.
Право собственности функционирует, с одной стороны, в качестве информации, указывающей, на каком пастбище каждый из пастухов должен пасти свое стадо. Но этим функции института собственности не исчерпываются. Право собственности выполняет не только функции координации, они служат также сохранению неравенства. Предположим, что оба пастуха умерли, и наследники В не согласны с существующим неравенством. Они могут привести свое стадо на пастбище 1 в надежде, что наследники А уведут свое стадо на другое пастбище. Но если социальный институт собственности развит в достаточной степени, то эта попытка не удастся, поскольку этот институт предусматривает наказание за неправильное поведение.
Таким образом, право собственности как институт, возникающий в ситуации неравенства:
1) решают проблему координации действий людей;
Рекомендуемые страницы:
Воспользуйтесь поиском по сайту:
Ситуация «невидимая рука» и «дилемма заключённых» — Мегаобучалка
Два преступника задержаны по подозрению в ограблении банка, однако против них недостаёт улик. Они могут получить небольшой срок – один год за те проступки, в отношении которых против них имеются улики (например,
за хранение оружия). Задача следователя, ведущего дело, – заставить преступников сознаться в совершении преступления. Он разработал два альтернативных плана проведения допроса (табл. 2, 3).
Таблица 2 План А «Невидимая рука»
| Преступник В | ||
Сознаться | Молчать | ||
Преступник А | Сознаться | -5; -5 | -10; 0 |
Молчать | 0; -10 | -1; -1 |
Если один из преступников признался в совершении преступления, а другой смолчал, то признавшийся получает максимальный срок – 10 лет тюремного заключения, а тот, кто не сознался, будет выпущен на волю. Если сознаются оба преступника, они получают по 5 лет заключения. Если оба молчат, каждый получает по 1 году заключения за ношение оружия. Каждый из игроков в данной ситуации принимает решение, не имея информации о выборе другого игрока. Выигрыши представлены в матрице игры, где числа означают величину отрицательной полезности, которая определяется количеством лет, проведённых
в тюрьме. Соответственно (-5) означает, что преступник приговорён к 5 годам тюремного заключения, (-1) –
1 году тюремного заключения, (-10) – 10 годам тюремного заключения и (0) – преступник выпущен на свободу.
Доминирующая стратегия игрока А в данной ситуации – молчать: ведь если игрок В тоже молчит, то А получает 1 год тюрьмы, а если В сознается, то А вообще выходит на волю. У В также есть доминирующая стратегия: для него лучше молчать независимо от того, какую стратегию выберет А. Результат, когда оба преступника молчат, является стабильным; это означает, что каждый игрок останется доволен своим выбором после того, как узнает о выборе другого игрока. Такой стабильный результат имеет название «равновесие по Нэшу».
Следователь не смог достичь своей цели – добиться от преступников признания – и придумал другой план.
Таблица 3 План В «Дилемма заключённых»
Преступник В | |||
Сознаться | Молчать | ||
Преступник А | Сознаться | -5; -5 | 0; -10 |
Молчать | -10; 0 | -1: -1 |
Преступники снова могут выбирать одну из двух стратегий. Оба знают: если никто из них не сознается, они получат минимальный срок – 1 год тюремного заключения за незаконное ношение оружия. Если сознаются оба, то каждый получает по 5 лет. Если признается лишь один из них, тогда тот, кто даст показания, выходит на волю, а тот, кто все отрицает, получает 10 лет тюремного заключения.
В этой игре у каждого преступника есть доминирующая стратегия – сознаться. Равновесием по Нэшу в этой игре будет набор стратегий {сознаться; сознаться}, которые выбирают игроки. В игре «дилемма заключённых» следование каждым игроком личной выгоде приводит к неэффективному для группы результату. Если бы оба преступника молчали, они были бы в лучшем положении – эффективном по Парето. Здесь равновесие по Нэшу неэффективное, ведь преступники могли бы получить по 1 году, а получили по 5 лет. Но стимулы, действующие в этой игре, настолько сильны, что можно представить себе ситуацию, когда оба преступника сознаются в совершении преступления, даже если оба невиновны.
Может быть, это стабильное неэффективное равновесие возникает потому, что преступники не смогли договориться между собой, не скоординировали свои действия? Но даже если бы они обменялись информацией и скоординировали свои показания на допросе у следователя, результат был бы тем же. Никто из них не мог быть уверен в том, что другой в последний момент не захочет получить одностороннее преимущество за счёт другого игрока. Причиной того, что игроки оказываются в неэффективном равновесии, является отсутствие надёжного, заслуживающего доверия обязательства со стороны каждого из игроков.
Обязательство будет надёжным, если одна из сторон видит, что другая сторона лишена возможности нарушить своё обязательство.
Обязательство может быть надёжным в императивном или мотивационном смысле. Обязательство будет надёжным в императивном смысле, если игрок не может поступить иначе, потому что его принуждают к такому поведению или он лишён свободы действий.
Подобно Одиссею, приказавшему привязать себя к мачте корабля, чтобы услышать пение сладкоголосых сирен, которые увлекали мореплавателей на острые прибрежные скалы, но при этом проплыть невредимым мимо них. Обязательство Одиссея не покидать корабль, и не направлять его в сторону скал было надёжным, т.к. он был физически лишён возможности нарушить его.
Обязательство является надёжным в мотивационном смысле, если игроку выгодно выполнить его.
Томас Шеллинг, лауреат Нобелевской премии по экономике 2005 г., следующим образом иллюстрирует подобное обязательство. Похититель намеревался получить выкуп за похищенную жертву, но внезапно испугался и хочет отпустить её. Однако очевидно, что как только жертва получит свободу, она сразу же сообщит
о похищении в полицию. Конечно, жертва клянётся, что будет молчать. Но надёжно ли её обещание? Вряд ли, и поэтому похитителю придётся её убить. Но можно ли избежать такого исхода, сделав каким-то образом обещание молчать со стороны жертвы надёжным? Шеллинг предлагает следующий выход: если жертва в прошлом совершила какое-либо преступление, она должна сообщить об этом похитителю; если же она не совершала никакого преступления, она должна это сделать в присутствии похитителя. В этом случае жертве, которая не лишена физической возможности пойти в полицию, будет невыгодно делать это: она будет опасаться, что похититель сообщит полиции о её преступлении и ей придётся нести наказание.
Планы А и В, разработанные следователем, представляют собой разные типы социального взаимодействия. В плане А индивидуального следования личной выгоде достаточно для достижения эффективного результата. Равновесие по Нэшу в этой игре эффективно по Парето. Игрокам не нужно обмениваться информацией, сотрудничать до начала игры, принуждать другого игрока и т.д. Чтобы достичь Парето-эффективного результата в этой игре, не требуется никакого взаимодействия. Мы не случайно назвали данный сценарий допроса «невидимая рука».
Эта ситуация прекрасно описывается словами А. Смита, который утверждал, что индивид, стремящийся исключительно к собственной выгоде, направляется невидимой рукой к результату, который не входил в его намерения. Этим результатом является удовлетворение интересов общества.
В плане В («дилемма заключённых») следование личной выгоде приводит
в социальную ловушку. Индивидуальный и коллективный интересы здесь находятся в конфликте.
Социальная ловушка – это особая ситуация, отличающаяся прямым конфликтом между частными стимулами и общественными интересами.
Достичь эффективного для данной группы преступников результата можно, лишь заставив игроков выбрать стратегию, которая не кажется им привлекательной. Если заставить каждого игрока выбрать такую альтернативу, группа в целом выиграет. В этой ситуации возникает институт, который принуждает игроков выбрать непривлекательную для них стратегию, чтобы они смогли достичь эффективного для группы результата. Применительно к данному криминальному сообществу таким институтом может быть правило, действующее в мафиозной организации. Принадлежность к последней преступников А и В меняет их выигрыши.
Если член мафии даёт показания против своего сообщника, ему грозит смерть. Мафиози А и мафиози В сравнят
10 лет тюремного заключения с возможностью быть убитым (в тюрьме или на воле), и каждый из них предпочтёт молчание как более привлекательную стратегию, хотя выбор стратегии «молчать» приносит выигрыш в виде
10 лет тюремного заключения. А не сознается, так же как и В, и потенциальный смертный приговор, вынесенный мафией, поможет им достичь эффективного для данной группы преступников результата – получить по одному году тюремного заключения вместо 5 лет, предсказанных планом «дилемма заключённых».
Институт, который позволяет достичь эффективного для группы результата в ситуации «дилемма заключённых», содержит механизм принуждения
к соблюдению правил. Чтобы понять, что представляет собой этот механизм, рассмотрим следующую игру (табл. 4).
Таблица 4 Игра «Два пулемётчика»
Пулемётчик В | |||
Сражаться | Дезертировать | ||
Пулемётчик А | Сражаться | 1; 1 | -2; 2 |
Дезертировать | 2; -2 | -1; -1 |
Два пулемётчика на двух изолированных позициях должны отразить атаку врага. Каждый может выбрать одну из двух стратегий: сражаться или дезертировать.
Если оба останутся на своих позициях и будут сражаться, атака будет отбита. Если оба дезертируют, враг сможет прорваться, и они попадут в плен. Если один из них останется на позиции, а другой дезертирует, то тот, кто будет сражаться, даст возможность другому благополучно убежать, затем враг прорвётся, и сражающийся пулемётчик будет убит.
Выигрыши обоих игроков представлены в матрице игры. Ситуация представляет собой классическую дилемму заключённых. Результат игры – оба пулемётчика дезертируют и попадают в плен – неэффективен не только с точки зрения интересов командования и страны, которую они защищали, но и с точки зрения их собственных интересов. Каким образом можно лишить стратегию дезертирства её привлекательности? Как сделать так, чтобы она не была доминирующей для каждого из игроков?
В этой ситуации возможны следующие решения:
• Заминировать подходы к позициям. Это изменит выигрыши в игре, и взаимная солидарность будет обеспечена
Таблица 5 Игра «Два пулемётчика» с минированием подходов
Пулемётчик В | |||
Сражаться | Дезертировать | ||
Пулемётчик А | Сражаться | 1; 1 | -2; -2 |
Дезертировать | -2; -2 | -2; -2 |
• Ввести строжайшую дисциплину в подразделении, где служат пулемётчики. Знание о том, что подразделение дисциплинированное, создаст
у каждого солдата уверенность в другом игроке. Угроза наказания перевесит соблазн дезертировать. В этом случае игра будет иметь такой же вид, как и
в первом случае.
• Иногда наиболее эффективным механизмом принуждения может быть представление о чести, которое есть у игроков. В данном случае действует внутренний механизм принуждения, и матрица игры принимает следующий вид.
Таблица 6 Игра «Два пулемётчика» с самопринуждением игроков
Пулемётчик В | |||
Сражаться | Дезертировать | ||
Пулемётчик А | Сражаться | 1; 1 | -1; -2 |
Дезертировать | -2; -1 | -2; -2 |
Дезертир обесчестил своё имя, поэтому его выигрыш в случае, если ему удалось благополучно бежать, составит не 2, как в случае, когда механизм внутреннего принуждения не действует, а (-2). Оставшийся пулемётчик погибает, но становится героем, поэтому его выигрыш равен (-1). Если оба пулемётчика дезертируют и попадают в плен, выигрыш каждого из них равен (-2), т.к. оба
в плену и их имена покрыты позором.
В ситуации «дилемма заключённых» неэффективность равновесия, являющегося результатом игры, вызывает потребность в институте, который принуждал бы игроков выбирать непривлекательную для них стратегию
для достижения эффективного для группы результата.
В жизни дилемма заключённых как ситуация, которая возникает единожды, не повторяясь, встречается очень редко. Многие ситуации подобного типа – повторяющиеся, когда игроки постоянно встречаются друг с другом (например, в международных отношениях). Поведение игроков в повторяющихся ситуациях отличается от одношаговой игры. В повторяющихся (кооперативных) играх идёт процесс обучения, игроки узнают постепенно тип поведения, который они могут ожидать друг от друга, каждый из игроков имеет возможность наказать партнёра за его отказ от сотрудничества в прошлом, и на этой основе возникают разделяемые всеми игроками нормы поведения, конвенции, институты, позволяющие избежать выигрышей, предсказанных одношаговой игрой.
Ситуация координации
Примером института, возникающего в ситуации координации, служат правила движения на дорогах (правостороннее или левостороннее).
Это простейший институт – конвенция, который сокращает неопределённость и координирует действия людей. Рассмотрим его на примере игры.
Таблица 7 Координационная игра
Водитель В | |||
Правая | Левая | ||
Водитель А | Правая | 1; 1 | 0; 0 |
Левая | 0; 0 | 1; 1 |
Два автомобиля движутся по дороге навстречу друг другу. Если они едут
по разным сторонам дороги (каждый по своей правой или левой), то оказываются на одной полосе, и для того чтобы разъехаться, водителям нужно остановиться и провести переговоры, чреватые издержками, поэтому в данном случае
их выигрыши равны нулю. Если оба водителя выбирают правую сторону дороги, или же оба выбирают левую, они благополучно разъезжаются, и их выигрыши составляют по 1. Интересы водителей в этой игре не противоречат друг другу, они совпадают, поэтому здесь нет необходимости в принуждении игроков
к выбору той или иной стратегии. Но проблема возникает в связи с тем, что здесь появляются два равноценных равновесия по Нэшу, и нужно сделать выбор из этих двух равноценных результатов. Для того чтобы игроки скоординировали свой выбор, нужна какая-то подсказка, которая приведёт их в одно из равновесий.
Равновесие в координационной игре, выбираемое всеми участниками взаимодействия на основе некоторого общего знания, находящегося за рамками этой игры и помогающего игрокам скоординировать свой выбор, называется фокальной точкой.
Это понятие ввёл Т. Шеллинг, который проводил эксперименты с девятью типами координационных игр, и игрокам часто удавалось скоординировать свои действия во всех этих играх. В одних случаях логика, в других – воображение подсказывало правильный выбор. И в повседневной жизни люди время
от времени оказываются в ситуации, когда, не имея возможности сговориться заранее, должны найти общее решение, и часто им это удаётся. Помогают здесь некие символические детали, подсказывающие фокальные точки, где происходит совмещение ожиданий сторон.
Откуда берётся это общее знание, которое позволит в нашей игре водителям, стоящим перед выбором стороны дороги, скоординировать свои действия и попасть в фокальную точку? В качестве такого знака и возникает социальная норма правостороннего (или левостороннего) движения, представляющая собой простейшую форму института – обычай.
Каким образом возникает этот институт? Возможны два основных пути его появления.
Во-первых, он может быть установлен в централизованном порядке – указом властей. Примером может служить декрет, изданный после Французской революции 1789 г., который предписывал экипажам, запряжённым лошадьми, ездить по правой стороне дороги. До этого декрета действовало правило левостороннего движения: экипажи ездили по левой стороне, а пешеходы ходили по правой. Изменение правила имело символический смысл: движение по левой стороне было политически некорректным, потому что ассоциировалось с привилегированными классами, движение по правой стороне было привычным для простого человека, поэтому считалось более демократичным.
Во-вторых, данная социальная норма может возникнуть эволюционным путём. Так, в Англии не было какого-либо заметного события, которое породило бы господствующую норму левостороннего движения. Она возникла как местный обычай, а потом распространялась от одного региона
к другому. Это и есть второй путь появления социальной нормы: в периодически повторяющейся координационной игре, найденное удачное решение, которое затем повторяется, становится нормой. В данном случае фокальная точка является результатом некоторого жизненного опыта. Причём нельзя сказать заранее, какая из норм возникнет. Но чем больше игроков следуют определённой норме, тем более укоренившейся она становится.
Эти два способа не являются взаимоисключающими. Часто общество пользуется стихийно возникшей нормой, которая затем подкрепляется законом. Так, во многих европейских странах до начала XX в. правила дорожного движения не были законодательно установлены, принятый закон лишь подтвердил действующий обычай.
Ситуация неопределённости может снова возникнуть, например, когда одна страна оккупирует другую, а правила дорожного движения в этих странах разные. Такое положение складывалось при оккупации армией Наполеона европейских стран, где преобладающим было правило левостороннего движения. Схожая ситуация возникла в 1938 г. в связи с аншлюсом Австрии, где господствовало правило левостороннего движения, Германией – страной с правосторонним движением. Выходом из подобной ситуации может стать декрет оккупационных властей, который провозгласит, какое из двух возможных равновесий следует выбирать, и тем самым устранит неопределённость.
Институты с непосредственно экономическим значением, которые координируют действия людей, – это, например, деньги и кредит, промышленные и технологические стандарты, типовые договоры. Американский экономист Э. Шоттер выдвинул гипотезу о том, что деление времени на недели возникло
с целью решить проблему координации обмена на рынке. Деление времени
на недели, по его мнению, – это социальная условность, конвенция. Он рассматривает гипотетическое аграрное общество, в котором время недифференцированно и делится только на дни, и в котором ещё нет деления времени на недели. В этом обществе продукты труда необходимо обменять на рынке в городе. Возникшая проблема – чисто координационная: чтобы совершить обмен, все экономические агенты должны прибыть в город в один и тот же день. Возникает некоторая регулярность в поведении, которую Шоттер называет социальным институтом. Дни между двумя рыночными днями – это и есть неделя. Косвенное подтверждение своей гипотезы Шоттер видит в названии дней недели в Бразилии – «первый рыночный день», «второй рыночный день».
Другим примером проблемы координации может служить ситуация,
в которой оказываются люди, желающие совершить обмен при оккупации одной страны другой и не знающие, какая из валют – оккупационной страны или оккупируемой – является законным платёжным средством. Возникшая неопределённость и замешательство могут на некоторое время даже нарушить нормальный обмен и привести к возникновению бартера. Ситуацию прояснит постановление оккупационных властей, которое укажет, какое платёжное средство является законным. Тогда даже патриоты оккупированной страны будут пользоваться валютой оккупационной державы и не будет необходимости
в применении специального механизма принуждения, т.к. интересы людей в этом случае совпадут и им просто нужно найти единое для совершения обмена решение.
В ситуации координации институт необходим вследствие множественности возможных равновесий. Институт, возникающий в этой ситуации, не нуждается в специальном механизме принуждения, людям нужна лишь подсказка, некий знак, сигнал о том, какое из равновесий им выбрать, ведь
в ситуации координации они заинтересованы в нахождении единого решения.
Дилемма заключенного — понимание дилеммы и выбор
«Дилемма заключенного» — это игра или теория игр, в которую хотел бы сыграть любой человек. А как насчет других подобных игр или теорий игр? Теперь, когда у нас есть Интернет, у нас есть широкий спектр игр, особенно теперь, когда у нас есть Интернет и то, как он продолжает развиваться. Есть много игр, похожих на Prisoner’s Dilemma, которые вам обязательно стоит попробовать, если вы поклонник Prisoner’s Dilemma.
Итак, если вы тот, кому нравится «дилемма заключенного», но все же хотите попробовать новые и разные игры, то я уверен, что эта статья сможет вам в этом помочь.На самом деле существует множество различных игр или игровых теорий, которые вы можете легко найти, просто нажав одну кнопку. Итак, если вы готовы познакомиться со всеми играми, похожими на Prisoner’s Dilemma, вот список, который вам обязательно стоит прочитать, если вам интересна эта тема.
Цыпленок, также известный своими различными названиями, такими как Snowdrift, а также игра с ястребом и голубем, очень похож на игру Prisoner’s Dilemma с точки зрения того, как вы можете предать своего партнера или доверять ему.Обеим сторонам в этой игре предлагается сделка, чтобы они уступили или сдались, но оба игрока, вероятно, откажутся от этой сделки, чтобы они уступили, так что ни один из них не будет выглядеть как цыплята, как предполагает название этой теории игр. . Итак, если вы говорите об этой игре, это похоже на битву гордости между двумя игроками или сторонами.
Matching pennies — это игра, в которой для работы требуется как минимум два игрока. Обе стороны получают по пенни, в котором оба игрока называются четными или нечетными.В любом случае, обе стороны должны тайно кидать свои гроши, при этом другой человек не будет знать, на чьей вы стороне — орлом или решкой. В конце концов, обе стороны должны раскрыть ту сторону гроша, которую они получают одновременно. Как только обе стороны раскроют, на чьей они стороне, при условии, что они были на одной стороне, они даже получат пенни другого человека. Между тем, если они разные, то получается даже пенни.
Подобно «Дилемме заключенного» как по названию, так и по ситуации, «Дилемма волонтера» показывает человека, которому придется сделать выбор между принесением себя в жертву другим людям или ожиданием, что кто-то другой пожертвует собой, чтобы этот человек имел лучшую ситуацию.… Читать дальше
Дилемма заключенного — Инфогалактика: ядро планетарного знания
Дилемма заключенного — это стандартный пример игры, анализируемой в теории игр, которая показывает, почему два полностью «рациональных» человека могут не сотрудничать, даже если это кажется что это в их интересах. Первоначально она была создана Мерриллом Флудом и Мелвином Дрешером, работавшими в RAND в 1950 году. Альберт У. Такер формализовал игру с помощью награды за тюремное заключение и назвал ее «дилеммой заключенного» (Poundstone, 1992), представив ее следующим образом:
- Два члена преступной группировки арестованы и заключены в тюрьму.Каждый заключенный находится в одиночном заключении, не имея возможности общаться друг с другом. У прокуратуры нет достаточных доказательств, чтобы осудить пару по основному обвинению. Они надеются приговорить обоих к году тюрьмы по менее строгому обвинению. Одновременно прокуратура предлагает каждому заключенному выгодную сделку. Каждому заключенному предоставляется возможность либо: предать другого, дав показания о том, что другой совершил преступление, либо сотрудничать с другим, сохраняя молчание. Предложение:
- Если A и B предают друг друга, каждый из них отбывает 2 года тюрьмы
- Если A предаст B, но B будет хранить молчание, A будет освобожден, а B отсидит 3 года в тюрьме (и наоборот)
- Если A и B оба будут молчать, они оба будут отсидеть только 1 год тюрьмы (по меньшему обвинению)
Подразумевается, что у заключенных не будет возможности вознаградить или наказать своего партнера, кроме приговоров к тюремному заключению, которые они получили, и что их решение не повлияет на их репутацию в будущем.Поскольку предательство партнера предлагает большую награду, чем сотрудничество с ним, все чисто рациональные эгоистичные заключенные предадут друг друга, и поэтому единственный возможный результат для двух чисто рациональных заключенных — это предать друг друга. [1] Интересная часть этого результата состоит в том, что погоня за индивидуальной наградой логически приводит обоих заключенных к предательству, тогда как они получили бы лучшую награду, если бы оба промолчали. На самом деле, люди демонстрируют систематическую предвзятость в отношении кооперативного поведения в этой и подобных играх, гораздо более сильную, чем предсказывают простые модели «рациональных» эгоистических действий. [2] [3] [4] [5] Модель, основанная на другом виде рациональности, когда люди прогнозируют, как будет вестись игра, если они образуют коалиции, а затем максимизируют свои прогнозы. Было показано, что он лучше предсказывает скорость сотрудничества в этой и подобных играх, учитывая только выигрыши в игре. [6]
Также существует расширенная «повторная» версия игры, в которой классическая игра повторяется многократно между одними и теми же заключенными, и, следовательно, оба заключенных постоянно имеют возможность наказать другого за предыдущие решения.Если игрокам известно, сколько раз будет сыграна игра, то (путем обратной индукции) два классически рациональных игрока будут многократно предавать друг друга по тем же причинам, что и вариант с одним выстрелом. В игре с бесконечной или неизвестной продолжительностью не существует фиксированной оптимальной стратегии, и проводятся турниры «Дилемма заключенного», чтобы соревноваться и проверять алгоритмы.
Игра «Дилемма заключенного» может использоваться в качестве модели для многих реальных ситуаций, связанных с совместным поведением.В случайном использовании ярлык «дилемма заключенного» может применяться к ситуациям, не строго соответствующим формальным критериям классических или итеративных игр: например, те, в которых два объекта могут получить важные выгоды от сотрудничества или пострадать от его отказа. , но считают, что это просто сложно или дорого, не обязательно невозможно, координировать свои действия для достижения сотрудничества.
Стратегия решения дилеммы заключенных
Оба не могут общаться, они разделены на две отдельные комнаты.Обычная игра показана ниже:
Заключенный B молчит ( сотрудничает с ) | Узник Б предает ( дефект ) | |
---|---|---|
Заключенный А молчит ( сотрудничает с ) | Каждый обслуживает 1 год | Заключенный A: 3 года Заключенный B: освобожден |
Заключенный А предает ( дефекты ) | Заключенный A: освобождается Заключенный B: 3 года | Каждый служит 2 года |
Здесь, независимо от того, что решит другой, каждый заключенный получает более высокую награду, предавая другого («дезертирство»).Рассуждение включает аргумент дилеммой: B будет либо сотрудничать, либо отступать. Если B будет сотрудничать, A должен уйти, потому что бесплатное обслуживание лучше, чем обслуживание в течение 1 года. Если дефект B, то A также должен дефект, потому что служить 2 года лучше, чем служить 3. Так что в любом случае A должен дефектить. Параллельное рассуждение покажет, что B должен уйти.
В традиционной теории игр делаются очень ограничительные предположения о поведении заключенных. Предполагается, что оба понимают природу игры и, несмотря на то, что они являются членами одной банды, они не лояльны друг к другу и не будут иметь возможности для возмездия или вознаграждения вне игры.Наиболее важно то, что при определении стратегии принятия решений заключенными применяется очень узкое толкование термина «рациональность». Учитывая эти условия и выплаты, указанные выше, заключенный A предаст заключенного B. Игра симметрична, поэтому заключенный B должен действовать таким же образом. Поскольку оба «рационально» решают дезертировать, каждый получает меньшее вознаграждение, чем если бы оба молчали. Традиционная теория игр приводит к тому, что оба игрока находятся в худшем положении, чем если бы каждый предпочел смягчить приговор своему сообщнику за счет того, что сам провел больше времени в тюрьме.
Обобщенная форма
Структура традиционной дилеммы заключенного может быть обобщена исходя из ее первоначальной ситуации с заключенным. Предположим, что два игрока представлены цветами, красным и синим, и что каждый игрок выбирает либо «Сотрудничать», либо «Дефект».
Если оба игрока сотрудничают, они оба получают вознаграждение в размере R за сотрудничество. Если оба игрока дезертируют, они оба получают штрафную выплату P . Если Синий отказывается, в то время как Красный сотрудничает, то Синий получает вознаграждение за искушение T , в то время как Красный получает вознаграждение «присоски», S .Точно так же, если Синий сотрудничает, в то время как Красный дефект, тогда Синий получает вознаграждение присоски S , в то время как Красный получает вознаграждение за искушение T .
Это можно выразить в нормальной форме:
Сотрудничать | Дефект | |
---|---|---|
Сотрудничать | р , р | S , T |
Дефект | T , S | п. , п. |
и, чтобы быть игрой-дилеммой заключенного в строгом смысле слова, для выплат должно выполняться следующее условие:
T > R > P > S
Соотношение выигрыша R > P подразумевает, что взаимное сотрудничество превосходит взаимный отказ, в то время как отношения выплаты T > R и P > S подразумевают, что побег является доминирующей стратегией для обоих агентов. .То есть взаимный отказ — единственное сильное равновесие по Нэшу в игре (то есть единственный результат, из-за которого каждый игрок может сделать только хуже, изменив стратегию в одностороннем порядке). Таким образом, дилемма состоит в том, что взаимное сотрудничество дает лучший результат, чем взаимное отступничество, но это не рациональный результат, потому что с эгоистической точки зрения выбор сотрудничества на индивидуальном уровне иррационален.
Особый случай: игра с пожертвованиями
«Игра в пожертвования» [7] — это форма дилеммы заключенного, в которой сотрудничество соответствует предложению другому игроку выгоды b за личные расходы c с b > c .Отклонение означает ничего не предлагать. Таким образом, матрица выплат равна
.Сотрудничать | Дефект | |
---|---|---|
Сотрудничать | b-c , b-c | -c , b |
Дефект | b , -c | 0 , 0 |
Обратите внимание, что 2R> T + S (т.е. 2 (b-c)> b-c ), что квалифицирует игру с пожертвованиями как повторяющуюся игру (см. Следующий раздел).
Игра в пожертвования может применяться к рынкам. Предположим, X выращивает апельсины, Y выращивает яблоки. Предельная полезность яблока для производителя апельсинов X составляет b , что выше, чем предельная полезность ( c ) апельсина, поскольку у X есть избыток апельсинов и нет яблок. Точно так же для производителя яблок Y предельная полезность апельсина составляет b , а предельная полезность яблока составляет c . Если X и Y заключают договор об обмене яблоком и апельсином, и каждый выполняет свою часть сделки, то каждый получает выплату b-c .Если один «дефект» и не доставит, как обещано, перебежчик получит выплату в размере b , а кооператор потеряет c . Если оба ошибаются, то ни один из них ничего не приобретает и не теряет.
Повторяющаяся дилемма заключенного
Если два игрока играют в дилемму заключенного более одного раза подряд, и они помнят предыдущие действия своего противника и соответственно меняют свою стратегию, игра называется повторной дилеммой заключенного.
В дополнение к общей форме, приведенной выше, итеративная версия также требует, чтобы 2 R > T + S, , чтобы предотвратить чередование сотрудничества и отступничества, дающее большее вознаграждение, чем взаимное сотрудничество.
Повторяющаяся игра «дилемма заключенного» является фундаментальной для некоторых теорий человеческого сотрудничества и доверия. Исходя из предположения, что игра может моделировать транзакции между двумя людьми, требующими доверия, совместное поведение в популяциях может быть смоделировано многопользовательской повторяющейся версией игры. Следовательно, на протяжении многих лет он очаровывал многих ученых. В 1975 году Грофман и Пул подсчитали, что количество научных статей, посвященных этой теме, превысило 2000. Повторяющаяся дилемма заключенных также упоминается как «игра мир-война». [8]
Если игра сыграна ровно N раз, и оба игрока знают это, то всегда теоретически оптимальным решением будет дефект во всех раундах. Единственное возможное равновесие по Нэшу — всегда отклоняться. Доказательство носит индуктивный характер: с таким же успехом можно отступить на последнем ходу, поскольку у оппонента не будет шанса ответить позже. Следовательно, оба дезертируют в последний ход. Таким образом, игрок может также дезертировать на предпоследнем ходу, так как противник отступит на последнем, что бы ни было сделано, и так далее.То же самое применимо, если продолжительность игры неизвестна, но имеет известный верхний предел.
В отличие от стандартной дилеммы заключенных, в повторяющейся дилемме заключенных стратегия побега противоречит интуиции и плохо предсказывает поведение игроков-людей. Однако в рамках стандартной экономической теории это единственно правильный ответ. Сверхрациональная стратегия в повторяющейся дилемме заключенного с фиксированным N заключается в сотрудничестве против сверхрационального оппонента, а в пределе большого N экспериментальные результаты по стратегиям согласуются с суперрациональной версией, а не с теоретико-игровой рациональной версией.
Чтобы возникло сотрудничество между теоретически рациональными игроками, общее количество раундов N должно быть случайным или, по крайней мере, неизвестным игрокам. В этом случае «всегда дефект» может больше не быть строго доминирующей стратегией, а только равновесием по Нэшу. Среди результатов, показанных Робертом Ауманом в статье 1959 года, рациональные игроки, постоянно взаимодействующие в течение бесконечно длинных игр, могут поддерживать совместный исход.
Стратегия решения повторяющейся дилеммы заключенного
Интерес к повторной дилемме заключенных (IPD) пробудил Роберт Аксельрод в его книге « Эволюция сотрудничества » (1984).В нем он сообщает о организованном им турнире из дилеммы заключенного шага N (с фиксированным N ), в котором участники должны снова и снова выбирать свою общую стратегию и помнить о своих предыдущих встречах. Аксельрод пригласил академических коллег со всего мира разработать компьютерные стратегии для участия в турнирах IPD. Введенные программы сильно различались по алгоритмической сложности, начальной враждебности, способности прощать и так далее.
Аксельрод обнаружил, что, когда эти встречи повторялись в течение длительного периода времени со многими игроками, каждый из которых имел свою стратегию, жадные стратегии, как правило, очень плохо работали в долгосрочной перспективе, в то время как более альтруистические стратегии работали лучше, если судить по чисто личным интересам.Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из механизмов, которые изначально были чисто эгоистичными, путем естественного отбора.
Выигрышная детерминированная стратегия была «око за око», которую Анатолий Рапопорт разработал и принял участие в турнире. Это была самая простая программа, содержащая всего четыре строки BASIC, и она выиграла конкурс. Стратегия состоит в том, чтобы просто сотрудничать на первой итерации игры; после этого игрок делает то, что его противник делал на предыдущем ходу.В зависимости от ситуации немного лучшей стратегией может быть «око за око с прощением». Когда оппонент отказывается, на следующем ходу игрок все равно сотрудничает с небольшой вероятностью (около 1–5%). Это позволяет время от времени выздоравливать, чтобы не попасть в ловушку цикла дезертирства. Точная вероятность зависит от состава противников.
Анализируя стратегии, набравшие наибольшее количество очков, Аксельрод сформулировал несколько условий, необходимых для успеха стратегии.
- Ницца
- Самым важным условием является то, что стратегия должна быть «хорошей», то есть не допускать ошибок раньше, чем это сделает оппонент (это иногда называют «оптимистическим» алгоритмом).Практически все стратегии, получившие наибольшее количество очков, были хороши; следовательно, чисто эгоистичная стратегия не будет «обманывать» своего оппонента, прежде всего из чисто корыстных соображений.
- Возмездие
- Однако, утверждал Аксельрод, успешная стратегия не должна быть слепым оптимистом. Иногда ему приходится принимать ответные меры. Пример стратегии без возмездия — «Всегда сотрудничать». Это очень плохой выбор, так как «противные» стратегии будут безжалостно эксплуатировать таких игроков.
- Прощение
- Успешные стратегии также должны прощать.Хотя игроки будут принимать ответные меры, они снова вернутся к сотрудничеству, если противник не будет продолжать отступать. Это останавливает длительные периоды мести и контр-мести, увеличивая количество очков.
- Не завистливый
- Последнее качество — не завидовать, то есть не стремиться забить больше соперника.
Оптимальная стратегия (максимизация очков) для одноразовой игры PD — это просто отступничество; как объяснялось выше, это верно независимо от состава оппонентов.Тем не менее, в игре с итерацией PD оптимальная стратегия зависит от стратегий вероятных противников и их реакции на отступничество и сотрудничество. Например, представьте себе популяцию, в которой все каждый раз сбегают, за исключением одного человека, который следует стратегии «око за око». Этот человек находится в небольшом невыгодном положении из-за проигрыша в первый ход. В такой популяции оптимальная стратегия для этого человека — каждый раз дезертировать. В популяции с определенным процентом постоянных перебежчиков и остальными игроками, играющими за око, оптимальная стратегия для отдельного человека зависит от процента и от продолжительности игры.
В стратегии под названием «Павлов, победа-остаться, проиграть-переключиться». Если результат последнего раунда был P, P , игрок Павлова меняет стратегию на следующем ходу, что означает, что P, P будет считаться неудачей сотрудничать. [ необходима ссылка ] Для определенного диапазона параметров [ укажите ] , Павлов превосходит все другие стратегии, отдавая предпочтение товарищам по игре, которые напоминают Павлова.
Определение оптимальной стратегии обычно осуществляется двумя способами:
- Байесовское равновесие по Нэшу: если можно определить статистическое распределение противоположных стратегий (например,грамм. 50% око за око, 50% всегда сотрудничают) оптимальная контрстратегия может быть получена аналитически. [9]
- Монте-Карло моделировали популяции, в которых особи с низкими показателями умирают, а люди с высокими показателями размножаются (генетический алгоритм для поиска оптимальной стратегии). Сочетание алгоритмов в конечной популяции обычно зависит от состава исходной популяции. Введение мутации (случайное изменение во время размножения) снижает зависимость от исходной популяции; эмпирические эксперименты с такими системами имеют тенденцию давать «око за око» (см., например, Chess 1988), но не существует аналитических доказательств того, что это будет происходить всегда.
Хотя «око за око» считается самой надежной базовой стратегией, команда из Саутгемптонского университета в Англии (возглавляемая профессором Николасом Дженнингсом и состоящая из Радждипа Даша, Сарвапали Рамчурна, Алекса Роджерса, Перукришнена Вителингума) представила новую стратегию на выставке. К 20-летнему юбилею повторился конкурс «дилемма заключенного», который оказался более успешным, чем око за око. Эта стратегия основывалась на сговоре между программами для достижения наибольшего количества баллов за одну программу.
Взыскание ренты, выбор общества и дилемма заключенного
Поиск ренты, общественный выбор и дилемма заключенного,
Примечание 3, Общества страхования и взаимопомощи
Случай, который больше похож на политическое распределение пособий, — это страховка . Затраты распределяются между группой плательщиков, застрахованных, а льготы концентрируются на небольшой группе бенефициаров, тех, кто понес убытки и имеет страховое возмещение.
Однако застрахованные вступают в эти отношения добровольно, потому что они понимают принцип, по которому это работает. Застрахованные — это группа, которой подвержены риску причинения вреда. У них есть корабль, который может затонуть. Они водят машину, которая может попасть в аварию. У них есть дом, который может сгореть, подвергнуться ограблению или быть поврежденным во время шторма или землетрясения. Или, как и все люди, они могут быть подвержены болезням или преждевременной смерти. Приобретая страховку, они решили заплатить немного денег и объединить свой риск .Поскольку не все застрахованные действительно пострадают, стоимость страховки будет намного ниже, чем стоимость фактического ущерба, который случится с некоторыми из них. Но если такой вред случится, они будут защищены.
Это разумный и осмотрительный бизнес — хотя экономисты заметили « моральный риск », заключающийся в том, что те, у кого есть страховка, могут быть менее осторожны в своем благополучии, поскольку они чувствуют себя защищенными от последствий возможных неосторожных действий.Стоимость страхования от конкретных угроз может быть определена математически после того, как была изучена степень ущерба и составлено актуарных таблиц . Некоторые из первых страховых компаний были созданы в Lloyd’s Coffee House в Лондоне, открытом в 1688 году, где моряки и торговцы встречались, чтобы поболтать, а затем начали создавать страховые полисы для своих кораблей. Это заведение до сих пор существует как Lloyd’s of London, предположительно без кофе.
В Соединенных Штатах в 19 веке страхование в основном началось с обществ взаимопомощи , которые предлагали своим членам различные льготы, включая медицинское страхование и страхование жизни.Такие общества могут быть религиозными, профессиональными, «братскими» или чисто коммерческими по своему характеру. «Братские» общества были «ложами», которые по сути были общественными организациями, с ритуалами, костюмами, инициациями, благотворительными проектами и морально назидательными учениями — но без религиозной идентичности, которая, например, до сих пор отличает (католических) рыцарей Колумба. . Некоторые из братских обществ, как известно, выживают, например масоны, или до сих пор занимаются заметной благотворительностью, как, например, Святители; но большинство из них, как Братский Орден Орлов, могут показаться людям бесполезными и нелепыми.Тем не менее современные страховые компании часто демонстрируют доказательства своего происхождения. Нетрудно догадаться, откуда взялись такие компании, как Fireman’s Fund, Traveller’s или State Farm Insurance. Однако чисто братские ложи иногда имели названия, похожие на названия профессиональных ассоциаций, такие как «Лесные люди мира».
Функция обществ взаимопомощи практически разрушена верой многих людей и ее политическим воплощением в том, что правительство должно выполнять многие из их основных задач.Этот сдвиг произошел в значительной степени благодаря Великой депрессии, которая нанесла ущерб экономической жизнеспособности обществ, многие из которых остались без работы и не смогли справиться со своими обязанностями. Эти трудности позволили тем, кто всегда верил в социализм , что правительство должно обеспечить «социальную» страховку для всех, совершить политические набеги.
Действительно, правительство издавна практиковало оказание окончательной поддержки частным учреждениям, которые в XIX веке предоставляли большую часть благотворительной помощи бедным.Правительственные дома для бедных, рабочие и детские дома были, в свою очередь, печально известны как неприятные и даже жестокие места. Отчасти это было намеренно. Как сказал Бенджамин Франклин, не следует делать кого-то «легким в бедности». В эссе 1766 года «Поощрение праздности» Франклин сказал:
Я за то, чтобы делать добро бедным, но я расходлюсь во мнениях относительно средств. Я считаю, что лучший способ сделать добро бедным — не облегчить им жизнь в бедности, а вывести или изгнать их.В юности я много путешествовал и наблюдал в разных странах, что чем больше общественного питания создавалось для бедных, тем меньше они обеспечивали себя и, конечно же, становились беднее. И, наоборот, чем меньше они делали для них, тем больше они делали для себя и становились богаче.
Все это основывалось на моральном различии между «достойными бедняками», которые были готовы работать, но испытывали трудности не по своей вине, и «недостойными бедняками», которые на самом деле стремились избегать работы и искали поддержки через мошенническими или нечестными способами.Частная благотворительность, которая по большей части была религиозной по мотивам, очень серьезно относилась к этому; и от трудоспособных часто требовалось выполнить некоторую номинальную работу для благотворительности, прежде чем их накормили, например, на их столовой. В государственных учреждениях по оказанию «помощи» большая часть споров велась по поводу того, следует ли предоставлять «помощь на открытом воздухе», то есть социальные выплаты людям, живущим самостоятельно, или только «помощь в помещениях», то есть в домах для бедных и рабочих домах. Помощь на открытом воздухе позволила бы избежать скандалов, связанных с грязью или жестокостью, которые часто приводили в неловкое положение последние учреждения.Однако помощь на открытом воздухе требовала надзора, то есть «социальных работников», которые следили бы за тем, чтобы получатели действительно нуждались в помощи и не занимались аморальными (а значит, «недостойными» в социальном и экономическом отношении) деятельностью. Воспитание сирот в приемных семьях, конечно же, было «уличной» версией приютов, даже несмотря на то, что они также требовали надзора со стороны социальных работников, создавая соответствующие истории пренебрежения, жестокости и жестокого обращения.
Депрессия охватила большинство благотворительных организаций, в том числе правительственные, и открыла путь даже для федеральных программ помощи, таких как Помощь семьям с детьми-иждивенцами, несмотря на отсутствие конституционных положений для таких вещей.Можно было бы привести аргумент, что это было необходимо во время Великой депрессии; но, разумеется, однажды созданные федеральные программы продолжали существовать, и только редкий бессердечный псих когда-либо пытался напомнить нации, что продолжение подобных вещей неконституционно. Какое значение имеет «конституционность», когда можно сделать так много добра? Но затем моральные и пруденциальные принципы не только помощи, но и страхования начали подрываться самими силами политического обеспечения благ, которое я рассматриваю.
Таким образом, в США «Социальное обеспечение» было введено в 1935 году как часть законодательства Нового курса. Он был представлен как пенсионный план, в котором работники платят на свой счет, а их взносы согласовываются с работодателями, из которых они будут получать средства в старости. Пенсионная система — это форма страхования, ранее предоставляемая многими предприятиями и обществами взаимопомощи, которая зависит от актуарных реалий. Однако вначале Социальное обеспечение не имело ничего общего с надежными принципами страхования и полностью представляло собой план предоставления пособий на политическом уровне.До тех пор, пока количество рабочих было намного больше, чем имеющееся количество пенсионеров, Система могла продолжать свое существование; и никто бы не подумал, что это принесет пользу ограниченному политическому электорату, поскольку любой, кто заплатил и прожил достаточно долго, будет понятен. Кто мог возражать против этого?
К сожалению, две реальности могут подорвать платежеспособность Системы. Во-первых, он был расширен для охвата рабочих-инвалидов. Но никогда не существовало отдельного налога или отчислений для обеспечения жизнеспособности социального обеспечения как системы выплат по инвалидности.Такие выплаты будут вычтены из общих доходов социального обеспечения, независимо от того, как рано или сколько рабочих стали инвалидами. Они могут получать поддержку до конца своей жизни, внося в Систему лишь номинальную сумму. В то же время старение поколения бэби-бума и падение рождаемости означало, что соотношение работающих к бенефициарам (пенсионерам и инвалидам) упадет, возможно, катастрофически.
В рамках подготовки к будущему дефициту в 1980-х годах были повышены налоги на социальное обеспечение, чтобы создать излишек, Целевой фонд, который можно было бы использовать в будущем при необходимости.Это было мошенничеством, поскольку профицит всегда просто отдавался казначейству, которое выпускало казначейские облигации Соединенных Штатов Управлению социального обеспечения, а затем тратит деньги на текущие федеральные расходы. Таким образом, «Доверительный фонд» — это комната, полная бумаг, стоимость которых полностью зависит от будущих доходов федерального бюджета, которые могут быть получены только путем налогообложения, заимствования или снижения стоимости. Таким образом, излишек, полученный в результате нынешнего налогообложения социального обеспечения, должен быть пополнен заново путем будущего федерального налогообложения, заимствования или снижения стоимости.Из-за этого сенатор-демократ Дэниел Патрик Мойнихан (1927-2003), у которого были моменты изумительной ясности и честности, сказал, что «Трастовый фонд социального обеспечения» был просто ящиком, который при открытии не содержал бы ничего, кроме листка бумаги, который сказал: «Расписка в пять триллионов долларов».
Социальное обеспечение, таким образом, не страхование, а схема Понци, в которой текущие выплаты выплачиваются из текущих доходов, в конечном итоге, из казначейства, независимо от будущих обязательств и обещаний.В 2012 году единственным национальным политиком, который имел смелость или глупость, чтобы сказать это, был губернатор Техаса Рик Перри. Вероятно, это было глупо, поскольку Перри позже продемонстрировал, что ему трудно запомнить свои собственные политические тезисы. Периодически утверждают, что Социальное обеспечение является финансово устойчивым по крайней мере до 2030-х годов. Однако этот прогноз основан на предположении, что «Целевой фонд» представляет собой реальные активы. Поскольку это не так, день расплаты для социального обеспечения наступает, когда оно перестает иметь излишек в своих собственных доходах и начинает обналичивать свои облигации в Казначействе.В этот момент Казначейство теряет доходы, полученные от социального обеспечения, и должно начать возвращать ранее полученные суммы, используя свои собственные налоговые и заемные полномочия. Этот день, возможно, уже наступил, когда я пишу [в 2012 году]. Таким образом, сегодня выплаты по социальному обеспечению, медицинской помощи, Medicaid и проценты по государственному долгу в настоящее время полностью потребляют федеральные доходы. Все остальное, включая весь оборонный бюджет, надо брать в долг. Насколько я понимаю, Федеральная резервная система в настоящее время покупает 60% казначейских облигаций Соединенных Штатов, а это означает, что федеральное правительство просто создает и печатает большую часть денег, которые оно тратит.Рано или поздно это обесценивание вызовет период взрывной инфляции.
Упоминание о Medicare и Medicaid подводит меня к тому, что большинство людей теперь думает как о страховании: здравоохранение. Однако в популярном и политическом дискурсе то, что обычно называют «здоровьем» или «медицинской страховкой», на самом деле вовсе не является страховкой. Это потому, что современные формы медицинского «страхования» , а не , в первую очередь связаны с объединением рисков. Если вы знаете, что вы собираетесь делать прививку от гриппа каждый год, и ваша «страховка» оплачивает прививку, нет никакой неопределенности и никакого риска.Вы не рискуете получить прививку от гриппа. Вы знаете, что идут , чтобы получить его. Если вы заплатили за «страховку», покрывающую выстрел, а страховая компания платит за каждый выстрел, то пула риска нет. Все просто заранее оплатили снимок. Это может потребовать некоторой экономии, поскольку страховая компания получает свои доходы заранее и может дисконтировать то, что она заработала от хранения ваших денег; но экономия здесь для вас минимальна. В конечном счете, большую часть стоимости прививок от гриппа должен нести застрахованный.Чем больше к «страховке» добавляется не рисков, а определенности, таких как обычные посещения врача, контроль рождаемости и другие предсказуемые расходы, тем дороже будет «страховка», поскольку количество получателей будет приближаться к фактическому количество застрахованных. В таком устройстве нет подлинной экономии и нет причин, кроме политического обмана и экономического невежества, называть его «страховкой».
Эта реальность, кажется, теряется в большинстве публичных дискуссий о медицинском страховании.При этом создается впечатление, что «страховка» обязательно будет стоить меньше, чем полная стоимость пособий. Но если страхование превратить в политическую программу, в которой выгоды сконцентрированы, а затраты распределены, но затраты на самом деле не распределены, обман быстро уничтожит любую выгоду, полученную от реального страхования, не говоря уже о рыночном распределении товаров. Между тем, люди, которые продвигают медицинскую «страховку» как право на гражданство или даже негражданство, враждебно настроены по отношению к работе рынков и хотят, чтобы все товары были распределены по политическим мотивам.
То, что экономика, как истинного страхования, так и рыночная, тем временем упраздняется, означает, что экономические характеристики социализма — рост издержек и снижение качества с политическим фаворитизмом — начинают творить чудеса. В то время как динамика рынков заключается в снижении затрат и повышении качества за счет капиталовложений в инновации и производительность, политический подход к ограничению затрат — это нормирования (смягченное, конечно, политическим фаворитизмом).Это уже очевидно в теоретической подоплеке сторонников социализированной медицины в «Obamacare». Все они выступают за создание Федерального совета (Независимого консультативного совета по платежам или IPAB), который будет утверждать формы и уровни медицинской помощи, а также пригодность пациентов для получения медицинской помощи, а законодательство требует. В 2009 году, когда Сара Пэйлин назвала такую доску «панелью смерти», это вызвало протест как искажение или даже ложь; но ограничение ухода за пожилыми людьми, особенно в терминальной стадии, долгое время поддерживалось.В 1984 году Ричард Ламм, демократ-губернатор Колорадо (1975-1987), как известно, сказал: «У нас есть долг умереть и уйти с дороги со всеми нашими машинами, искусственными сердцами и всем остальным, и позволить другое общество, наши дети, строят разумную жизнь ».
Предполагается, что IPAB обеспечит экономию расходов на Medicare «без ущерба для покрытия или качества», но он просто не сможет ограничить расходы , а не , не ограничивая медицинское обслуживание посредством нормирования.Между тем, в то время как отказ страховых компаний в медицинской помощи вызывал возмущенные протесты и фильмы Майкла Мура, Medicare уже имеет отчет об отказе в медицинской помощи чаще, чем страховые компании. Социалисты вроде Мура либо не осознают, либо неискренне скрывают то обстоятельство, что федеральное правительство (не более чем любимая Мура Куба) не обязано оказывать какую-либо помощь, которую его бюрократы не сочтут целесообразными, в то время как страховые компании имеют договорные обязательства с угроза судебных исков поблизости (со стороны скорой помощи, преследующей адвокатов), чтобы обеспечить уход, к которому они привязаны по контракту (хотя судебные процессы часто касаются вещей, которые фактическая политика не покрывает , с не более чем аргументом, что пациенту они нужны) .Это похоже на то, что произошло с первоначальными Федеральными гарантиями социального обеспечения. В конце концов, Верховный суд постановил, что граждане не имеют прав на деньги, которые они внесли в систему социального обеспечения, которые могут быть использованы для любых целей, которые Конгресс сочтет целесообразными, и что любые льготы по социальному обеспечению или их отсутствие полностью на усмотрение Конгресса. . Тем временем социализированная медицинская система в Канаде осуществляет нормирование со списками ожидания. Многие пациенты просто не доживают до тех пор, пока им не начнется лечение.Obamacare теперь может лишить канадцев возможности поехать в Соединенные Штаты для лечения, что увеличивает нагрузку на канадскую систему.
Вернуться к тексту
Поиск ренты, общественный выбор и дилемма заключенного,
Примечание 4, Положительные, отрицательные и игры с нулевой суммой
Если книги в Ирландии можно купить намного дешевле (что, как мне кажется, я купил там Blackstone за 24 шилл., Когда он продавался в Англии по 4 гинеи), то это не преимущество, правда, не для английских книготорговцев, а для английских читателей, а к обучению?В торговых сделках не следует предполагать, что, как и в случае с играми, то, что одна сторона приобретает, другая обязательно теряет.Прибыль для каждого может быть равной. Если у А было больше кукурузы, чем он может потребить, но он хочет скот, а у В больше скота, но он хочет кукурузы, обмен является выгодой для каждого; тем самым увеличивается общий запас жизненных удобств.
Бенджамин Франклин , 1783 (ссылка на комментариев Уильяма Блэкстоуна к законам Англии , 1765-1769, теперь из University of Chicago Press, 4 тома, 1979; Франклин здесь описал форму положительной суммы игра )
Ты умрешь.Я живу.Китайская поговорка. «Сражайтесь насмерть» [Джон ДеФрэнсис, ABC Китайско-английский всеобъемлющий словарь , Гавайский университет Press, 2003, с.657].
Оригинальная игра с нулевой суммой.
Фон Нейман по существу изобрел цифровой компьютер. Он построил прототип в подвале Института перспективных исследований в Принстоне, хотя позже его разобрали, несмотря на его историческую ценность, поскольку Институт не верит в механизмы.Фон Ньюманн похоронен рядом с великим математиком Куртом Гёделем на Принстонском кладбище.
Одним из наиболее заметных и устойчивых достижений теории игр является различие между положительными, отрицательными и играми с нулевой «суммой» . «Игра с нулевой суммой» означает, что значения, найденные в конце игры или транзакции, равны значениям в начале, так что разница («сумма» вычитания) равна нулю. Другой способ взглянуть на это состоит в том, что если один из игроков в конце игры приобретает большую ценность, чем в начале, его выигрыш должен быть связан с проигрышем другого игрока.Популярные игры, от шахмат до бейсбола, где один игрок выигрывает, а другой проигрывает, являются играми с нулевой суммой, потому что, когда единственная ценность — выигрыш, один игрок выигрывает, а другой проигрывает. Люди с концепцией Культа Карго об экономике, где богатство просто существует в фиксированных количествах, и каждый заслуживает свой кусок «пирога», будут думать об экономике как об игре с нулевой суммой, чтобы успешные приобрели свое богатство за счет других. . Хороший пример этого — в оригинальном фильме Wall Street [1987], где «корпоративный рейдер» Гордон Гекко (Майкл Дуглас) категорически утверждает, что бизнес — это «игра с нулевой суммой», где деньги просто переходят от проигравших к победителям.Это отражает левую идеологию культа карго режиссера Оливера Стоуна и его коллеги по фильму Мартина Шина, которые постоянно опозорили себя, подлизывая лести коммунистическому диктатору Фиделю Кастро.
Однако бесплатные экономические транзакции обычно представляют собой игры с положительной суммой. Это уже прекрасно понимал Бенджамин Франклин:
В торговых сделках не следует предполагать, что, как и в случае с играми, то, что одна сторона получает, другая обязательно теряет.Прибыль для каждого может быть равной. Если у А было больше кукурузы, чем он может потребить, но он хочет скот, а у В больше скота, но он хочет кукурузы, обмен является выгодой для каждого; тем самым увеличивается общий запас жизненных удобств. [1783, Завершенная автобиография Бенджамина Франклина , составленная и отредактированная Марком Скоузеном, Regnery Publishing, 2006, стр.300]
В таких сделках в конце концов выигрывает каждая сторона. Количество зерна и скота может быть одинаковым в начале и в конце обмена, но излишки зерна и скота сами по себе бесполезны для их производителей.В конце концов, у каждого есть больше того, что он может использовать , и ценность всего выросла. При свободном экономическом обмене ни одна из сторон не может получить именно то, что хочет, поскольку продавец всегда хотел бы продавать дороже, а покупатель всегда хотел бы покупать за меньшую цену, но добровольный характер обмена означает, что каждая из сторон должна идти на компромисс с Другие.
С другой стороны, грабеж — это игра с отрицательной суммой. Обмен непроизвольный. Одна сторона остается ни с чем, в то время как другая сторона, грабитель, приобрела товары, которые для него стоят меньше, чем для первоначального владельца.Обычно лучшее, что может сделать грабитель, — это вернуть часть стоимости своей добычи, продав ее забору. Забор куплю только с большой скидкой. Очень часто грабитель приобретает вещи, которые представляли только личную ценность для их владельца и которые, как понимает грабитель, для него ничего не стоят. Поэтому он их выбрасывает. Часто это наиболее болезненный аспект кражи со взломом и грабежа. Телевизоры или деньги, как правило, взаимозаменяемы, т. Е. Их можно заменить предметами, имеющими одинаковую ценность, но личные вещи — нет.Иногда грабители намеренно уничтожают дома и личные вещи в актах вандализма, просто чтобы выразить свое презрение и враждебность к своим жертвам. Это особенно уродливое проявление человеческой натуры, но отнюдь не редкость. Нечестивые не только не сочувствуют своим жертвам; они их презирают.
Существует один вид свободного рынка — игра с отрицательной суммой. Это короткая торговля . Это игра с отрицательной суммой только потому, что она происходит при падении цен.Таким образом, ценность в конце бизнеса обязательно будет меньше, чем в начале. Вопрос только в том, кто застрянет с обесцениваемым активом. Навык короткой торговли, и это умение, которое специалисты используют лучше всего, заключается в том, чтобы убедиться, что другие застряли в проигрыше. Когда цены падают, короткий трейдер берет в долг акции или какой-либо другой актив, продает их, а затем выкупает обратно по более низкой цене после того, как цена упала. Это оставляет первоначального владельца акций, который может быть просто брокером, снова во владении активом, который потерял свою ценность, в то время как трейдер на короткую позицию получил прибыль стандартным способом — покупая дешево и продавая дорого, хотя последовательность обратная.
Короткие трейдеры часто имеют плохую репутацию. Их не любят, потому что, как «медведи», они получают прибыль от падающего рынка, где в основном проигрывают все остальные. Кроме того, они могут участвовать в распространении слухов или других манипуляциях, которые поощряют или даже вызывают падение цен ( Джордж Сорос , мастер короткой торговли, был обвинен в этом). Они также могут участвовать в «голой торговле», когда они даже не занимают актив, а продают его с обещанием доставить, а затем ждут доставки актива после того, как купят его на деньги от продажа.Это как минимум сомнительная законность.
Тем не менее, короткие трейдеры часто оказывают очень важную услугу. Когда Джей Гулд попытался захватить рынок золота в 1869 году, его стратегия заключалась в том, чтобы покупать золото и поднимать цены. Другие затем заняли золото (даже у Гулда) для продажи, ожидая, что Гулд потерпит неудачу в своей игре и цены упадут, что позволит им выкупить и получить прибыль. Таким образом, «загоняя рынок в угол», Гулд фактически пытался обанкротить всех, кто делал против него ставки, короткой торговлей.Конечно, никто не хотел, чтобы Гулд добился успеха; и когда президент Грант приказал казначейству продать золото, цена упала, короткие трейдеры выиграли, а позиция Гулда была разрушена. Однако, предвидя приближающийся крах, он тайно продавал, а также покупал, и поэтому был защищен от значительных потерь. Однако это подорвало его репутацию. Мало кто плакал по этому поводу.
Этот эпизод положил начало расследованию Конгресса, в котором враги Гранта (то есть южные симпатизирующие демократы) хотели обвинить во всем его самого.Примерно то же самое произошло, когда братья Хант (Нельсон Банкер Хант и Герберт Хант) пытались захватить рынок серебра в 1980 году. Короткие трейдеры, конечно, не всегда выигрывают. В 1863 году соперник Корнелиуса Вандербильта, Дэниел Дрю , начал продавать акции Нью-Йоркской и Гарлемской железной дороги Вандербильта (позже слиться с Нью-Йоркской Центральной железной дорогой). Это было в союзе с политиками Нью-Йорка, которые отозвали разрешения на строительство, чтобы нанести ущерб стоимости железной дороги. Однако Вандербильт скупил все выпущенные акции.Дрю и его союзники были юридически обязаны производить акции, которые Вандербильт не позволял им покупать. В конце концов, Вандербильт отпустил их с убытком в 5 миллионов долларов. Дрю резюмировал эту неразбериху: «Тот, кто продает то, что ему не принадлежит, должен выкупить это обратно или отправиться в тюрьму». Позже, в 1868 году, Дрю с помощью Джея Гулда добьется большего успеха в битве с Вандербильтом за железную дорогу Эри.
Мыслители-популисты, такие как комментатор Билл О’Рейли, не могут поверить в то, что рост цен не является манипулированием заговора «спекулянтов».«О’Рейли часто бросал вызов экономистам и финансовым репортерам в своем шоу, спрашивая:« Кто устанавливает цены? »Это разумный вопрос, но, как ни странно, эксперты часто затрудняются ответить на него. Они должны знать лучше. Ответ заключается в том, что цены устанавливаются последними людьми , чьи заявки на покупку или заявки на продажу приняты. Цены повышаются, когда ваша заявка на покупку не принимается, а вы предлагаете больше. Цены снижаются, когда ваша заявка на продажу не принято, и вы просите меньше.Конечно, каждый брокер хочет покупать дешево и продавать дорого (или продавать дорого, а затем покупать дешево), о чем рядовой потребитель может не знать, пока не попробует купить или продать иностранную валюту. Поскольку О’Рейли видит только спекулянтов-заговорщиков за ростом цен, он игнорирует то обстоятельство, что существует, возможно, такое же количество спекулянтов, коротких трейдеров , которые делают ставки на падающие цены. На рынках присутствуют Быки и Медведи . Когда цены действительно растут или падают, это означает, что происходит нечто большее, чем просто спекулянты.
Поскольку шорт-трейдеров обычно не любят, как темные ангелы падающих цен, комментаторы и политики часто могут извлечь пользу из предложений о запрете или ограничении короткой торговли. Возникает вопрос, согласны ли такие люди на это или субсидируются спекулянтами, ищущими более высокие цены. Билл О’Рейли должен провести расследование. Возможно, короткие трейдеры (Джордж Сорос ?!) могли бы его субсидировать.
Поиск политической ренты — это игра с отрицательной суммой. Экономический обмен может стать принудительным полностью или частично.Одна сторона вынуждена делать то, с чем она в противном случае вообще не согласилась бы, и в результате для этой стороны легко не было никакой выгоды и абсолютная потеря ценности. Классический случай, как ни странно, — контроль арендной платы за жилое жилье. Соискатели арендной платы на самом деле являются арендаторами, которые хотят условий, с которыми арендодатели не согласились бы или не могли согласиться. Арендаторы, однако, считают, что они имеют право вносить арендную плату на собственных условиях , а также в таких местах, как Нью-Йорк, Сан-Франциско, Санта-Моника и т. Д., они могут пройти через политику. Поскольку в результате домовладельцы могут быть вынуждены эксплуатировать свою собственность в убыток, поскольку они не могут взимать рыночную арендную плату, поразительным последствием на протяжении многих лет, особенно в Нью-Йорке, было не только пренебрежение собственностью, которая не стоит ремонт, а сразу заброшено жилых домов.