Основные понятия теории игр и игровых моделей. Математическая теория игр

Тео́рия игр - математический метод изучения оптимальных стратегий в играх. Под игрой понимается процесс, в котором участвуют две и более сторон, ведущих борьбу за реализацию своих интересов. Каждая из сторон имеет свою цель и использует некоторую стратегию, которая может вести к выигрышу или проигрышу - в зависимости от поведения других игроков. Теория игр помогает выбрать лучшие стратегии с учётом представлений о других участниках, их ресурсах и их возможных поступках.

Теория игр - это раздел прикладной математики, точнее - исследования операций. Чаще всего методы теории игр находят применение в экономике, чуть реже в других общественных науках - социологии, политологии, психологии, этике и других. Начиная с 1970-х годов её взяли на вооружение биологи для исследования поведения животных и теории эволюции . Очень важное значение она имеет для искусственного интеллекта и кибернетики, особенно с проявлением интереса к интеллектуальным агентам.

История.

Оптимальные решения или стратегии в математическом моделировании предлагались ещё в XVIII в. Задачи производства и ценообразования в условиях олигополии, которые стали позже хрестоматийными примерами теории игр, рассматривались в XIX в. А. Курно и Ж.Бертраном. В начале XX в. Э.Ласкер, Э.Цермело, Э.Борель выдвигают идею математической теории конфликта интересов.

Математическая теория игр берёт своё начало из неоклассической экономики . Впервые математические аспекты и приложения теории были изложены в классической книге 1944 года Джона фон Неймана и Оскара Моргенштерна «Теория игр и экономическое поведение»(англ. Theory of Games and Economic Behavior ).

Эта область математики нашла некоторое отражение в общественной культуре. В 1998 году американская писательница и журналистка Сильвия Назар издала книгу о судьбе Джона Нэша, нобелевского лауреата по экономике и учёного в области теории игр; а в 2001 по мотивам книги был снят фильм «Игры разума ». Некоторые американские телевизионные шоу, например, «Friend or Foe », «Alias» или «NUMB3RS», периодически ссылаются на теорию в своих эпизодах.

Дж. Нэш в 1949 году пишет диссертацию по теории игр, через 45 лет он получает Нобелевскую премию по экономике. Дж. Нэш после окончания Политехнического института Карнеги с двумя дипломами - бакалавра и магистра - поступил в Принстонский университет, где посещал лекции Джона фон Неймана. В своих трудах Дж. Нэш разработал принципы «управленческой динамики». Первые концепции теории игр анализировали антагонистические игры, когда есть проигравшие и выигравшие за их счет игроки. Нэш разрабатывает методы анализа, в которых все участники или выигрывают, или терпят поражение. Эти ситуации получили названия «равновесие по Нэшу», или «некооперативное равновесие», в ситуации стороны используют оптимальную стратегию, что и приводит к созданию устойчивого равновесия. Игрокам выгодно сохранять это равновесие, так как любое изменение ухудшит их положение. Эти работы Дж. Нэша сделали серьёзный вклад в развитие теории игр, были пересмотрены математические инструменты экономического моделирования. Дж. Нэш показывает, что классический подход к конкуренции А.Смита, когда каждый сам за себя, неоптимален. Более оптимальны стратегии, когда каждый старается сделать лучше для себя, делая лучше для других.

Хотя теория игр первоначально и рассматривала экономические модели, вплоть до 1950-х она оставалась формальной теорией в рамках математики. Но уже с 1950-х гг. начинаются попытки применить методы теории игр не только в экономике, но в биологии, кибернетике, технике, антропологии. Во время Второй мировой войны и сразу после нее теорией игр серьёзно заинтересовались военные, которые увидели в ней мощный аппарат для исследования стратегических решений.

В 1960-1970 гг. интерес к теории игр угасает, несмотря на значительные математические результаты, полученные к тому времени. С середины 1980-х гг. начинается активное практическое использование теории игр, особенно в экономике и менеджменте. За последние 20 - 30 лет значение теории игр и интерес значительно растет, некоторые направления современной экономической теории невозможно изложить без применения теории игр.

Большим вкладом в применение теории игр стала работа Томаса Шеллинга, нобелевского лауреата по экономике 2005 г. «Стратегия конфликта». Т.Шеллинг рассматривает различные «стратегии» поведения участников конфликта. Эти стратегии совпадают с тактиками управления конфликтами и принципами анализа конфликтов в конфликтологии (это психологическая дисциплина) и в управлении конфликтами в организации (теория менеджмента). В психологии и других науках используют слово «игра» в других смыслах, нежели чем в математике. Некоторые психологи и математики скептически относятся к использованию этого термина в других смыслах, сложившихся ранее. Культурологическое понятие игры было дано в работе Йохана Хёйзинга «Homo Ludens» (статьи по истории культуры), автор говорит об использовании игр в правосудии, культуре, этике.. говорит о том, что игра старше самого человека, так как животные тоже играют. Понятие игры встречается в концепции Эрика Бёрна «Игры, в которые играют люди, люди, которые играют в игры». Это сугубо психологические игры, основанные на трансакционном анализе. Понятие игры у Й.Хёзинга отличается от интерпретации игры в теории конфликтов и математической теории игр. Игры также используются для обучения в бизнес-кейсах, семинарах Г. П. Щедровицкого, основоположника организационно-деятельностного подхода. Во время Перестройки в СССР Г. П. Щедровицкий провел множество игр с советскими управленцами. По психологическому накалу ОДИ (организационно-деятельностные игры) были так сильны, что служили мощным катализатором изменений в СССР. Сейчас в России сложилось целое движение ОДИ. Критики отмечают искусственную уникальность ОДИ. Основой ОДИ стал Московский методологический кружок (ММК).

Математическая теория игр сейчас бурно развивается, рассматриваются динамические игры. Однако математический аппарат теории игр затратен. Его применяют для оправданных задач: политика, экономика монополий и распределения рыночной власти и т. п. Ряд известных ученых стали Нобелевскими лауреатами по экономике за вклад в развитие теории игр, которая описывает социально-экономические процессы. Дж. Нэш, благодаря своим исследованиям в теории игр, стал одним из ведущих специалистов в области ведения «холодной войны», что подтверждает масштабность задач, которыми занимается теория игр.

Нобелевскими лауреатами по экономике за достижения в области теории игр и экономической теории стали: Роберт Ауманн , Райнхард Зелтен, Джон Нэш, Джон Харсаньи, Уильям Викри, Джеймс Миррлис, Томас Шеллинг, Джордж Акерлоф, Майкл Спенс, Джозеф Стиглиц , Леонид Гурвиц, Эрик Мэскин, Роджер Майерсон, Ллойд Шепли, Элвин Рот.

Применение теории игр.

Теория игр, как один из подходов в прикладной математике, применяется для изучения поведения человека и животных в различных ситуациях. Первоначально теория игр начала развиваться в рамках экономической науки, позволив понять и объяснить поведение экономических агентов в различных ситуациях. Позднее область применения теории игр была расширена на другие социальные науки; в настоящее время теория игр используется для объяснения поведения людей в политологии, социологии и психологии. Теоретико-игровой анализ был впервые использован для описания поведения животных Рональдом Фишером в 30-х годах XX века (хотя даже Чарльз Дарвин использовал идеи теории игр без формального обоснования). В работе Рональда Фишера не появляется термин «теория игр». Тем не менее, работа по существу выполнена в русле теоретико-игрового анализа. Разработки, сделанные в экономике, были применены Джоном Майнардом Смитом в книге «Эволюция и теория игр». Теория игр используется не только для предсказания и объяснения поведения; были предприняты попытки использовать теорию игр для разработки теорий этичного или эталонного поведения. Экономисты и философы применяли теорию игр для лучшего понимания хорошего (достойного) поведения. Вообще говоря, первые теоретико-игровые аргументы, объясняющие правильное поведения, высказывались ещё Платоном.

Описание и моделирование.

Первоначально теория игр использовалась для описания и моделирования поведения человеческих популяций. Некоторые исследователи считают, что с помощью определения равновесия в соответствующих играх они могут предсказать поведение человеческих популяций в ситуации реальной конфронтации. Такой подход к теории игр в последнее время подвергается критике по нескольким причинам. Во-первых, предположения, используемые при моделировании, зачастую нарушаются в реальной жизни. Исследователи могут предполагать, что игроки выбирают поведения, максимизирующее их суммарную выгоду (модель экономического человека), однако на практике человеческое поведение часто не соответствует этой предпосылке. Существует множество объяснений этого феномена - нерациональность, моделирование обсуждения, и даже различные мотивы игроков (включая альтруизм). Авторы теоретико-игровых моделей возражают на это, говоря, что их предположения аналогичны подобным предположениям в физике. Поэтому даже если их предположения не всегда выполняются, теория игр может использовать как разумная идеальная модель, по аналогии с такими же моделями в физике. Однако, на теорию игр обрушился новый вал критики, когда в результате экспериментов было выявлено, что люди не следуют равновесным стратегиям на практике. Например, в играх «Сороконожка», «Диктатор» участники часто не используют профиль стратегий, составляющий равновесие по Нэшу. Продолжаются споры о значении подобных экспериментов. Согласно другой точке зрения, равновесие по Нэшу не является предсказанием ожидаемого поведения, но лишь объясняет, почему популяции, уже находящиеся в равновесии по Нэшу, остаются в этом состоянии. Однако вопрос о том, как эти популяции приходят к равновесию Нэша, остается открытым. Некоторые исследователи в поисках ответа на этот вопрос переключились на изучение эволюционной теории игр. Модели эволюционной теории игр предполагают ограниченную рациональность или нерациональность игроков. Несмотря на название, эволюционная теория игр занимается не только и не столько вопросами естественного отбора биологических видов. Этот раздел теории игр изучает модели биологической и культурной эволюции, а также модели процесса обучения.

Нормативный анализ (выявление наилучшего поведения).

С другой стороны, многие исследователи рассматривают теорию игр не как инструмент предсказания поведения, но как инструмент анализа ситуаций с целью выявления наилучшего поведения для рационального игрока. Поскольку равновесие Нэша включает стратегии, являющиеся наилучшим откликом на поведение другого игрока, использование концепции равновесия Нэша для выбора поведения выглядит вполне обоснованным. Однако, и такое использование теоретико-игровых моделей подверглось критике. Во-первых, в некоторых случаях игроку выгодно выбрать стратегию, не входящую в равновесие, если он ожидает, что другие игроки также не будут следовать равновесным стратегиям. Во-вторых, знаменитая игра «Дилемма заключенного » позволяет привести ещё один контрпример. В «Дилемме заключенного » следование личным интересам приводит к тому, что оба игрока оказываются в худшей ситуации в сравнении с той, в которой они пожертвовали бы личными интересами.

Типы игр

Кооперативные и некооперативные.

Игра называется кооперативной, или коалиционной , если игроки могут объединяться в группы, взяв на себя некоторые обязательства перед другими игроками и координируя свои действия. Этим она отличается от некооперативных игр, в которых каждый обязан играть за себя. Развлекательные игры редко являются кооперативными, однако такие механизмы нередки в повседневной жизни.

Часто предполагают, что кооперативные игры отличаются именно возможностью общения игроков друг с другом. В общем случае это неверно. Существуют игры, где коммуникация разрешена, но игроки преследуют личные цели, и наоборот.

Из двух типов игр, некооперативные описывают ситуации в мельчайших деталях и выдают более точные результаты. Кооперативные рассматривают процесс игры в целом. Попытки объединить два подхода дали немалые результаты. Так называемая программа Нэша уже нашла решения некоторых кооперативных игр как ситуации равновесия некооперативных игр.

Гибридные игры включают в себя элементы кооперативных и некооперативных игр. Например, игроки могут образовывать группы, но игра будет вестись в некооперативном стиле. Это значит, что каждый игрок будет преследовать интересы своей группы, вместе с тем стараясь достичь личной выгоды.

Симметричные и несимметричные.

Игра будет симметричной тогда, когда соответствующие стратегии у игроков будут равны, то есть иметь одинаковые платежи. Иначе говоря, если игроки могут поменяться местами и при этом их выигрыши за одни и те же ходы не изменятся. Многие изучаемые игры для двух игроков - симметричные. В частности, таковыми являются: «Дилемма заключённого», «Охота на оленя », «Ястребы и голуби». В качестве несимметричных игр можно привести «Ультиматум » или «Диктатор ».

В примере справа игра на первый взгляд может показаться симметричной из-за похожих стратегий, но это не так - ведь выигрыш второго игрока при профилях стратегий (А, А) и (Б, Б) будет больше, чем у первого.

С нулевой суммой и с ненулевой суммой.

Игры с нулевой суммой - особая разновидность игр с постоянной суммой , то есть таких, где игроки не могут увеличить или уменьшить имеющиеся ресурсы, или фонд игры. В этом случае сумма всех выигрышей равна сумме всех проигрышей при любом ходе. Посмотрите направо - числа означают платежи игрокам - и их сумма в каждой клетке равна нулю. Примерами таких игр может служить покер, где один выигрывает все ставки других; реверси, где захватываются фишки противника; либо банальное воровство .

Многие изучаемые математиками игры, в том числе уже упоминавшаяся «Дилемма заключённого», иного рода: в играх с ненулевой суммой выигрыш какого-то игрока не обязательно означает проигрыш другого, и наоборот. Исход такой игры может быть меньше или больше нуля. Такие игры могут быть преобразованы к нулевой сумме - это делается введением фиктивного игрока , который «присваивает себе» излишек или восполняет недостаток средств.

Ещё игрой с отличной от нуля суммой является торговля , где каждый участник извлекает выгоду. Широко известным примером, где она уменьшается, является война .

Параллельные и последовательные.

В параллельных играх игроки ходят одновременно, или, по крайней мере, они не осведомлены о выборе других до тех пор, пока все не сделают свой ход. В последовательных, или динамических , играх участники могут делать ходы в заранее установленном либо случайном порядке, но при этом они получают некоторую информацию о предшествующих действиях других. Эта информация может быть даже не совсем полной , например, игрок может узнать, что его противник из десяти своих стратегий точно не выбрал пятую, ничего не узнав о других.

Различия в представлении параллельных и последовательных игр рассматривались выше. Первые обычно представляют в нормальной форме, а вторые - в экстенсивной.

С полной или неполной информацией.

Важное подмножество последовательных игр составляют игры с полной информацией. В такой игре участники знают все ходы, сделанные до текущего момента, равно как и возможные стратегии противников, что позволяет им в некоторой степени предсказать последующее развитие игры. Полная информация не доступна в параллельных играх, так как в них неизвестны текущие ходы противников. Большинство изучаемых в математике игр - с неполной информацией. Например, вся «соль» Дилеммы заключённого или Сравнения монеток заключается в их неполноте.

В то же время есть интересные примеры игр с полной информацией: «Ультиматум», «Многоножка ». Сюда же относятся шахматы, шашки, го, манкала и другие.

Часто понятие полной информации путают с похожим - совершенной информации . Для последнего достаточно лишь знание всех доступных противникам стратегий, знание всех их ходов необязательно.

Игры с бесконечным числом шагов.

Игры в реальном мире или изучаемые в экономике игры, как правило, длятся конечное число ходов. Математика не так ограничена, и в частности, в теории множеств рассматриваются игры, способные продолжаться бесконечно долго. Причём победитель и его выигрыш не определены до окончания всех ходов.

Задача, которая обычно ставится в этом случае, состоит не в поиске оптимального решения, а в поиске хотя бы выигрышной стратегии . Используя аксиому выбора, можно доказать, что иногда даже для игр с полной информацией и двумя исходами - «выиграл» или «проиграл» - ни один из игроков не имеет такой стратегии. Существование выигрышных стратегий для некоторых особенным образом сконструированных игр имеет важную роль в дескриптивной теории множеств .

Дискретные и непрерывные игры.

Большинство изучаемых игр дискретны : в них конечное число игроков, ходов, событий, исходов и т. п. Однако эти составляющие могут быть расширены на множество вещественных чисел. Игры, включающие такие элементы, часто называются дифференциальными. Они связаны с какой-то вещественной шкалой (обычно - шкалой времени), хотя происходящие в них события могут быть дискретными по природе. Дифференциальные игры также рассматриваются в теории оптимизации, находят своё применение в технике и технологиях, физике.

Метаигры.

Это игры, результатом которых является набор правил для другой игры (называемой целевой или игрой-объектом ). Цель метаигр - увеличить полезность выдаваемого набора правил. Теория метаигр связана с теорией оптимальных механизмов .

по материалам wikipedia.org

В результате изучения данной главы студент должен:

знать

Концепции игр, основанные на принципе доминирования, равновесие по Нэшу, что такое обратная индукция и т. д.; концептуальные подходы решения игры, значение понятия рациональности и равновесия в рамках стратегии взаимодействия;

уметь

Различать игры в стратегической и развернутой формах, строить "дерево игры"; формулировать игровые модели конкуренции для различных типов рынков;

владеть

Методами определения исходов игры.

Игры: основные понятия и принципы

Первую попытку создать математическую теорию игр предпринял в 1921 г. Э. Борель. Как самостоятельная область науки впервые теория игр была систематизированно изложена в монографии Дж. фон Неймана и О. Моргенштерна "Теория игр и экономическое поведение" в 1944 г. C тех пор многие разделы экономической теории (например, теория несовершенной конкуренции, теория экономического стимулирования и др.) развивались в тесном контакте с теорией игр . Теория игр с успехом применяется и в социальных науках (например, анализ процедур голосования, поиск равновесных концепций, определяющих кооперативные и некооперативные поведения лиц). Как правило, избиратели отводят кандидатов, представляющих крайние точки зрения, но при избрании одного из двух кандидатов, предлагающих различные компромиссные решения, возникает борьба. Даже идея Руссо об эволюции от "естественной свободы" к "гражданской свободе" формально соответствует с позиций теории игр точке зрения на кооперацию.

Игра – это идеализированная математическая модель коллективного поведения нескольких лиц (игроков), интересы которых различны, что и порождает конфликт. Конфликт необязательно предполагает наличие антагонистических противоречий сторон, но всегда связан с определенного рода разногласиями. Конфликтная ситуация будет антагонистической, если увеличение выигрыша одной из сторон на некоторую величину приводит к уменьшению выигрыша другой стороны на такую же величину и наоборот. Антагонизм интересов порождает конфликт, а совпадение интересов сводит игру к координации действий (кооперации).

Примерами конфликтной ситуации являются ситуации, складывающиеся во взаимоотношениях покупателя и продавца; в условиях конкуренции различных фирм; в ходе боевых действий и др. Примерами игр являются и обычные игры: шахматы, шашки, карточные, салонные и др. (отсюда и название "теория игр", и ее терминология).

В большинстве игр, возникающих из анализа финансово- экономических, управленческих ситуаций, интересы игроков (сторон) не являются строго антагонистическими ни абсолютно совпадающими. Покупатель и продавец согласны, что в их общих интересах договориться о купле-продаже, однако они энергично торгуются при выборе конкретной цены в пределах взаимной выгодности.

Теория игр – это математическая теория конфликтных ситуаций.

От реального конфликта игра отличается тем, что ведется по определенным правилам. Эти правила устанавливают последовательность ходов, объем информации каждой стороны о поведении другой и результат игры в зависимости от сложившейся ситуации. Правилами устанавливаются также конец игры, когда некоторая последовательность ходов уже сделана, и больше ходов делать не разрешается.

Теория игр, как и всякая математическая модель, имеет свои ограничения. Одним из них является предположение о полной (идеальной) разумности противников. В реальном конфликте зачастую оптимальная стратегия состоит в том, чтобы угадать, в чем противник глуп, и воспользоваться этой глупостью в свою пользу .

Еще одним недостатком теории игр является то, что каждому из игроков должны быть известны все возможные действия (стратегии) противника, неизвестно лишь то, каким именно из них он воспользуется в данной партии. В реальном конфликте это обычно не так: перечень всех возможных стратегий противника как раз и неизвестен, а наилучшим решением в конфликтной ситуации нередко будет именно выход за пределы известных противнику стратегий, "ошарашивание" его чем-то совершенно новым, непредвиденным.

Теория игр не включает элементов риска, неизбежно сопровождающего разумные решения в реальных конфликтах. Она определяет наиболее осторожное, перестраховочное поведение участников конфликта.

Кроме того, в теории игр находятся оптимальные стратегии по одному показателю (критерию). В практических ситуациях часто приходится принимать во внимание не один, а несколько числовых критериев. Стратегия, оптимальная по одному показателю, может быть неоптимальной по другим.

Сознавая эти ограничения и потому не придерживаясь слепо рекомендаций даваемых теорий игр, можно все же выработать вполне приемлемую стратегию для многих реальных конфликтных ситуаций.

В настоящее время ведутся научные исследования, направленные на расширение областей применения теории игр.

В литературе встречаются следующие определения элементов, составляющих игру.

Игроки – это субъекты, вовлеченные во взаимодействие, представимое в форме игры. В нашем случае это домохозяйства, фирмы, правительство. Однако в случае неопределенности внешних обстоятельств достаточно удобно представлять случайные составляющие игры, не зависящие от поведения игроков, как действия "природы".

Правила игры. Под правилами игры подразумеваются наборы действий или ходов, доступные игрокам. При этом действия могут быть самые разнообразные: решения покупателей об объемах покупаемых товаров или услуг; фирмы – об объемах выпуска продукции; уровень налогов, назначаемый правительством.

Определение исхода (результата) игры. Для каждой комбинации действий игроков исход игры устанавливается почти механически. Результатом может быть: состав потребительской корзины, вектор выпусков фирмы или набор других количественных показателей.

Выигрыши. Смысл, вкладываемый в понятие выигрыша, может различаться для разных видов игр. При этом надо четко различать выигрыши, измеренные на порядковой шкале (например, уровень полезности), и величины, для которых имеет смысл и интервальное сравнение (например, прибыль, уровень благосостояния).

Информация и ожидания. Неопределенность и постоянное изменение информации могут чрезвычайно серьезно влиять на возможные исходы взаимодействия. Именно поэтому необходимо учесть роль информации в развитии игры. В связи с этим на первый план выходит понятие информационного множества игрока, т.е. совокупности всех сведений о состоянии игры, которыми он обладает в ключевые моменты времени.

При рассмотрении доступа игроков к информации очень полезна интуитивно понятная идея общего знания, или общеизвестности, означающая следующее: какой-либо факт является общеизвестным, если все игроки осведомлены о нем и все игроки знают, что другие игроки также знают об этом.

Для случаев, в которых применения концепции общеизвестности недостаточно, вводится понятие индивидуальных ожиданий участников – представлений о том, как обстоит игровая ситуации на данном этапе.

В теории игр предполагается, что игра состоит из ходов, выполняемых игроками одновременно или последовательно.

Ходы бывают личными и случайными. Ход называется личным, если игрок сознательно выбирает его из совокупности возможных вариантов действий и осуществляет его (например, любой ход в шахматной игре). Ход называется случайным, если его выбор производится не игроком, а каким-либо механизмом случайного выбора (например, по результатам бросания монеты).

Совокупность ходов, предпринятых игроками от начала до окончания игры, называется партией.

Одним из основных понятий теории игр является понятие стратегии. Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от ситуации, сложившейся в процессе игры. В простых (одноходовых) играх, когда в каждой партии игрок может сделать лишь по одному ходу, понятие стратегии и возможного варианта действий совпадают. В этом случае совокупность стратегий игрока охватывает все возможные его действия, а любое возможное для игрока i действие является его стратегией. В сложных (многоходовых играх) понятия "вариант возможных действий" и "стратегия" могут отличаться друг от друга.

Стратегия игрока называется оптимальной, если она обеспечивает данному игроку при многократном повторении игры максимально возможный средний выигрыш или минимально возможный средний проигрыш, независимо от того, какие стратегии применяет противник. Могут быть использованы и другие критерии оптимальности.

Возможно, что стратегия, обеспечивающая максимальный выигрыш, не обладает другим важным представлением оптимальности, как устойчивостью (равновесностью) решения. Решение игры является устойчивым (равновесным), если соответствующие этому решению стратегии образуют ситуацию, которую ни один из игроков не заинтересован изменить.

Повторим, что задача теории игр – нахождение оптимальных стратегий.

Классификация игр представлена на рис. 8.1.

1. В зависимости от видов ходов игры подразделяются на стратегические и азартные. Азартные игры состоят только из случайных ходов, которыми теория игр не занимается. Если наряду со случайными ходами есть личные ходы или все ходы личные, то такие игры называются стратегическими.
2. В зависимости от числа игроков игры подразделяются на парные и множественные. В парной игре число участников равно двум, в множественной – более двух.
3. Участники множественной игры могут образовывать коалиции, как постоянные, так и временные. По характеру взаимоотношений игроков игры делятся на бескоалиционные, коалиционные и кооперативные.

Бескоалиционными называются игры, в которых игроки не имеют право вступать в соглашения, образовывать коалиции, и целью каждого игрока является получение по возможности наибольшего индивидуального выигрыша.

Игры, в которых действия игроков направлены на максимизацию выигрышей коллективов (коалиций) без последующего их разделения между игроками, называются коалиционными.

Рис. 8.1.

Исходом кооперативной игры является дележ выигрыша коалиции, который возникает не как следствие тех или иных действий игроков, а как результат их наперед определенных соглашений.

В соответствии с этим в кооперативных играх сравниваются по предпочтительности не ситуации, как это имеет место в бескоалиционных играх, а дележи; и сравнение это не ограничивается рассмотрением индивидуальных выигрышей, а носит более сложный характер.

4. По количеству стратегий каждого игрока игры подразделяются на конечные (число стратегий каждого игрока конечно) и бесконечные (множество стратегий каждого игрока бесконечно).
5. По количеству информации, имеющейся у игроков относительно прошлых ходов, игры подразделяются на игры с полной информацией (имеется вся информация о предыдущих ходах) и неполной информацией. Примерами игр с полной информацией могут быть шахматы, шашки и т.п.
6. По виду описания игры подразделяются на позиционные игры (или игры в развернутой форме) и игры в нормальной форме. Позиционные игры задаются в виде дерева игры. Но любая позиционная игра может быть сведена к нормальной форме, в которой каждый из игроков делает только по одному независимому ходу. В позиционных играх ходы делаются в дискретные моменты времени. Существуют дифференциальные игры, в которых ходы делаются непрерывно. Эти игры изучают задачи преследования управляемого объекта другим управляемым объектом с учетом динамики их поведения, которая описывается дифференциальными уравнениями.

Существуют также рефлексивные игры, которые рассматривают ситуации с учетом мысленного воспроизведения возможного образа действий и поведения противника.

7. Если любая возможная партия некоторой игры имеет нулевую сумму выигрышей всех N игроков (), то говорят об игре с нулевой суммой. В противном случае игры называются играми с ненулевой суммой.

Очевидно, что парная игра с нулевой суммой является антагонистической, так как выигрыш одного игрока равен проигрышу второго, а следовательно, цели этих игроков прямо противоположны.

Конечная парная игра с нулевой суммой называется матричной игрой. Такая игра описывается платежной матрицей, в которой задаются выигрыши первого игрока. Номер строки матрицы соответствует номеру применяемой стратегии первого игрока, столбец – номеру применяемой стратегии второго игрока; на пересечении строки и столбца находится соответствующий выигрыш первого игрока (проигрыш второго игрока).

Конечная парная игра с ненулевой суммой называется биматричной игрой. Такая игра описывается двумя платежными матрицами, каждая для соответствующего игрока.

Приведем следующий пример. Игра "Зачет". Пусть игрок 1 – студент, готовящийся к зачету, а игрок 2 – преподаватель, принимающий зачет. Будем считать, что у студента две стратегии: A1 – хорошо подготовиться к зачету; A 2 – не подготовиться. У преподавателя имеется тоже две стратегии: B1 – поставить зачет; B 2 – не поставить зачет. В основу оценки значений выигрышей игроков можно положить, например, следующие соображения, отраженные в матрицах выигрышей:

Данная игра в соответствии с приведенной выше классификацией является стратегической, парной, бескоалиционной, конечной, описана в нормальной форме, с ненулевой суммой. Более кратко данную игру можно назвать биматричной.

Задача состоит в определении оптимальных стратегий для студента и для преподавателя.

Еще один пример хорошо известной биматричной игры "Дилемма заключенного".

Каждый из двух игроков располагает двумя стратегиями: A 2 и B 2 – стратегии агрессивного поведения, a A i и B i – миролюбивое поведение. Предположим, что "мир" (оба игрока миролюбивы) лучше для обоих игроков, чем "война". Случай, когда один игрок агрессивный, а другой миролюбивый, выгоднее агрессору. Пусть матрицы выигрышей игроков 1 и 2 в данной биматричной игре имеют вид

Для обоих игроков агрессивные стратегии A2 и B2 доминируют мирные стратегии Ах и B v Таким образом, единственное равновесие в доминирующих стратегиях имеет вид (А2, B 2), т.е. постулируется, что результатом некооперативного поведения является война. В то же время исход (A1, B1) (мир) дает больший выигрыш для обоих игроков. Таким образом, некооперативное эгоистическое поведение вступает в противоречие с коллективными интересами. Коллективные интересы диктуют выбор мирных стратегий. В то же время, если игроки не обмениваются информацией, война является наиболее вероятным исходом.

В данном случае ситуация (A1, B1) является оптимальной по Парето. Однако эта ситуация неустойчива, что ведет к возможности нарушения игроками установленного соглашения. Действительно, если первый игрок нарушит соглашение, а второй не нарушит, то выигрыш первого игрока увеличится до трех, а второго упадет до нуля и, наоборот. Причем каждый игрок, не нарушающий соглашение, теряет больше при нарушении соглашения вторым игроком, нежели в том случае, когда они оба нарушают соглашение.

Существует две основные формы игры. Игра в экстенсивной форме представляется как диаграмма типа "дерево" принятия решений, при этом "корень" соответствует точке начала игры, а начало каждой новой "ветки", называемое узлом, – состоянию, достигнутому на данном этапе при данных действиях, уже предпринятых игроками. Каждому конечному узлу – каждой точке окончания игры – ставится в соответствие вектор выигрышей, по одной компоненте для каждого игрока.

Стратегическая, иначе называемая нормальной, форма представления игры соответствует многомерной матрице, при этом каждое измерение (в двумерном случае строки и столбцы) включает набор возможных действий для одного агента.

Отдельная ячейка матрицы содержит вектор выигрышей, соответствующих данному сочетанию стратегий игроков.

На рис. 8.2 представлена экстенсивная форма игры, а в табл. 8.1 – стратегическая форма.

Рис. 8.2.

Таблица 8.1. Игра с одновременным принятием решений в стратегической форме

Существует достаточно подробная классификация составных частей теории игр. Одним из самых общих критериев такой классификации является деление теории игр на теорию некооперативных игр, в которых субъектами принятия решений являются собственно индивиды, и теорию кооперативных игр, в которых субъектами принятия решений являются группы, или коалиции индивидов.

Некооперативные игры обычно представляются в нормальной (стратегической) и развернутой (экстенсивной) формах.

Воробьев Η. Н. Теория игр для экоиомистов-кибериетиков. М.: Наука, 1985.
Вентцель Е. С. Исследование операций. М.: Наука, 1980.

экспериментальной экономики

И других методов анализа

Как и любая другая не полностью конвенциальная наука, институциональная экономика применяет разные методы анализа. К ним относятся традиционный микроэкономический инструментарий, эконометрические методы, анализ статистической информации и др. В данном разделе кратко рассмотрим применение теории игр, экспериментальной экономики и других методов, адаптированных к институциональному анализу.

Теория игр . Теория игр – аналитический метод, получивший развитие после второй мировой войны и используемый для анализа ситуаций, в которых индивидуумы стратегически взаимодействуют. Шахматы – это прототип стратегической игры, так как результат зависит от поведения противника, так же как и от поведения собственно игрока. Из-за аналогий, найденных между стратегическими играми и формами политического и экономического взаимодействия, теории игр уделяется повышенное внимание в общественных науках. Современная теория игр начинается с работы Д. Неймана и О. Моргенштерна «Теория игр и экономическое поведение» (1944, русский вариант – 1970). Теория исследует взаимодействие индивидуальных решений при некоторых допущениях, касающихся принятия решения в условиях риска, общего состояния окружающей среды, кооперативного или некооперативного поведения других индивидов. Очевидно, что рациональному индивиду приходится принимать решения в условиях неопределенности и взаимодействия. Если выигрыш одного индивида является проигрышем другого, то это игра с нулевой суммой. Когда каждый из индивидов может выиграть от решения одного из них, то имеет место игра с ненулевой суммой. Игра может быть кооперативной, когда возможен сговор, и некооперативной, когда преобладает антагонизм. Одним из известных примеров игры с ненулевой суммой является дилемма заключенного (ДЗ). Этот пример показывает, что, вопреки утверждениям либерализма, преследование индивидом собственного интереса ведет к решению менее удовлетворительному, чем возможные альтернативы.

Предельная теорема Ф.И. Эджуорта рассматривается как ранний пример кооперативной игры n участников. Теорема утверждает, что по мере увеличения числа участников в экономике чистого обмена сговор становится менее полезным, а множество возможных равновесных относительных цен (ядро) уменьшается. Если число участников стремится к бесконечности, то остается только одна система относительных цен, соответствующая ценам общего равновесия.

Понятие оптимального (равновесного) по Нэшу решения является одним из ключевых в теории игр. Оно было введено в 1951 г. американским экономистом-математиком Джоном Ф. Нэшем.

В данном контексте достаточно рассмотреть это понятие применительно к теоретико-игровой модели двух лиц 25 . В этой модели каждый из участников располагает некоторым непустым множеством стратегий S i , i = 1, 2. При этом выбор конкретных стратегий из числа доступных игроку осуществляется таким образом, чтобы максимизировать значение собственной функции выигрыша (полезности) u i , i = 1, 2. Значения функции выигрыша заданы на множестве упорядоченных пар стратегий игроков S 1 ´ S 2 , элементами которого выступают всевозможные сочетания стратегий игроков (s 1 , s 2) (упорядоченность пар стратегий заключается в том, что в каждом из сочетаний на первом месте стоит стратегия первого игрока, на втором – второго), т.е. u i = u i (s 1 , s 2), i = 1, 2. Иными словами, выигрыш каждого игрока зависит не только от выбираемой им самим стратегии, но и от стратегии, принятой его противником.

Оптимальным по Нэшу решением признается пара стратегий (s 1 *, s 2 *), s i *Î S i , i = 1, 2, обладающая следующим свойством: стратегия s 1 * обеспечивает игроку 1 максимальный выигрыш, когда игрок 2 выбирает стратегию s 2 *, и симметрично s 2 * доставляет максимальное значение функции выигрыша игрока 2 , когда игроком 1 принимается стратегия s 1 *. Пара стратегий приводит к равновесию по Нэшу, если выбор, сделанный игроком 1 , оптимален при данном выборе игрока 2 , а выбор, сделанный игроком 2, оптимален при данном выборе игрока 1 . Понятие оптимальности по Нэшу очевидным образом обобщается на случай игры n лиц. Следует заметить, что существование равновесия по Нэшу не означает его Парето-оптимальности, а Парето-оптимальный набор стратегий не обязательно должен удовлетворять равновесию по Нэшу. В 1994 г. Дж. Ф. Нэшу, Р. Зельтену и Дж. Ч. Харшани была присуждена Премия памяти А. Нобеля по экономике за их вклад в разработку теории игр и ее приложение к экономике.

Обращение к этому методу опирается на его явную силу в освещении причин и последствий институционального изменения. Способность теории игр помочь анализировать последствия изменения правил бесспорна; ее сила в раскрытии причин неоднозначна. Любой теоретико-игровой анализ должен предполагать предшествующее определение основных правил игры. Так, О. Моргенштерн в 1968 г. писал: «Игры описаны путем определения возможного поведения в пределах правил игры. Правила являются в каждом случае однозначными; например, в шахматах определенные ходы разрешены для специфических фигур, но запрещены для других. Правила также ненарушаемы. Когда социальная ситуация рассматривается как игра, правила даны физической и юридической окружающей средой, в пределах которой имеют место действия индивидуумов» 26 .

Если эта точка зрения принимается, нельзя ожидать, что теория игр объяснит причину изменения в фундаментальных правилах организации экономической, политической и социальной жизни: определение таких правил, очевидно, является предварительным условием для проведения такого анализа.

Для понимания значения институтов используются модели координационной игры и дилеммы заключенных.

Рассмотримпроблему чистой и обобщенной координации . Чистая координационная игра показывает, что экономические агенты не могут гарантированно реализовать взаимные выгоды кооперации, даже если отсутствует конфликт интересов. Другими словами, в ситуации «чистой» координации имеется множественное равновесие, которое одинаково предпочитается каждой стороной. В этом случае нет конфликта интересов, но нет гарантии, что все будут стремиться к одному равновесному результату. Известный пример – выбор стороны дороги (правой или левой), по которой люди должны ездить (рис. 2.1). Данная игра имеет два равновесия по Нэшу, соответствующих наборам стратегий (левая, левая) и (правая, правая). Никто заранее не возражает ездить справа или слева, но достижение скоординированного результата при большом количестве участников переговоров потребует высоких трансакционных издержек. Необходим институт, который бы выполнил функцию фокальной точки, т.е. ввел согласованное решение. Таким институтом может быть результат общего знания, полученного на основе однотипного анализа ситуации, а может быть и государство, которое вмешивается, чтобы ввести правило координации и сократить трансакционные издержки. В целом институты выполняют координационную функцию, снижая неопределенность.

Обобщенная проблема координации существует, если матрица выигрышей такова, что в любой точке равновесия никто из игроков не имеет стимула изменить свое поведение при данном поведении других игроков, но и никто из игроков не желает, чтобы какой-либо другой игрок изменил его. В этом случае каждый предпочел бы скоординированный результат не скоординированному, но, возможно, каждый захочет предпочесть особый скоординированный результат (рис. 2.2). Например, два производителяА и Б используют различную технологию X и Y , но хотят ввести национальный стандарт изделия, который вызовет сетевые внешние эффекты. Производитель А больше выиграет, если стандартом станет технология Х , а производитель Б – технология Y . Выигрыш оказывается распределенным асимметрично. Итак, производитель А (Б ) предпочтет, чтобы стандартом стала X (Y )-технология, но оба предпочтут любой из скоординированных результатов не скоординированному. Трансакционные издержки в этой модели будут выше, чем в предыдущей (особенно при участии большого количества сторон), так как налицо столкновение интересов. Замена частных попыток координации государственным вмешательством позволила бы уменьшить трансакционные издержки в экономике. Примерами являются государственное введение технологических стандартов, стандартов измерения и качества и т.д. Обобщенная координационная модель иллюстрирует важность не только координационной функции институтов, но и распределительной, от которой зависит способ, ограничивающий возможные альтернативы игроков, и в конечном счете результативность взаимодействия.

Дилемма заключенного часто приводится как пример проблемы установления кооперации между индивидами. В игре участвуют два игрока, два заключенных, которые разделены своими надзирателями. У каждого есть два выбора: кооперироваться, т.е. хранить молчание, или отказаться от кооперации, т.е. предать другого. Каждый должен действовать, не зная, что предпримет другой. Каждому говорят, что признание, если другой молчит, ведет к свободе. Отказ от признания в случае предательства другого означает смерть. Если оба признаются, то проведут вместе несколько лет в тюрьме. Если каждый из них откажется от признания, то будет на короткое время арестован и затем освобожден. Предполагая, что тюрьма предпочтительнее смерти, а свобода – наиболее желаемое состояние, заключенные сталкиваются с парадоксом: хотя они оба предпочли бы не предавать друг друга и провести недолгое время в тюрьме, каждый окажется в лучшем положении, предав другого, не считаясь с тем, что предпримет другой. Аналитически способность заключенных установить связь находится на заднем плане, так как стимулы к предательству остаются одинаково сильными при наличии или без наличия связи. Предательство остается доминирующей стратегией.

Этот анализ помогает объяснить, почему эгоистично-максимизирующие агенты не могут рационально приходить к кооперативному результату или поддерживать его (парадокс индивидуальной рациональности). Он полезен в объяснении ex post распада картеля или другого кооперативного соглашения, но не объясняет, каким способом сформирован картель или кооперативное соглашение. Если заключенные способны достичь соглашения, то проблема исчезает: они договариваются не предавать друг друга и прийти к тому, чтобы максимизировать совместные выигрыши. Итак, достаточно вступить в соглашение, которое совместно желательно, но делает каждого в отдельности потенциально более уязвимым к ущербу, чем в отсутствие такого соглашения. Этот анализ обращает внимание на институты, которые с индивидуальной точки зрения могут превратить такие соглашения в менее рискованные.

В теоретической литературе дается различие между анализом кооперативных и некооперативных игр. Как уже описано, игроки способны заключать связывающие их соглашения. Гарант таких соглашений – неявный. Многие теоретики игр настаивают на том, что обман и разрыв соглашений – общие черты человеческих взаимоотношений, поэтому такое поведение должно оставаться внутри стратегического пространства. Они пытаются объяснить возникновение и сохранение кооперации в модели некооперативных игр, особенно в модели бесконечно повторяющейся последовательности игр ДЗ. Конечная последовательность игр не даст результата, потому что с момента, когда доминирующая стратегия в последней игре станет явно отступнической, и с момента, когда она станет ожидаемой, то же самое будет верно для предпоследней игры и так далее, до первой игры. В бесконечных сериях игр при определенных предположениях о дисконтировании выигрышей может появиться кооперация как равновесная стратегия. Таким образом, некооперативный анализ не избегает потребности принять основные правила игры как часть описания стратегического пространства. Он просто предполагает отличный и менее ограничительный набор правил. В отличие от кооперативного анализа соглашения могут быть разорваны по желанию. С другой стороны, выход из непрерывной игры ограничен. Ни один подход не избегает потребности определять правила игры, перед тем как начать анализ.

Одним из наиболее интересных недавних достижений в исследовании ДЗ была организация турниров между предопределенными стратегиями для проведения конечно повторяющихся игр ДЗ с двумя участниками. Первый из них был организован Робертом Аксельродом (описан в 1984 г.) и включал игру последовательностью в 200 партий. Опытными в ДЗ участниками были предложены компьютерные программы, и которые затем состязались друг с другом.

Р. Аксельрод сообщил игрокам, что стратегии будут оценены не по числу побед, а согласно сумме очков против всех других стратегий, причем три очка каждый получает за взаимную кооперацию, одно очко за взаимное отступничество и выигрыш 5 к 0 за отступничество/кооперацию. Как отмечено ранее, аналитически ясно, что отступничество – доминирующая стратегия последней игры и, следовательно, каждой предыдущей игры.

Рассмотрим матрицу выигрышей в ДЗ, анализируемую Р. Аксельродом 27 (рис. 2.3). Независимо от того, что делает другой игрок, предательство дает более высокое вознаграждение, чем кооперация. Если первый игрок думает, что другой игрок будет молчать, то ему выгоднее предать ($5>$3). С другой стороны, если первый игрок думает, что другой предаст, ему все равно выгоднее предать самому ($1 лучше, чем ничего). Следовательно, искушение склоняет к предательству. Но если оба предают, то оба получают меньше, чем в ситуации кооперации ($1+$1<$3+$3).

		Второй игрок
			Кооперируется
Первый игрок
Первый игрок	Кооперируется

Рис. 2.3 . Матрица выигрышей в дилемме заключенного

Дилемма заключенного – знаменитая проблема в экономике – показывает: то, что рационально или оптимально для одного агента, может не быть рациональным или оптимальным для группы индивидов, рассматриваемых совместно. Эгоистичное поведение индивида может быть вредным или разрушительным для группы. В повторяющихся играх ДЗ соответствующая стратегия неочевидна. Чтобы найти хорошую стратегию, и были организованы турниры. Если выигрыш был бы получен строго на основе победа–проигрыш, то каждый участник турнира должен был предложить непрерывное отступничество. Однако правила выигрыша дали понять, что организация некоторой кооперации могла бы привести к более высоким общим результатам. К удивлению многих, победила простая стратегия «зуб за зуб», предложенная А. Рапопортом: игрок кооперируется на первом шаге и затем делает тот ход, который другой игрок делал на предыдущем шаге.

Во втором турнире участвовало гораздо больше игроков, в том числе профессионалов, а также тех, кто знал о результатах первого раунда. Итогом была еще одна победа стратегии копирования («зуб за зуб»).

Анализ результатов турниров выявил четыре свойства, приводящие к успешной стратегии: 1) стремление избежать ненужного конфликта и кооперироваться так долго, как это делает другой; 2) способность к вызову перед лицом ничем не вызванного предательства другого; 3) прощение после ответа на вызов; 4) ясность поведения, чтобы другой игрок мог распознать и адаптироваться к образу действия первого.

Р. Аксельрод показал, что кооперация может начаться, развиваться и стабилизироваться в ситуациях, которые в противном случае являются экстраординарными, не обещая ничего хорошего. Можно согласиться с тем, что стратегия «зуб за зуб» в аналитическом смысле иррациональна в конечно повторяющейся игре, но эмпирически, очевидно, нет. Если бы стратегия «зуб за зуб» состязалась с другими аналитическими стратегиями, все из которых состояли из непрерывных отступничеств, она не смогла бы победить в турнире.

Теория игр может быть важным инструментом для изучения человеческого взаимодействия в ограниченных правилами обстоятельствах. Благодаря своим возможностям изучать последствия разных институциональных соглашений она также может быть полезна с точки зрения государственной политики при проектировании новых институциональных соглашений. Теория игр использовалась в анализе общественных благ, олигополии, картеля и сговоров на рынках товаров и труда. При всех своих достоинствах теория игр обладает и относительными слабостями. Некоторые авторы высказали сомнения относительно применения модели дилеммы заключенного в социальной науке. Например, М. Тейлор в 1987 г. предположил, что такие игры соответствуют обстоятельствам обеспечения общественными благами. В 1985 г. Н. Шофилд утверждал, что агенты должны формировать согласованные понятия об убеждениях и желаниях других агентов, включая проблемы познания и интерпретации, которые не просты для моделирования 28 . Многие экономисты отмечали, что использование теории игр без оговорок может свести экономическую деятельность к слишком статичной схеме. В частности, нобелевский лауреат Р. Стоун в 1948 г. писал: «Главная черта, благодаря которой теория игр впадает в противоречие с живой действительностью, заключается в том, что объект исследования ограничен во времени – игра имеет начало и конец. Об экономической действительности этого не скажешь. Именно в возможности обособить партию от игры и заключается глубокое расхождение теории с реальностью, а это расхождение ограничивает ее применение» 29 . Однако с тех пор неоценимо много сделано для сглаживания этого расхождения и расширения применения теории игр в экономике.

Экспериментальная экономика . Другим методическим подходом, использующимся для проверки постулатов экономической теории и смежных наук, а также объяснения институциональных проблем является экспериментальная экономика . Влияние проектируемых институтов на эффективность размещения ресурсов не всегда можно предсказать ex ante. Один из вариантов экономии на издержках ех post – имитация работы институтов в лабораторных условиях.

Вообще экономический эксперимент – это воспроизведение экономического явления или процесса с целью изучения в наиболее благоприятных условиях и дальнейшего практического изменения. Эксперименты, которые осуществляются в реальных условиях, называются естественными, или полевыми, а эксперименты, проводимые в искусственных условиях, – лабораторными. Последние зачастую требуют использования экономико-математических методов и моделей. Естественные эксперименты могут проводиться на микроуровне (эксперименты Р. Оуэна, Ф. Тейлора, по внедрению хозрасчета на предприятии и т.п.) и на макроуровне (варианты экономической политики, свободные экономические зоны и пр.). Лабораторные эксперименты – это искусственно воспроизведенные экономические ситуации, некие экономические модели, чья среда (условия протекания эксперимента) контролируется исследователем в лаборатории.

Американский экономист Эл. Рот, с конца 70-х гг. работающий в области экспериментальной экономики, отмечает ряд преимуществ лабораторных экспериментов перед «полевыми» 30 . В лабораторных условиях возможен полный контроль экспериментатора над средой и поведением субъектов, в то время как при «полевых» экспериментах можно контролировать лишь ограниченное число факторов среды и почти невозможно – поведение экономических субъектов. Именно благодаря этому лабораторные эксперименты позволяют более точно определять условия, при которых можно ожидать повторения отдельных явлений. Кроме того, естественные эксперименты дорогостоящи, и в случае неудачи затрагивают судьбы многих людей.

Область интересов экспериментальной экономики достаточно обширна: положения теории игр, теории отраслевых рынков, модель рационального выбора, феномен рыночного равновесия, проблемы общественных благ и др.

Для примера остановимся на результатах исследования сравнительной эффективности институтов рынка, которые опубликованы Ч.А. Холтом и представлены А.Е. Шаститко 31 . В исследовании сопоставляются выводы теоретической и экспериментальной моделей рынка, полученные с помощью контролируемых экспериментов. Результаты поведения агентов измеряются с помощью коэффициента исчерпания суммы потенциальных рент покупателя и продавца, что соответствует эффективности обмена. Коэффициент исчерпания – отношение фактически (экспериментально) полученной ренты к максимально возможной величине – изменяется от 0 до 1. Сравнение проводилось по следующим формам рынка: двусторонний аукцион, торговля на основе ценовых заявок одной из сторон, расчетная палата, децентрализованные переговоры о цене, торговля на основе заявок с последующими переговорами. Наиболее интересные результаты экспериментов получены разными группами исследователей по двум первым формам рынка (табл. 2.1).

Теория игр - совокупность математических методов решения конфликтных ситуаций (столкновений интересов). В теории игр игрой называется математическая модель конфликтной ситуации. Предмет особого интереса теории игр - исследование стратегий принятия решений участников игры в условиях неопределённости. Неопределённость связана с тем, что две или более стороны преследуют противоположные цели, а результаты любого действия каждой из сторон зависят от ходов партнёра. При этом каждая из сторон стремится принимать оптимальные решения, которые реализуют поставленные цели в наибольшей степени.

Наиболее последовательно теория игр применяется в экономике, где конфликтные ситуации возникают, например, в отношениях между поставщиком и потребителем, покупателем и продавцом, банком и клиентом. Применение теории игр можно найти и в политике, социологии, биологии, военном искусстве.

Из истории теории игр

История теории игр как самостоятельной дисциплины начинается в 1944 году, когда Джон фон Нейман и Оскар Моргенштерн опубликовали книгу "Теория игр и экономическое поведение" ("Theory of Games and Economic Behavior"). Хотя примеры теории игр встречались и раньше: трактат Вавилонского Талмуда о разделе имущества умершего мужа между его жёнами, карточные игры в 18-м веке, развитие теории шахматной игры в начале 20-го века, доказательство теоремы о минимаксе того же Джона фон Неймана в 1928 году, без которой не было бы никакой теории игр.

В 50-х годах 20-го века Мелвин Дрешер и Мерил Флод из Rand Corporation первыми экспериментально применили дилемму заключённого, Джон Нэш в работах о состоянии равновесия в играх двух лиц развил понятие равновесия Нэша.

Рейнхард Сэлтен в 1965 году опубликовал книгу "Обработка олигополии в теории игр по требованию" ("Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit"), с которой применение теории игр в экономике получило новую движущую силу. Шагом вперёд в эволюции теории игр связан с работой Джона Мейнарда Смита "Эволюционно стабильная стратегия" ("Evolutionary Stable Strategy", 1974). Дилемма заключённого была популяризована в книге Роберта Аксельрода "Эволюция кооперации" ("The Evolution of Cooperation"), опубликованной в 1984 году. В 1994 году именно за вклад в теорию игр Нобелевской премии были удостоены Джон Нэш, Джон Харсаньи и Рейнхард Сэлтен.

Теория игр в жизни и бизнесе

Остановимся подробнее на сути кофликтной ситуации (столкновении интересов) в том смысле, как он понимается в теории игр для дальнейшего моделирования различных ситуаций в жизни и бизнесе. Пусть индивидуум находится в таком положении, которое приводит к одному из нескольких возможных исходов, причём у индивидуума имеются по отношению к этим исходам некоторые личные предпочтения. Но хотя он может до некоторой степени управлять переменными факторами, определяющими исход, он не имеет полной власти над ними. Иногда управление находится в руках нескольких индивидуумов, которые, подобно ему, имеют какие-то предпочтения по отношению к возможным исходам, но в общем случае интересы этих индивидуумов не согласуются. В других случаях конечный исход может зависеть как от случайностей (которые в юридических науках иногда именуются стихийными бедствиями), так и от других индивидуумов. Теория игр систематизирует наблюдения за такими ситуациями и формулировки общих принципов для руководства разумными действиями в таких ситуациях.

В некоторых отношениях название "теория игр" неудачно, так как наводит на мысль, что теория игр рассматривает лишь не имеющие социального значения столкновения, происходящие в салонных играх, но всё же эта теория имеет значительно более широкое значение.

О применении теории игр может дать представление следующая экономическая ситуация. Пусть имеется несколько предпринимателей, каждый из которых стремится получить максимум прибыли, имея при этом лишь ограниченную власть над переменными, определяющими эту прибыль. Предприниматель не имеет власти над переменными, которыми распоряжается другой предприниматель, но которые могут сильно влиять на доход первого. Трактовка этой ситуации как игры может вызвать следующее возражение. В игровой модели предполагается, что каждый предприниматель делает один выбор из области возможных выборов и этими единичными выборами определяются прибыли. Очевидно, что этого почти не может быть в действительности, так как при этом в промышленности не были бы нужны сложные управленческие аппараты. Просто есть ряд решений и модификаций этих решений, которые зависят от выборов, совершённых другими участниками экономической системы (игроками). Но в принципе можно вообразить, что какой-либо администратор предвидит все возможные случайности и подробно описывает действие, которое нужно предпринимать в каждом случае, вместо того чтобы решать каждую задачу по мере её возникновения.

Военный кофликт, по определению, есть столкновение интересов, в котором ни одна из сторон не распоряжается полностью переменными, определяющими исход, который решается рядом битв. Можно просто считать исход выигрышем или проигрышем и приписать им численные значения 1 и 0.

Одна из самых простых конфликтных ситуаций, которая может быть записана и решена в теории игр - дуэль, представляющая собой конфликт двух игроков 1 и 2, имеющих соответственно p и q выстрелов. Для каждого игрока существует функция, указывающая вероятность того, что выстрел игрока i в момент времени t даст попадание, которое окажется смертельным.

В итоге теория игр приходит к такой формулировке некоторого класса столкновений интересов: имеются n игроков, и каждому нужно выбрать одну возможность из стого определённого набора, причём при совершении выбора у игрока нет никаких сведений о выборах других игроков. Область возможных выборов игрока может содержать такие элементы, как "ход тузом пик", "производство танков вместо автомобилей", или в общем смысле, стратегию, определяющую все действия, которые нужно совершить во всех возможных обстоятельствах. Перед каждым игроком стоит задача: какой выбор он должен сделать, чтобы его частное влияние на исход принесло ему как можно больший выигрыш?

Математическая модель в теории игр и формализация задач

Как мы уже отмечали, игра является математической моделью конфликтной ситуации и требует наличия следующих компонент:

заинтересованных сторон;
возможных действий с каждой стороны;
интересов сторон.

Заинтересованные в игре стороны называются игроками , каждый из них может предпринять не менее двух действий (если в распоряжении игрока только одно действие, то он фактически не участвует в игре, так как заранее известно, что он предпримет). Исход игры называется выигрышем .

Реальная конфликтная ситуация не всегда, а игра (в понятии теории игр) - всегда - протекает по определённым правилам , которые точно определяют:

варианты действий игроков;
объём информации каждого игрока о поведении партнёра;
выигрыш, к которому приводит каждая совокупность действий.

Примерами формализованных игр могут служить футбол, карточная игра, шахматы.

Но в экономике модель поведения игроков возникает, например, когда несколько фирм стремятся занять более выгодное место на рынке, несколько лиц пытаются поделить между собой какое-либо благо (ресурсы, финансы) так, чтобы каждому досталось по возможности больше. Игроками в конфликтных ситуациях в экономике, которые можно моделировать в виде игры, являются фирмы, банки, отдельные люди и другие экономические агенты. В свою очередь в условиях войны модель игры используется, например, в выборе более лучшего оружия (из имеющегося или потенциально возможного) для разгрома противника или защиты от нападения.

Для игры характерна неопределённость результата . Причины неопределённости можно распределить по следующим группам:

комбинаторные (как в шахматах);
влияние случайных факторов (как в игре "орёл или решка", кости, карточные игры);
стратегические (игрок не знает, какое действие предпримет противник).

Стратегией игрока называется совокупность правил, определяющих его действия при каждом ходе в зависимости от сложившейся ситуации.

Целью теории игр является определение оптимальной стратегии для каждого игрока. Определить такую стратегию - значит решить игру. Оптимальность стратегии достигается, когда один из игроков должен получить максимальный выигрыш, при том, что второй придерживается своей стратегии. А второй игрок должен иметь минимальный проигрыш, если первый придерживается своей стратегии.

Классификация игр

Классификация по числу игроков (игра двух и более лиц). Игры двух лиц занимают центральное место во всей теории игр. Основным понятием теории игр для игры двух лиц является обобщение весьма существенной идеи равновесия, которая естественно появляется в играх двух лиц. Что же касается игр n лиц, то одна часть теории игр посвящена играм, в которых сотрудничество между игроками запрещено. В другой части теории игр n лиц предполагается, что игроки могут сотрудничать для взаимной пользы (см. далее в этом параграфе о некооперативных и кооперативных играх).
Классификация по числу игроков и их стратегиям (число стратегий не менее двух, может быть бесконечностью).
Классификация по количеству информации относительно прошлых ходов: игры с полной информацией и неполной информацией. Пусть есть игрок 1 - покупатель и игрок 2 - продавец. Если у игрока 1 нет полной информации о действиях игрока 2, то игрок 1 может и не различить две альтернативы, между которыми ему предстоит сделать выбор. Например, выбирая между двумя видами некоторого товара и не зная о том, что по некоторым признакам товар A хуже товара B , игрок 1 может не видеть различия между альтернативами.
Классификация по принципам деления выигрыша : кооперативные, коалиционные с одной стороны и некооперативные, бескоалиционные с другой стороны. В некооперативной игре , или иначе - бескоалиционной игре , игроки выбирают стратегии одновременно, не зная, какую стратегию выберет второй игрок. Коммуникация между игроками невозможна. В кооперативной игре , или иначе - коалиционной игре , игроки могут объединяться в коалиции и предпринимать коллективные действия, чтобы увеличить свои выигрыши.
Конечная игра двух лиц с нулевой суммой или антогонистическая игра – это стратегическая игра с полной информацией, в которой участвуют стороны с противоположными интересами. Анатагонистическими играми являются матричные игры .

Классический пример из теории игр - дилемма заключённого

Двух подозреваемых берут под стражу и изолируют друг от друга. Окружной прокурор убеждён, что они совершили тяжкое преступление, но не имеет достаточных доказательств, чтобы предъявить им обвинение на суде. Он говорит каждому из заключённых, что у него имеется две альтернативы: признаться в преступлении, которое по убеждению полиции он совершил, или не признаваться. Если оба не признаются, то окружной прокурор предъявит им обвинение в каком-либо незначительном преступлении, например, мелкая кража или незаконное владение оружием, и они оба получат небольшое наказание. Если они оба признаются, то будут подлежать судебной ответственности, но он не потребует самого строгого приговора. Если же один признается, а другой нет, то признавшемуся приговор будет смягчён за выдачу сообщника, в то время как упорствующий получит "на полную катушку".

Если эту стратегическую задачу сформулировать в сроках заключения, то она сводится к следующему:

Таким образом, если оба заключённых не признаются, они получат по 1 году каждый. Если оба признаются, то каждый получит по 8 лет. А если один признается, другой не признается, то тот, который признался отделается тремя месяцами заключения, а тот, который не признается, получит 10 лет. Приведённая выше матрица правильно отражает дилемму заключённого: перед каждым стоит вопрос - признаться или не признаться. Игра, которую окружной прокурор предлагает заключённым, представляет собой некооперативную игру или иначе - бескоалиционную игру . Если бы оба заключённых имели возможность сотрудничать (то есть игра была бы кооперативной или иначе коалиционной игрой ), то оба не признались бы и получили по году тюрьмы каждый.

Примеры использования математических средств теории игр

Переходим теперь к рассмотрению решений примеров распространённых классов игр, для которых в теории игр существуют методы исследования и решения.

Пример формализации некооперативной (бескоалиционной) игры двух лиц

В предыдущем параграфе мы уже рассмотрели пример некооперативной (бескоалиционной) игры (дилемма заключённого). Давайте закрепим наши навыки. Для этого подойдёт также классический сюжет, навеянный "Приключениями Шерлока Холмса" Артура Конан Дойля. Можно, конечно, возразить: пример не из жизни, а из литературы, но ведь Конан Дойль не зарекомендовал себя как писатель-фантаст! Классический ещё и потому, что задание выполнено Оскаром Моргенштерном, как мы уже установили - одним из основателей теории игр.

Пример 1. Будет приведено сокращённое изложение фрагмента одного из "Приключений Шерлока Холмса". Согласно известным понятиям теории игр составить модель конфликтной ситуации и формально записать игру.

Шерлок Холмс намерен отправиться из Лондона в Дувр с дальнейшей целю попасть на континент (европейский), чтобы спастись от профессора Мориарти, который преследует его. Сев в поезд, он увидел на вокзальной платформе профессора Мориарти. Шерлок Холмс допускает, что Мориарти может выбрать особый поезд и обогнать его. У Шерлока Холмса две альтернативы: продолжать поездку до Дувра или сойти на станции Кентерберри, являющейся единственной промежуточной станцией на его маршруте. Мы принимаем, что его противник достаточно разумен, чтобы определить возможности Холмса, поэтому перед ним те же две альтернативы. Оба противника должны выбрать станцию, чтобы сойти на ней с поезда, не зная, какое решение примет каждый из них. Если в результате принятия решения оба окажутся на одной и той же станции, то можно однозначно считать, что Шерлок Холмс будет убит профессором Мориарти. Если же Шерлок Холмс благополучно доберётся до Дувра, то он будет спасён.

Решение. Героев Конан Дойля можем рассматривать как участников игры, то есть игроков. В распоряжении каждого игрока i (i =1,2) две чистые стратегии:

сойти в Дувре (стратегия s i1 (i =1,2) );
сойти на промежуточной станции (стратегия s i2 (i =1,2) )

В зависимости от того, какую из двух стратегий выберет каждый из двух игроков, будет создана особая комбинация стратегий как пара s = (s 1 , s 2 ) .

Каждой комбинации можно поставить в соответствие событие - исход попытки убийства Шерлока Холмса профессором Мориарти. Составляем матрицу данной игры с возможными событиями.

Под каждым из событий указан индекс, означающий приобретение профессора Мориарти, и рассчитываемый в зависимости от спасения Холмса. Оба героя выбирают стратегию одновременно, не зная, что выберет противник. Таким образом, игра является некооперативной, поскольку, во-первых, игроки находятся в разных поездах, а во-вторых, имеют противоположные интересы.

Пример формализации и решения кооперативной (коалиционной) игры n лиц

В этом пункте практическая часть, то есть ход решения примера задачи, будет предварена теоретической частью, в которой будем знакомиться с понятиями теории игр для решения кооперативных (бескоалиционных) игр. Для этой задачи теория игр предлагает:

характеристическую функцию (если говорить упрощённо, она отражает величину выгоды объединения игроков в коалицию);
понятие аддитивности (свойства величин, состоящее в том, что значение величины, соответствующее целому объекту, равно сумме значений величин, соответствующих его частям, в некотором классе разбиений объекта на части) и супераддитивности (значение величины, соответствующее целому объекту, больше суммы значений величин, соответствующих его частям) характеристической функции.

Супераддитивность характеристической функции говорит о том, что объединение в коалиции выгодна игрокам, так как в этом случае величина выигрыша коалиции увеличивается с увеличением числа игроков.

Для формализации игры нам нужно ввести формальные обозначения вышеназванных понятий.

Для игры n обозначим множество всех её игроков как N = {1,2,...,n} Любое непустое подмножество множества N обозначим как Т (включая само N и все подмножества, состоящие из одного элемента). На сайте есть занятие "Множества и операции над множествами ", которое при переходе по ссылке открывается в новом окне.

Характеристическая функция обозначается как v и область её определения состоит из возможных подмножеств множества N . v (T ) - значение характеристической функции для того или иного подмножества, например, доход, полученный коалицией, в том числе, возможно, состоящей из одного игрока. Это важно по той причине, что теория игр требует проверить наличие супераддитивности для значений характеристической функции всех непересекающихся коалиций.

Для двух непустых коалиций из подмножеств T 1 и T 2 аддитивность характеристической функции кооперативной (коалиционной) игры записывается так:

А супераддитивность так:

Пример 2. Трое студентов музыкальной школы подрабатывают в разных клубах, свою выручку они получают от посетителей клубов. Установить, выгодно ли им объединять свои силы (если да, то с какими условиями), используя понятия теории игр для решения кооперативных игр n лиц, при следующих исходных данных.

В среднем их выручка за один вечер составляла:

у скрипача 600 единиц;
у гитариста 700 единиц;
у певицы 900 единиц.

Пытаясь увеличить выручку, студенты в течение нескольких месяцев создавали различные группы. Результаты показали, что, объединившись, они могут увеличить свою выручку за вечер следующим образом:

скрипач + гитарист зарабатывали 1500 единиц;
скрипач + певица зарабатывали 1800 единиц;
гитарист + певица зарабатывали 1900 единиц;
скрипач + гитарист + певица зарабатывали 3000 единиц.

Решение. В этом примере число участников игры n = 3 , следовательно, область определения характеристической функции игры состоит из 2³ = 8 возможных подмножеств множества всех игроков. Перечислим все возможные коалиции T :

коалиции из одного элемента, каждая из которых состоит из одного игрока - музыканта: T {1} , T {2} , T {3} ;
коалиции из двух элементов: T {1,2} , T {1,3} , T {2,3} ;
коалиция из трёх элементов: T {1,2,3} .

Каждому из игроков присвоим порядковый номер:

скрипач - 1-й игрок;
гитарист - 2-й игрок;
певица - 3-й игрок.

По данным задачи определим характеристическую функцию игры v :

v(T{1}) = 600 ; v(T{2}) = 700 ; v(T{3}) = 900 ; эти значения характеристической функции определены исходя из выигрышей соответственно первого, второго и третьего игроков, когда они не объединяются в коалиции;

v(T{1,2}) = 1500 ; v(T{1,3}) = 1800 ; v(T{2,3}) = 1900 ; эти значения характеристической функции определены по выручке каждой пары игроков, объединившихся в коалиции;

v(T{1,2,3}) = 3000 ; это значение характеристической функции определено по средней выручке в случае, когда игроки объединялись в тройки.

Таким образом, мы перечислили все возможные коалиции игроков, их получилось восемь, как и должно быть, так как область определения характеристической функции игры состоит именно из восьми возможных подмножеств множества всех игроков. Что и требует теория игр, так как нам нужно проверить наличие супераддитивности для значений характеристической функции всех непересекающихся коалиций.

Как выполняются условия супераддитивности в этом примере? Определим, как игроки образуют непересекающиеся коалиции T 1 и T 2 . Если часть игроков входят в коалицию T 1 , то все остальные игроки входят в коалицию T 2 и по определению эта коалиция образуется как разность всего множества игроков и множества T 1 . Тогда, если T 1 - коалиция из одного игрока, то в коалиции T 2 будут второй и третий игроки, если в коалиции T 1 будут первый и третий игроки, то коалиция T 2 будет состоять только из второго игрока, и так далее.

Для человека, не являющегося экспертом в политике, Брюс Буэно де Мескита из Университета Нью-Йорка делает удивительно точные событий. Ему удалось с точностью до нескольких месяцев предсказать уход со своих постов и Переверза Мушарафа. Он точно назвал приемника Аятоллы Хомейни на посту лидера Ирана за 5 лет до его смерти. На вопрос о том, в чем секрет, он отвечает, что ответа не знает - его знает игра. Под игрой здесь имеется в виду математический метод, который изначально был создан для формирования и анализа стратегий различных игр, а именно - теория игр. В экономике она используется наиболее часто. Хотя изначально она была разроботана для построения и анализа стратегий в играх, использующихся для развлечений.

Теория игры - это численный аппарат, позволяющий рассчитать сценарий, или, точнее, вероятность различных сценариев поведения системы или "игры", контролируемой различными факторами. Эти факторы, в свою очередь, определяются некоторым числом "игроков".

Таким образом, теория игр, в экономике получившая главный толчок к развитию, может применятся в самых разных областях человеческой деятельности. Пока рано говорить о том, чтобы эти программы применялись для разрешения военных конфлмктов, но в будущем это вполне реально.