Найти равновесие нэша. Равновесие по Нэшу

💖 Нравится? Поделись с друзьями ссылкой

На протяжении всей жизни человек вынужден принимать определённые решения по самым разнообразным вопросам, начиная от бытовых споров - кто будет убирать комнаты в доме или как благоустроить свой город, и заканчивая международными переговорами, многомиллионными аукционами и даже военными действиями. И во всех этих ситуациях человек стремится максимизировать свой собственный выигрыш. Но при этом ему всегда приходится выбирать: сотрудничать с другими людьми или думать только о своей выгоде, не заботясь о выгоде других. Классическим примером, который показывает, что в погоне за личной выгодой не всегда можно достичь лучшего результата, выступает «Дилемма заключённого».

Двое заключённых А и Б подозреваются в совершении преступления, за которое им грозит до 10 лет лишения свободы. Но прямых улик пока нет. Поэтому следствие предлагает каждому из заключённых пойти на сделку - признаться в содеянном и свалить инициативу преступления на другого. Если один признается, а другой заключённый будет хранить молчание, то первому уменьшат срок заключения до трёх лет за содействие следствию, а второго посадят на 10 лет.

Если оба пойдут на сделку со следствием и сознаются в содеянном, то каждый получит по 5 лет. Однако, если оба будут молчать, то за отсутствием улик, их выпустят на свободу. Заключённые находятся в разных камерах, чтобы они не могли сговориться друг с другом и согласовать своё поведение на допросе. Ни один из них не знает точно, что сделает другой. Какое решение примет каждый из них? Что произойдёт?

У каждого заключённого есть выбор: молчать или признаться. Это и есть дилемма заключённого: должен ли он оговорить другого или должен попытать удачу и не признаваться, сильно при этом рискуя? В зависимости от выбора заключённых в этой ситуации возможны четыре исхода.

Рассмотрим их:

1. Если оба заключённых дают признательные показания, каждый из них получает по пять лет тюрьмы;

2. Если заключённый А будет хранить молчание, а заключённый Б даст показания против него, то первый сядет на 10 лет, а второй - на три года;

3. И наоборот, если заключённый А признается, а заключённый Б будет хранить молчание, то первый сядет на три года, а второй - на 10 лет;

4. А если оба будут молчать, то за отсутствием улик из выпустят на свободу.

Какой из этих исходов наиболее реален? Чтобы ответить на этот вопрос, нужно знать, как рассуждает каждый из них. Вот как рассуждает заключённый А:

« Допустим, что заключённый Б признается. Если я тоже признаюсь, то получу 5 лет. Если же буду молчать - получу 10 лет. Значит, если заключённый Б признается, мне тоже лучше признаться в содеянном.

Если же заключённый Б будет хранить молчание, как следует поступить мне? Если признаюсь - получу 3 года. А если тоже буду молчать, то выйду на свободу. Это, конечно, идеальный вариант, но я не уверен, что заключённый Б будет молчать, я ему не доверяю. Поэтому мне лучше дать показания.

Значит, что бы ни делал заключённый Б, мне лучше признаться».

Ход рассуждений заключённого Б аналогичный, и он также приходит к выводу, что для него выгоднее признаться, независимо от того, что будет делать заключённый А.

Что же получается? Каждый из заключённых выбрал стратегию, которая, хотя и не приводит к самому лучшему результату (выходу на свободу), но является наилучшей для каждого из них при любом поведении соперника. Так как цель каждого заключённого - минимизировать свой срок заключения, не заботясь о другом заключённом, то признаться и оговорить другого - наиболее выгодная стратегия для каждого из них. Проще говоря, не важно, что сделает другой, каждый выиграет больше, если предаст. Поэтому заключённые выберут стратегию «Признаться» и получат по 5 лет тюрьмы.

Итак, на этом примере мы увидели, что решение, принимаемое одним игроком, влияет на решение другого (и наоборот) и в итоге влияет на конечный исход игры.

Другими примерами игр, в которых участвуют люди с несовпадающими (противоположными) целями, когда результат зависит от решений всех участников, могут послужить игра в покер, шахматы, пенальти в футболе и многие другие игры.

Но, наряду с традиционными играми, между людьми существуют и такие серьёзные отношения как рыночная конкуренция, гонка вооружений, загрязнение окружающей среды, выборы, торговля и др. Например, компании, конкурирующие на рынке, при принятии решений должны оглядываться на действия конкурентов. Или другой показательный пример - гонка вооружений между Советским Союзом и США в 1950-1990-х годах. В течение почти полувека две великие страны тратили много денег на вооружение, не отставая друг от друга. Если бы между ними было доверие, они бы не тратили столько средств на вооружение, а потратили бы их с бо льшей пользой (на образование, здравоохранение, пенсии и т. п.) и обе стороны выиграли бы от этого. Но вместо этого каждая страна, не доверяя другой, продолжала производить оружие и никто от этого не выигрывал.

Все эти серьёзные отношения тоже называют играми, поскольку в них, как и в обычных играх, результат зависит от решений (стратегий) всех участников. А наука, которая изучает эти серьёзные отношения, называется теорией игр. Поэтому слово «игра» в данном случае не должно вводить вас в смятение. Это понятие в теории игр трактуется шире, чем в повседневной жизни.

Равновесие Нэша

Итак, в «Дилемме заключённого» ситуация складывается таким образом, что, поступая по отдельности рационально и разумно, в итоге заключённые получают по пять лет тюрьмы. Однако, как мы уже отметили, это не самый оптимальный исход. Есть вариант и получше: выйти на свободу, если оба будут молчать.

Наверняка каждый из заключённых, когда принимал решение, рассуждал так: «Если мы оба будем молчать, то выйдем на свободу. Конечно, это лучше, чем сесть на пять лет. Но где гарантия, что второй тоже будет молчать? Ведь если я буду молчать, а другой даст показания, то я сяду на целых 10 лет! Нет, уж лучше я признаюсь в содеянном».

Очевидно, что взаимное недоверие друг к другу не позволяет реализоваться ситуации, когда каждый выйдет на свободу. К тому же заключённые сидят в разных камерах и каждый принимает решение, не зная о решении другого и у каждого есть соблазн дать показания против другого и получить 3 года вместо 5 или 10 лет. Получается, что самый лучший исход - выйти на свободу - является ненадёжным и нестабильным. Именно поэтому заключённые выбрали такие стратегии, которые привели пусть не к самому лучшему исходу, но зато надёжному и исключающему риск обмана и предательства. Такой исход называется равновесием Нэша.

Равновесие Нэша (Nash equilibrium ) - это такая комбинация стратегий игроков и их выигрышей, при которой ни один из игроков не может увеличить свой выигрыш, изменив свою стратегию, если при этом другие участники своих стратегий не меняют. Примечание: равновесие Нэша существует в играх, в которых игроки действуют независимо друг от друга и не могут объединяться и координировать свои действия.

Простыми словами, равновесие Нэша - это такая ситуация, когда стратегия каждого игрока является наилучшей реакцией на стратегии других игроков и ни одному игроку невыгодно в отдельности менять свою стратегию.

Равновесие Нэша - это не самый лучший исход из всех возможных, но в ситуации, когда каждый играет сам за себя, это оптимальный исход для каждого игрока, потому что сводятся к нулю риски и потери каждого игрока, которые могли бы быть, если другой игрок решит его обмануть или предать.

Равновесие Нэша - это устойчивое равновесие, потому что игрокам выгодно его сохранять, так как любое изменение ухудшит их положение. Но если в отношениях между игроками появляется сотрудничество, равновесие Нэша перестаёт быть равновесным, потому что появляется возможность достичь более лучшего результата. Например, если бы в «Дилемме заключённого» у игроков была возможность договориться о сотрудничестве, а именно - вдвоём хранить молчание, либо, если бы у них не было сомнений в том, что другой не предаст и тоже будет молчать, то ситуация могла бы закончиться для обоих с более лучшим исходом - выходом на свободу.

Вывод: Равновесие Нэша показывает, что каждый игрок может выиграть больше, если между игроками будут существовать сотрудничество, доверие и честность, и каждый игрок, делая лучше для других, сделает лучше для себя.

Иллюстрация с сайта postnauka.com

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться отверсии , проверенной 9 мая 2012; проверки требуют2 правки .

Перейти к: навигация ,поиск

Джон Форбс Нэш, ноябрь 2006

Равновесие Нэша (англ. Nash equilibrium ) названо в честьДжона Форбса Нэша - так втеории игр называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения. Такая совокупность стратегий выбранных участниками и их выигрыши называются равновесием Нэша .

Концепция равновесия Нэша (РН) впервые использована не Нэшем; Антуан Огюст Курно показал, как найти то, что мы называем равновесием Нэша, в игре Курно. Соответственно, некоторые авторы называют егоравновесием Нэша-Курно . Однако Нэш первым показал в своей диссертации понекооперативным играм в 1950-м году, что подобные равновесия должны существовать для всех конечных игр с любым числом игроков. До Нэша это было доказано только для игр с 2 участниками снулевой суммой Джоном фон Нейманом иОскаром Моргенштерном (1947).

Формальное определение

Допустим, -игра n лиц в нормальной форме, где- набор чистых стратегий, а- набор выигрышей. Когда каждый игроквыбирает стратегиюв профиле стратегий, игрокполучает выигрыш. Заметьте, что выигрыш зависит от всего профиля стратегий: не только от стратегии, выбранной самим игроком, но и от чужих стратегий. Профиль стратегийявляется равновесием по Нэшу, если изменение своей стратегии снане выгодно ни одному игроку, то есть для любого

Игра может иметь равновесие Нэша в чистых стратегиях или в смешанных (то есть при выборе чистой стратегии стохастически с фиксированной частотой). Нэш доказал, что если разрешитьсмешанные стратегии , тогда в каждой игреn игроков будет хотя бы одно равновесие Нэша.

Литература

    Васин А. А., Морозов В. В. Теория игр и модели математической экономики - М.: МГУ, 2005, 272 с.

    Воробьев Н. Н. Теория игр для экономистов-кибернетиков - М.: Наука, 1985

    Мазалов В. В. Математическая теория игр и приложения - Изд-во Лань, 2010, 446 с.

    Петросян Л. А. , Зенкевич Н. А., Шевкопляс Е. В. Теория игр - СПб: БХВ-Петербург, 2012, 432 с.

Эффективность по Парето

Материал из Википедии - свободной энциклопедии

Перейти к: навигация ,поиск

Оптимальность по Парето - такое состояние системы, при котором значение каждого частного критерия, описывающего состояние системы, не может быть улучшено без ухудшения положения других элементов.

Таким образом, по словам самого Парето : «Всякое изменение, которое никому не приносит убытков, а некоторым людям приносит пользу (по их собственной оценке), является улучшением». Значит, признаётся право на все изменения, которые не приносят никому дополнительного вреда.

Множество состояний системы, оптимальных по Парето, называют «множеством Парето», «множеством альтернатив, оптимальных в смысле Парето», либо «множеством парето-оптимальных альтернатив».

Ситуация, когда достигнута эффективность по Парето - это ситуация, когда все выгоды от обмена исчерпаны.

Эффективность по Парето является одним из центральных понятий для современной экономической науки. На основе этого понятия строятся Первая и Вторая фундаментальные теоремы благосостояния . Одним из приложений Парето-оптимальности является т. н. Парето-распределение ресурсов (трудовых ресурсов и капитала) при международной экономической интеграции, то есть экономическом объединении двух и более государств. Интересно, что Парето-распределение до и после международной экономической интеграции было адекватно математически описано (Далимов Р. Т., 2008). Анализ показал, что добавленная стоимость секторов и доходы трудовых ресурсов движутся противонаправленно в соответствии с хорошо известным уравнением теплопроводности аналогично газу или жидкости в пространстве, что дает возможность применить методику анализа, используемую в физике, в отношении экономических задач по миграции экономических параметров.

Оптимум по Парето гласит, что благосостояниеобщества достигает максимума, а распределение ресурсов становится оптимальным, если любое изменение этого распределения ухудшает благосостояние хотя бы одногосубъекта экономической системы.

Парето-оптимальное состояние рынка - ситуация, когда нельзя улучшить положение любого участника экономического процесса, одновременно не снижая благосостояния как минимум одного из остальных.

Согласно критерию Парето (критерию роста общественного благосостояния), движение в сторону оптимума возможно лишь при таком распределении ресурсов, которое увеличивает благосостояние по крайней мере одного человека, не нанося ущерба никому другому.

Теория игр – наука, исследующая математическими методами поведение участников в вероятных ситуациях, связанных с принятием решений. Предметом этой теории являются игровые ситуации с заранее установленными правилами. В ходе игры возможны различные совместные действия – коалиции игроков, конфликты…

Часто отмечают, что в действительности олигополия - это игра характеров - игра, в которой так же, как в шахматах или в покере, каждый игрок должен предугадать действия соперника - его блеф, контрдействия, контрблеф - настолько, насколько это возможно. Поэтому экономисты, занимающиеся теорией олигополии, были восхищены появлением в 1944 году объемистой и высоко математезированной книги под названием “Теории игр и экономическое поведение”.

Стратегия игроков определяется целевой функцией, которая показывает выигрыш или проигрыш участника. Формы этих игр многообразны. Наиболее простая разновидность – игра с двумя участниками. Если в игре участвуют не менее трёх игроков, возможно образование коалиций, что усложняет анализ. С точки зрения платёжной суммы игры делятся на две группы – с нулевой и ненулевой суммами. Игры с нулевой суммой называют так же антагонистическими: выигрыш одних в точности равен проигрышу других, а общая сумма выигрыша равна 0. По характеру предварительной договорённости игры делятся на кооперативные и некооперативные.

Наиболее известный пример некооперативной игры с ненулевой суммой – “дилемма заключённого”.

Итак. С поличным поймали 2х воров, которым предъявлено обвинение в ряде краж. Перед каждым из них встаёт дилемма – признаваться ли в старых (недоказанных) кражах или нет. Если признается только 1 из воров, то признавшийся получает минимальный срок заключения – 1 год, а другой максимальный – 10 лет. Если оба вора одновременно сознаются, то оба получать небольшое снисхождение – 6 лет, если же оба не признаются, то понесут наказание, только за последнюю кражу – 3 года. Заключённые сидят в разных камерах и не могут договориться друг с другом. Перед нам игра с некооперативная с ненулевой (отрицательной) суммой. Характерной чертой этой игры является невыгодность для обоих участников руководствоваться своими частными интересами. “дилемма заключённого” наглядно показывает особенности олигополистического ценообразования.

3.1. Равновесие Нэша

(Названное в честь Джона Форбса Нэша) в теории игр - тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения. Такая совокупность стратегий выбранных участниками и их выигрыши называются равновесием Нэша.

Концепция равновесия Нэша (РН) не совсем точно придумана Нэшем, Антуан Августин Курно показал, как найти то, что мы называем равновесием Нэша в игре Курно. Соответственно, некоторые авторы называют его равновесием Нэша-Курно. Однако Нэш первым показал в своей диссертации Некооперативные игры (1950), что равновесия Нэша должны существовать для всех конечных игр с любым числом игроков. До Нэша это было доказано только для игр с 2 участниками с нулевой суммой Джоном фон Нейманом и Оскаром Моргернштерном (1947).

Формальное определение.

Допустим, - игра n лиц в нормальной форме, где - набор чистых стратегий, а - набор выигрышей. Когда каждый игрок выбирает стратегию в профиле стратегий игрок получает выигрыш . метьте, что выигрыш зависит от всего профиля стратегий: не только от стратегии, выбранной самим игроком , но и от чужих стратегий. Профиль стратегий является равновесием по Нэшу, если изменение своей стратегии не выгодно ни одному игроку, то есть для любого :

Игра может иметь равновесие Нэша в чистых стратегиях или в смешанных (то есть при выборе чистой стратегии стохастически с фиксированной частотой). Нэш доказал, что если разрешить смешанные стратегии, тогда в каждой игре n игроков будет хотя бы одно равновесие Нэша.

И Оскар Моргенштерн стали основателями нового интересного направления математики, которое получило название "теория игр". В 1950-е годы этим направлением заинтересовался молодой математик Джон Нэш. Теория равновесия стала темой его диссертации, которую он написал, будучи в возрасте 21 год. Так родилась новая стратегия игр под названием «Равновесие по Нэшу», заслужившая Нобелевскую премию спустя много лет - в 1994 году.

Долгий разрыв между написанием диссертации и всеобщим признанием стал испытанием для математика. Гениальность без признания вылилась в серьезные ментальные нарушения, но и эту задачу Джон Нэш смог решить благодаря прекрасному логическуму разуму. Его теория "равновесие по Нэшу" удостоилась премии Нобеля, а его жизнь экранизации в фильме «Beautiful mind» («Игры разума»).

Кратко о теории игр

Поскольку теория равновесия Нэша объясняет поведение людей в условиях взаимодействия, поэтому стоит рассмотреть основные понятия теории игр.

Теория игр изучает поведение участников (агентов) в условиях взаимодействия друг с другом по типу игры, когда исход зависит от решения и поведения нескольких людей. Участник принимает решения, руководствуясь своими прогнозами относительно поведения остальных, что и называется игровой стратегией.

Существует также доминирующая стратегия, при которой участник получает оптимальный результат при любом поведении других участников. Это наилучшая безпроигрышная стратегия игрока.

Дилемма заключенного и научный прорыв

Дилемма заключенного - это случай с игрой, когда участники вынуждены принимать рациональные решения, достигая общей цели в условии конфликта альтернатив. Вопрос заключается в том, какой из этих вариантов он выберет, осознавая личный и общий интерес, а также невозможность получить и то, и другое. Игроки словно заключены в жесткие игровые условия, что порой заставляет их мыслить очень продуктивно.

Эту дилемму исследовал американский математик Равновесие, которое он вывел, стало революционным в своем роде. Особенно ярко эта новая мысль повлияла на мнение экономистов о том, как делают выбор игроки рынка, учитывая интересы других, при плотном взаимодействии и пересечении интересов.

Лучше всего изучать теорию игр на конкретных примерах, поскольку сама эта математическая дисциплина не является сухо-теоретической.

Пример дилеммы заключенного

Пример, два человека совершили грабеж, попали в руки полиции и проходят допрос в отдельных камерах. При этом служители полиции предлагают каждому участнику выгодные условия, при которых он выйдет на свободу в случае дачи показаний против своего напарника. У каждого из преступников существует следующий набор стратегий, которые он будет рассматривать:

  1. Оба одновременно дают показания и получают по 2,5 года в тюрьме.
  2. Оба одновременно молчат и получают по 1 году, поскольку в таком случае доказательная база их вины будет мала.
  3. Один дает показания и получает свободу, а другой молчит и получает 5 лет тюрьмы.

Очевидно, что исход дела зависит от решения обоих участников, но сговориться они не могут, поскольку сидят в разных камерах. Также ярко виден конфликт их личных интересов в борьбе за общий интерес. У каждого из заключенных есть два варианта действий и 4 варианта исходов.

Цепь логических умозаключений

Итак, преступник А рассматривает следующие варианты:

  1. Я молчу и молчит мой напарник — мы оба получим по 1 году тюрьмы.
  2. Я сдаю напарника и он сдает меня — мы оба получим по 2,5 года тюрьмы.
  3. Я молчу, а напарник меня сдает — я получу 5 лет тюрьмы, а он свободу.
  4. Я сдаю напарника, а он молчит - я получаю свободу, а он 5 лет тюрьмы.

Приведем матрицу возможных решений и исходов для наглядности.

Таблица вероятных исходов дилеммы заключенного.

Вопрос состоит в том, что выберет каждый участник?

«Молчать, нельзя говорить» или «молчать нельзя, говорить»

Чтобы понять выбор участника, нужно пройти по цепочке его размышлений. Следуя рассуждениям преступника А: если я промолчу и промолчит мой напарник, мы получим минимум срока (1 год), но я не могу узнать, как он себя поведет. Если он даст показания против меня, то мне также лучше дать показания, иначе я могу сесть на 5 лет. Лучше мне сесть на 2,5 года, чем на 5 лет. Если он промолчит, то мне тем более нужно дать показания, поскольку так я получу свободу. Точно так же рассуждает и участник B.

Нетрудно понять, что доминирующая стратегия для каждого из преступников - это дача показаний. Оптимальная точка этой игры наступает тогда, когда оба преступника дают показания и получают свой «приз» — 2,5 года тюрьмы. Теория игр Нэша называет это равновесием.

Неоптимальное оптимальное решение по Нэшу

Революционность нэшевского взгляда в том, не является оптимальным, если рассмотреть отдельного участника и его личный интерес. Ведь наилучший вариант - это промолчать и выйти на свободу.

Равновесие по Нэшу - это точка соприкосновения интересов, где каждый участник выбирает такой вариант, который для него оптимальный только при условии, что другие участники выбирают определенную стратегию.

Рассматривая вариант, когда оба преступника молчат и получают всего по 1 году, можно назвать него Парето-оптимальным вариантом. Однако он возможен, только если преступники смогли бы сговориться заранее. Но даже это не гарантировало бы этого исхода, поскольку соблазн отступить от уговора и избежать наказания велик. Отсутствие полного доверия друг к другу и опасность получить 5 лет вынуждает выбрать вариант с признанием. Размышлять о том, что участники будут придерживаться варианта с молчанием, действуя согласованно, просто нерационально. Такой вывод можно сделать, если изучать равновесие Нэша. Примеры только доказывают правоту.

Эгоистично или рационально

Теория равновесия Нэша дала потрясающие выводы, опровергнувшие существующие до этого принципы. Например, Адам Смит рассматривал поведение каждого из участников как абсолютно эгоистичное, что и приводило систему в равновесие. Эта теория носила название «невидимая рука рынка».

Джон Нэш увидел, что если все участники будут действовать, преследуя только свои интересы, то это никогда не приведет к оптимальному групповому результату. Учитывая, что рациональное мышление присуще каждому участнику, более вероятен выбор, который предлагает стратегия равновесия Нэша.

Чисто мужской эксперимент

Ярким примером может служить игра «парадокс блондинки», которая хотя и кажется неуместной, но является яркой иллюстрацией, показывающей, как работает теория игр Нэша.

В этой игре нужно представить, что компания свободных парней пришла в бар. Рядом оказывается компания девушек, одна из которых предпочтительнее других, скажем блондинка. Как парням повести себя, чтобы получить наилучшую подругу для себя?

Итак, рассуждения парней: если все начнут знакомиться с блондинкой, то, скорее всего, она никому не достанется, тогда и ее подруги не захотят знакомства. Никто не хочет быть вторым запасным вариантом. Но если парни выберут избегать блондинку, то вероятность каждому из парней найти среди девушек хорошую подругу высока.

Ситуация равновесия по Нэшу неоптимальна для парней, поскольку, преследуя лишь свои эгоистические интересы, каждый выбрал бы именно блондинку. Видно, что преследование только эгоистичных интересов будет равнозначно краху групповых интересов. Равновесие по Нэшу будет значить то, что каждый парень действует в своих личных интересах, которые соприкасаются с интересами всей группы. Это неоптимальный вариант для каждого лично, но оптимальный для каждого, исходя из общей стратегии успеха.

Вся наша жизнь игра

Принятие решений в реальных условиях очень напоминает игру, когда вы ожидаете определенного рационального поведения и от других участников. В бизнесе, в работе, в коллективе, в компании и даже в отношениях с противоположным полом. От больших сделок и до обычных жизненных ситуаций все подчиняется тому или иному закону.

Конечно, рассмотренные игровые ситуации с преступниками и баром - это всего лишь отличные иллюстрации, демонстрирующие равновесие Нэша. Примеры таких дилемм очень часто возникают на реальном рынке, а особенно это работает в случаях с двумя монополистами, контролирующими рынок.

Смешанные стратегии

Часто мы вовлекаемы не в одну, а сразу в несколько игр. Выбирая один из вариантов одной игре, руководствуясь рациональной стратегией, но попадаете в другую игру. После нескольких рациональных решений вы можете обнаружить, что ваш результат вас не устраивает. Что же предпринимать?

Рассмотрим два вида стратегии:

  • Чистая стратегия - это поведение участника, которое исходит из размышления над возможным поведением других участников.
  • Смешанная стратегия или случайная стратегия - это чередование чистых стратегий случайным образом или выбор чистой стратегии с определенной вероятностью. Такую стратегию еще называют рэндомизированной.

Рассматривая такое поведение, мы получаем новый взгляд на равновесие по Нешу. Если ранее говорилось о том, что игрок выбирает стратегию один раз, то можно представить и другое поведение. Можно допустить тот вариант, что игроки выбирают стратегию случайно с определенной вероятностью. Игры, в которых нельзя найти равновесия Нэша в чистых стратегиях, всегда имеют их в смешанных.

Равновесие Нэша в смешанных стратегиях называется смешанным равновесием. Это такое равновесие, где каждый участник выбирает оптимальную частоту выбора своих стратегий при условии, что другие участники выбирают свои стратегии с заданной частотой.

Пенальти и смешанная стратегия

Пример смешанной стратегии можно привести в игре в футбол. Лучшая иллюстрация смешанной стратегии - это, пожалуй, серия пенальти. Так, у нас есть вратарь, который может прыгнуть только в один угол, и игрок, который будет бить пенальти.

Итак, если в первый раз игрок выберет стратегию сделать удар в левый угол, а вратарь также упадет в этот угол и словит мяч, то как могут развиваться события во второй раз? Если игрок будет бить в противоположный угол, это, скорее всего, слишком очевидно, но и удар в тот же угол не менее очевиден. Поэтому и вратарю, и бьющему ничего не остается, как положиться на случайный выбор.

Так, чередуя случайный выбор с определенной чистой стратегией, игрок и вратарь пытаються получить максимальный результат.

Ученые вот уже почти шестьдесят лет используют теорию игр для расширения анализа стратегических решений, которые принимают фирмы, в частности для того, чтобы ответить на вопрос: почему на некоторых рынках фирмы стремятся сговориться, тогда как на других агрессивно конкурируют; использующие фирмы, чтобы не допустить вторжения потенциальных конкурентов; как должны приниматься решения о цене, когда меняются условия спроса или издержек или когда новые конкуренты вторгаются на рынок и т.

Первыми провели исследование в области теории игр Дж.-Ф. Нейман и О. Моргенштерн и описали результаты в книге "Теория игр и экономическое поведение" (1944). Они распространили математические категории этой теории на экономическую жизнь общества, введя понятие оптимальных стратегий, максимизации ожидаемой полезности, доминирование в игре (на рийку), коалиционных соглашений и тому подобное.

Ученые стремились сформулировать основополагающие критерии рационального поведения участника на рынке с целью достижения благоприятных результатов. Они различали две основные категории игр. Первая - "игра с нулевой суммой", предусматривающий такой выигрыш, который состоит исключительно из проигрыша других игроков. В связи с этим пользу одних непременно должна образовываться за счет потерь других игроков, так что общая сумма пользы и потерь всегда равна нулю. Вторая категория - "игра с плюсовой суммой", когда индивидуальные игроки соревнуются за выигрыш, состоящий из их же ставок. Иногда он образуется за счет наличия "выходного" (термин из карточной игры в бридж, который означает одного из игроков, который, делая ставку, не участвует в игре), совсем пассивного и часто является служащим объектом эксплуатации. В обоих случаях игра неизбежно сопряжена с риском, поскольку каждый из ее участников, как считали исследователи, "стремится максимально повысить функцию, переменные которой ним не контролируются". Если все игроки являются умелыми, то решающим фактором становится случайность. Но так бывает редко. Почти всегда важную роль в игре играет хитрость, с помощью которой делаются попытки раскрыть замыслы противников и завуалировать свои намерения, а затем занять выгодные позиции, которые заставили бы этих противников действовать в ущерб самим себе. Многое зависит и от "контрхитрости".

Большое значение во время игры имеет рациональное поведение игрока, т.е. продуманные выбор и осуществление оптимальной стратегии. Важный вклад в разработку формализованного (в виде моделей) описания конфликтных ситуаций, особенно в определении "формулы равновесия", т.е. устойчивости решений противников в игре, внес американский ученый Дж.-Ф. Нэш.

Нэш Джон Форбс родился в 1928 г.. (Г.. Влуефилд, США). Учился в университете Карнеги-Меллона по специальности инженера-химика, освоил курс "международная экономика". Получил диплом бакалавра и одновременно магистра математики.

В 1950 г.. В ИИриястонському университете защитил докторскую диссертацию на тему "некооперативных игры". Начиная с 1951г. И на протяжении почти восьми лет Нэш работал преподавателем Массачусетского технологического института, проводя одновременно активную научно-исследовательскую деятельность.

С весны 1959 ученый заболел и потерял работоспособность. В 70-е годы он смог вернуться к своим математических увлечений, однако производить научные результаты ему было трудно. Нобелевский комитет в 1994 фактически наградил труд, написанная в 1949

Член Национальной академии наук США, Бконометричного общества и Американской академии искусств и академии наук.

Досконально изучив различные игры, создав серию новых математических игр и наблюдая за действиями участников в различных игровых ситуациях, Нэш пытался глубже понять, как функционирует рынок, как компании принимают связаны с риском решения, почему покупатели действуют именно определенным образом. В экономике, как и в игре, руководители фирм должны учитывать не только последний, но и предыдущие шаги конкурентов, а также обстановку на всем экономическом (игровом, например, шахматном) поле и многие другие важные факторы.

Субъекты экономической жизни - активно действующие его участники, которые на рынке в условиях конкуренции идут на риск, и он должен быть оправдан. Поэтому каждый из них, как игрок, должен иметь свою стратегию. Именно это имел в виду Нэш, когда разрабатывал метод, который впоследствии назвали его именем (равновесие Нэша).

Свое понимание стратегии как основного понятия теории игр Дж.-Ф. Нэш разъясняет на основе "игры с нулевой суммой" (он называет это "симметричной игрой"), когда каждый участник имеет определенное число стратегий. Выигрыш каждого игрока зависит от того, какие стратегии выбрал и он, и его противник. На основании этого строится матрица для нахождения оптимальной стратегии, которая за многократного повторения игры обеспечивает этому игроку максимально возможный средний выигрыш (или максимально возможный средний проигрыш). Поскольку игроку неизвестно, какую стратегию выберет противник, ему самому лучше (рационально) выбрать стратегию, которая рассчитана на худшую для него поведение противнике (принцип так называемого "гарантированного результата"). Действуя осторожно и считая противника сильным конкурентом, наш игрок выберет для каждой своей стратегии минимально возможный выигрыш. Затем из всех минимально выигрышных стратегий он выберет такую, которая обеспечит максимальный из всех минимальных выигрыш - максимин.

Но и противник, вероятно, подумает аналогично. Он найдет для себя наибольшие проигрыши во всех стратегиях игрока, а затем из этих максимальных проигрышей выберет минимальный - минимакс. В случае равенства максимина мини Максу решения игроков будут устойчивыми, а игра будет иметь равновесие. Устойчивость (равновесие) решений (стратегий) состоит в том, что отходить от выбранных стратегий будет невыгодно для обоих участников игры. В случае, когда максимин не равна минимакса, решения (стратегии) обоих игроков, если они сколько-нибудь угадали выбор стратегии противника, оказываются неустойчивыми, невривно-важен.

Общее краткое определение равновесия Нэша - результат, в котором стратегия каждого из игроков является лучшей среди других, принятых остальными участниками игры стратегий. Это определение основывается на том, что ни один из игроков изменением собственной роли не может достичь наибольшей пользы (максимизации функции полезности), если остальные участники твердо придерживаются своей линии поведения.

Свою формулу равновесия Дж.-Ф. Нэш многократно усилил, включив в нее как незаменимый фактор для выработки стратегий показатель оптимального объема информации. Этот показатель оптимальности он вывел из анализа ситуаций (1) с полным информированием игрока о своих противников и (2) с неполным информированием о них. Переведя этот постулат с математического языка на язык экономической, Нэш ввел неуправляемые переменные рыночных отношений как важный информационный элемент знания условий внешней среды. После этого равновесие Нэша стала методом, используется практически во всех отраслях экономической науки для лучшего понимания сложных взаимосвязей, - отметил в октябре 1994 во время объявления новых лауреатов Нобелевской премии по экономике А. Линдбек, член Шведской королевской академии и председатель Нобелевского комитета по экономике.

Применение равновесия Нэша стало важным шагом в микроэкономике. ее использование способствовало углубленному пониманию развития и функционирования рынков, обоснованию стратегических решений, принимаемых менеджерами различных фирм. Равновесием Нэша можно пользоваться при изучении процесса ведения политических переговоров и экономического поведения, в том числе на олигополистических рынках.

По пионерной анализ равновесия в некооперативных играх Нобелевская премия по экономике 1994 года было присуждена Дж.-Ф. Нэш в, Р. Селтену и Дж. Харшани. Начиная с классического труда Дж. Неймана и О. Моргенштер-на "Теория игр и экономическое поведение", неотъемлемой частью экономического анализа стало исследование стратегии взаимодействия экономических субъектов в условиях, когда для выработки собственной линии поведения необходимо учитывать действия другого суб " объекта (как это происходит, в частности, в шахматах, преферансе и других играх). Эти трое Нобелевских лауреатов внесли большой вклад в ответвление теории игр - теорию некооперативных игр (то есть игр, когда достигнута договоренность между участниками). Принципиальным моментом этой теории является концепция равновесия, используется для предсказания результатов взаимодействия.

Равновесие Нэша стала фундаментальным понятием теории игр.

Анализ дискретного выбора

К последней четверти ХХ в. доминировало мнение, что основную роль в поведении потребителей играют здравый смысл и расчет. Именно с учетом прежде всего здравого смысла потребителей сформулированы либеральные экономические теории. Экономисты этого научного направления считают, что рынок как система отношений между экономическими субъектами способен саморегулироваться и устанавливать справедливые цены на товары и услуги на основе здравого смысла.

Хотя либеральная экономическая школа дала миру больше научных достижений, чем конкурентная консервативна, однако ее теории имеют ограниченное применение, что признают и ее сторонники. Например, монетарнсты (они же либералы) пока не сумели аргументированно объяснить поведение инвесторов на международных финансовых рынках и огромные колебания цен на мировые сырьевые ресурсы.

Либеральный рыночный подход оказался слишком упрощенным для надежного прогнозирования потребительского спроса на услуги и товары в условиях, когда потребители имеют огромный выбор подобных товаров и при этом не ограничены в объемах закупок, поскольку сейчас в развитых странах чрезвычайно распространен потребительский кредит. Кроме того, либеральная теория не может объяснить, например, покупку американской семьей (или английском семьей) американского (или английского) автомобиля, в то время как корейский стоит дешевле. То есть эта теория не принимает во внимание национальные и другие особенности поведения потребителей, которые с точки зрения здравого смысла трудно объяснить.

Поэтому в последнее время ученые-екоярмисты все чаще говорят о появлении новой экономической теории, сложившейся непосредственно на основе данных о поведении потребителей, которую надо изучать с помощью статистических методов. Эта теория предлагает описание способа измерения полезности. Несмотря на то, что подобные оценки носят субъективный характер, именно субъективность определяет их ценность для реализации экономической политики. Многие экономисты даже прогнозируют, что именно теория поведения потребителей (известный автор - Д. - Л. Мак-Федден) будет в XXI в. основой для определения экономической и политической стратегии развитых государств.

Мак-Федден ДаниельЛитл родился в 1937г. (г.. Ралейг, штатГОвн.Каролина, США). Учился и работал в Миннесотского университете. В 1962 г.. Защитил докторскую диссертацию, работал ассистентом профессора экономики в Питсбургском университете, затем профессором экономики в Калифорнийском университете, где с 1991 г.. Руководит эконометрической лабораторией.

Опубликовал в соавторстве такие труды: "Очерки об экономическом поведении в условиях нестабильности" (1974), "Спрос на городское передвижения: поведенческий анализ" (1976), "Экономика производства: двойной подход к теории и практики" (1978), "Структурный анализ дискретных данных с економетричяимы приложениями "(1981)," Мик-роекономичне моделирования и численный анализ: исследование спроса в коммунальном хозяйстве "(1984)," Справочник по эконометрики "(т.4,1994), а также много научных статей.

В течение 1983-1984 гг. Был вице-президентом, а в 1985 г.. - Президентом Эконометрического общества. У1994 г.. Избирался вице-президентом Американской экономической ассоциации. Член Национальной академии наук США, Американских эконометрического общества и академий искусств и наук, Американская экономическая ассоциация наградила его медалью Дж.-Б. Кларка, Эконометрическое общество - медалью Р. Фриша.

Известно, что довольно часто микроданные отражают дискретные выборы - выборы среди конечного множества альтернативных решений. В экономической теории традиционный анализ спроса предусматривал, что индивидуальный выбор должен быть представлен непрерывной переменной, но такая трактовка не соответствует изучению поведения дискретного выбора. Предыдущими достижениями многих ученых эмпирические исследования таких выборов не были обоснованными в экономической теории.

Методология анализа дискретного выбора Д.-л. Мак-Феддена коренится в микроэкономической теории, согласно которой каждый индивид выбирает определенную альтернативу, которая максимизирует его полезность. Функции полезности - это способы описания потребительского выбора: если выбран набор услуг X при том, что набор услуг В доступен, то X должен иметь большую полезность, чем В. Изучая выбор, сделанный потребителями, можно вывести оценочную функцию полезности, адекватно описывала бы их поведение. Очевидно, что невозможно исследовать весь комплекс фактов влияния на выбор индивида, но анализ динамики изменений среди личностей с примерно одинаковыми характеристиками позволяет сделать достаточно объективные выводы.

Д.-л. Мак-Федден в сотрудничестве с Т, Домеником изучил поведение потребителей относительно регулярных транспортных поиздок1. В большинстве крупных городов у лиц, осуществляющих регулярные транспортные поездки, есть выбор: пользоваться общественным транспортом или ездить на работу автомобилем. Каждую из этих альтернатив можно рассматривать как набор различных характеристик: время нахождения в пути, время ожидания, имеющихся расходов, комфорта, удобства и тому подобное. Таким образом, можно обозначить продолжительность времени нахождения в пути для каждого рода поездки через х {, продолжительность времени ожидания для каждого вида поездки через х 2 и т. Д.

Если (хх, х2, Хя) представляет значение п различных характеристик автомобильных поездок, а (y1, y2 ... .. y п) - значения характеристик поездок на автобусе, то можно рассмотреть модель, в которой потребитель принимает решение о том, поехать ему автомобилем или автобусом, исходя из предпочтения одного набора указанных характеристик другому. Конкретнее можно предположить, что преимущества среднего потребителя в отношении указанных характеристик могут быть представлены функцией полезности вида:

где коэффициенты b и, b 2 i т. Д - неизвестные параметры. Любое монотонное преобразование этой функции полезности может описать потребительский выбор, однако с точки зрения статистики работать с линейной функцией значительно легче.

Предположим, что существует группа похожих по характеристикам потребителей, которые выбирают, поехать автомобилем или автобусом, основываясь при этом на конкретных данных о продолжительности времени поездок, о расходах и другие характеристики поездок, с которыми они сталкиваются. В статистике есть технические приемы, которые можно использовать для поиска значений коэффициентов Д, при и - 1, п, наиболее подходящие для исследовательской структуры выбора, осуществленного данной множественностью потребителей. Эти технические приемы статистики позволяют вывести оценочную функцию полезности для различных способов транспортного передвижения.

Мак-Федден и Доменик предложили функцию полезности вида:

где ТW - общее время ходьбы до автобуса или автомобиля или от него; ТТ - общее время поездки в минутах; С - общая стоимость поездки в долларах.

С помощью оценочной функции полезности удалось правильно описать выбор между автомобильным и автобусным транспортом для 93% домохозяйств взятой авторами выборки. Коэффициенты при переменных в изложенном уравнении показывают предельную полезность каждой такой характеристики. Отношение одного коэффициента к другому показывает предельную норму замещения одной характеристики другой. Например, отношение предельной полезности времени ходьбы пешком к предельной полезности общей продолжительности поездки указывает не то, что рядовой потребитель считает время ходьбы пешком примерно в 3 раза медленнее, чем время поездки. То есть потребитель был бы готов затратить 3 дополнительных минуты на поездку, чтобы сэкономить 1 минуту ходьбы пешком. Аналогично отношение стоимости поездки в общей продолжительности поездки указывает на выбор рядового потребителя относительно этих двух переменных. В исследовании рядовой пассажир оценивал минуту времени поездки на транспорте в 0,0411 х х 2,24 = 0,0183 долл. за минуту, что составляет 1,10 долл. в час. (Для сравнения - часовая зарплата среднего пассажира в 1967 г.. Составляла в сена 2,85 долл. В час.)

Такие оценочные функции полезности могут быть ценными для определения того, следует осуществлять какие-то изменения в системе общественного транспорта. Например, в приведенной выше функции полезности одним из важных факторов, объясняющих, чем руководствуются потребители в своем выборе, является продолжительность поездки. Городское управление транспортом могло бы при небольших затратах увеличить количество автобусов, чтобы сократить эту общую продолжительность поездки, но необходимо выяснить дополнительное количество пассажиров оправдает рост затрат.

Оперируя функцией полезности и выборке потребителей, можно сделать прогноз относительно того, какие потребители захотят совершать поездки автомобилем, а какие предпочтут автобуса. Это позволит получить некоторое представление о том, будет ли выручка достаточной для покрытия дополнительных расходов. Кроме того, можно использовать предельную норму замещения для формирования представления об оценке каждым потребителем сокращения времени поездок. По результатам исследования Мак-Феддена и Доменика рядовой пассажир в 1967 оценивал время поездки по ставке 1,10 долл. в час, он готов был заплатить 37 центов, чтобы сократить время поездки на 20 минут. Это число показывает степень выигрыша в долларах от более своевременного предоставления автобусных услуг. Наличие количественной меры выигрыша, безусловно, способствует принятию рациональных решений в сфере транспортной политики.

Еще один весомый вклад Мак-Феддена - это развитие в 1974 так называемого анализа условного логит. Модель предполагает, что каждый человек в жизни находится перед рядом альтернатив. Обозначим как X характеристики, связанные с каждой альтернативой, и как 2 характеристики лиц, исследователь может наблюдать с помощью имеющихся данных. Например, для изучения выбора способа путешествий, где альтернативой может быть автомобиль, автобус или метро, X может включать информацию относительно времени и расходов, тогда как X мог бы включать данные относительно возраста, дохода и образования. Но различия между индивидами и альтернативы папке, как между Х \%, хотя они незаметны исследователю, но именно они определяют индивидуальный максимально полезный выбор. Такие характеристики представлены случайными векторами ошибок. Мак-Федден предположил, что эти случайные ошибки имеют определенную статистическую дистрибуцию (распределение) среди населения, назвав ее дистрибуцией экстремального значения. В этих условиях (плюс некоторые технические предсказания) он продемонстрировал, что вероятность того, что лицо и выберет альтернативу /, может быть записана в виде многочленов логит-модели:

где e - основание натурального логарифма; b и b - параметры (векторы). В своей базе данных исследователь может наблюдать переменные X и Z фактически так, как индивид выбирает альтернативу. В результате ученый способен оценить параметры р и <5, использовав известные статистические методы. Мак-Федденивське дифференцировки логит-модели осталось новацией и признается фундаментальным достижением.

Модели обычно используются в исследованиях спроса на городские перевозки. Они также могут применяться на транспорте, когда планируется изучить эффективность политических мер, а также социальных реформ или изменений окружающей среды. Например * эти модели могут объяснить, как изменения в цене товаров улучшают их доступность, влияют они на демографическую ситуацию, на объемы путешествия, используя альтернативные способы передвижения. Модели также приемлемые для многих других сфер, в частности, в исследованиях выбора жилого помещения, места жительства или образования. Мак-Федден использовал разработанные методы для анализа многих социальных проблем, таких как спрос на бытовую энергию, телефонные услуги и обеспечение жильем людей пожилого возраста и тому подобное.

В результате своих исследований ученый пришел к выводу, что условные логит-модели имеют определенную особенность относительно вероятности выбора между двумя альтернативами, например путешествия автобусом или поездом, независимыми от цены других вариантов передвижения. Эта особенность, названная независимостью несвязанных альтернатив (ННА), нереалистично для статистического потребления. Д.-л. Мак-Федден изобрел не только статистические тесты для установления соответствия ННА, но и предложил общие модели, названные заключенным логит-моделями, которые предусматривают, что выборы индивидов могут быть сделаны в определенной последовательности. Например, при исследовании решений, касающихся места жительства и типа жилья, принято, что гражданин сначала выбирает микрорайон, а затем - тип жилого помещения.

Даже с этими обобщениями модели весьма чувствительны к определенным предсказаний относительно дистрибуции ненаблюдаемых характеристик среди населения. В течение последнего десятилетия Д.-л. Мак-Федден разработал имитационные модели (методы моделируемых моментов) для статистической оценки дискретного выбора моделей, которые допускают гораздо более основных предположений. Мощные компьютеры расширили практическую приспособленность этих численных методов. В результате дискретные выборы индивидов теперь могут быть описаны более реалистично, а их решения - предусмотрены точнее. На основе своей новой теории Мак-Федден разработал микроеконометрични модели, которые могут использоваться, например, для предсказания намерений той части населения, которая будет выбирать различные альтернативы. За развитие методики формального обработки индивидуальных статистических и экономических данных Мак-Феддена отмечено Нобелевской премией.

Д.-л. Мак-Федден в 60-е годы также изобрел эконометрические методы оценки производственной технологии и исследовал факторы, косвенно влияют на потребность фирмы в капитале и в рабочей силе. В течение 90-х лет талантливый ученый научно развил экономику природопользования, обогатил методическую литературу по оценке стоимости природных богатств, в частности исследовал потери общественного богатства вследствие нанесенных в 1989 г.. Убытков окружающей среде нефтяным пятном, движущейся от пострадавшего в аварии танкера "Exxon Valdez * вдоль побережья Аляски.

Лейтмотивом исследований профессора Д.-л. Мак-Феддена е попытки объединить экономическую теорию, статистические и эмпирические методы для решения с их помощью социальных проблем. Его научные разработки также помогают социологам и политикам оценить выбор голосующих, исходя из змьн в их доходах и др.

Мак-Федден первым предложил методологию анализа дискретного выбора, согласно которой каждый индивид выбирает определенную альтернативу, которая максимизирует его полезность. Функции полезности представляют собой способы описания потребительского выбора. Изучая выбор, сделанный потребителями, можно вывести оценочную функцию полезности, адекватно описывала бы их поведение.



Рассказать друзьям