Игра с седловой точкой определение. Вполне определенные игры (игры с седловой точкой)

💖 Нравится? Поделись с друзьями ссылкой

Классификация игр. Определение седловой точки.

Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д.

В зависимости от количества игроков различают игры двух и n игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения. Чем больше игроков - тем больше проблем.

По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной . Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий игра называется бесконечной .

По характеру взаимодействия игры делятся на:

1) бескоалиционные : игроки не имеют права вступать в соглашения, образовывать коалиции;

2) коалиционные (кооперативные) – могут вступать в коалиции.

В кооперативных играх коалиции наперёд определены.

По характеру выигрышей игры делятся на: игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой суммой .

По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые, сепарабельные, типа дуэлей и др.

Определение . Если в игре с матрицей А =(нижняя чистая цена равна верхней чистой цене), то говорят, что эта игра имеет седловую точку в чистых стратегиях и чистую цену игры u = =.

Седловая точка – это пара чистых стратегий (i о,j о) соответственно игроков 1 и 2, при которых достигается равенство = .Если один из игроков придерживается стратегии, соответствующей седловой точке, то другой игрок не сможет поступить лучше, чем придерживаться стратегии, соответствующей седловой точке. Математически это можно записать и иначе:, где i, j – любые чистые стратегии соответственно игроков 1 и 2; (i о,j о) – стратегии, образующие седловую точку.

Таким образом, седловой элемент является минимальным в i о -й строке и максимальным в j о -м столбце в матрице А. Отыскание седловой точки матрицы А происходит следующим образом: в матрице А последовательно в каждой строке находят минимальный элемент и проверяют, является ли этот элемент максимальным в своём столбце . Если да, то он и есть седловой элемент, а пара стратегий, ему соответствующая, образует седловую точку. Пара чистых стратегий (i о,j о) игроков 1 и 2, образующая седловую точку и седловой элемент , называется решением игры . При этом i о и j о называются оптимальными чистыми стратегиями соответственно игроков 1 и 2.

Свойства седловых точек:

1. Равноценность. Если в игре несколько седловых точек, то значения функции выигрыша в них одинаковы.

2. Взаимозаменяемость оптимальных стратегий. Игроки могут заменить свои оптимальные стратегии другими оптимальными стратегиями, при этом равновесие не нарушится, а выигрыш (проигрыш) останется неизменным.

13.Определение смешанной стратегии. Решение игры 2*2 в смешанных стратегиях.

Смешанная стратегия это когда вместо того, чтобы применить какую-то одну конкретную стратегию, участники игры могут чередовать (смешивать) в случайном порядке свои стратегии в соответствии со специально разработанной схемой, обеспечивающей нужную частоту, или вероятность реализации каждой из стратегий.

Для каждого игрока можно задать следующие компоненты:

Pia – вероятность применения i-ой стратегии со стороны А.

Если подобрать такой набор Pia , который обеспечивает наибольший выигрыш независимо от действий второй стороны, то этот набор вероятностей {p 1 a , p 2 a , …, p ma } = S A и будет называться смешанной стратегией.

S * A = {p * 1 a , p * 2 a , …, p * ma } – оптимальная смешанная стратегия.

{ S A } – множество смешанных стратегий со стороны А, из которых нужно выбрать оптимальную.

Игра 2*2 в смешанных стратегиях.

Если хотя бы у одной стороны только 2 действия, применим графо-аналитический метод решения. Зададим игру в виде следующей матрицы:

а 11 а 12
а 21 а 22

Для этой игры можно считать следующее: игрок каждый раз играет против какой-либо чистой стратегии другой стороны. При этом он может выбрать такое соотношение вероятностей, которое даст ему гарантированный выигрыш, размером с цену игры.

A 11 p * 1 a + a 21 p * 2 a = γ - при игре против первой чистой стратегии стороны В.

a 12 p * 1 a + a 22 p * 2 a = γ – против второй чистой стратегии стороны В.

p * 1 a + p * 2 a = 1

Аналогично для В:

A 11 p * 1 b + a 12 p * 2 b = γ - при игре против первой чистой стратегии стороны В.

a 21 p * 1 b + a 22 p * 2 b = γ – против второй чистой стратегии стороны В.

p * 1 b + p * 2 b = 1

Решение системы уравнений:

Для того, чтобы полученные решения имели смысл необходимо требовать следующие соотношения:

Если выполняется либо одно, либо другое, то вероятности от 0 до 1.

Для стороны А: Для стороны В:


В задачах теории статистических решений рассматриваются платежные матрицы (для дискретного случая), либо платежная функция (в непрерывном случае). Значения в платеж. матрице, либо в платеж. функции зависят от 2х факторов: 1. состояние природы, 2. варианты решений ЛПР.

В отличие от теории игр, здесь только одна из сторон рассматривается как сторона с рациональным поведением. Др. сторона рассматривается как природный фактор с элементом неопределенности. В этом случае, условно считается, что мы играем с природой, поэтому относительно второй стороны делаются различные предположения о том, как будут выбираться варианты ее состояния.

Платежная матрица может образовываться в результате решения оптимизационной задачи когда, например, можно получить несколько эквивалентных решений. Для осуществления выбора наилучшего варианта необходимо ввести критериальную функции, отражающую систему предпочтений ЛПР.

Геометрическая интерпретация.

е 11 е 12
е 21 е 22
e n 1 е n2

F i – состояние природы.

Е i – варианты решений.

Если отложить точки (e i 1 , e i 2), то они заполнят определенное пространство, ограниченное прямоугольником. РТ – рабочая точка. Внутри этого прямоугольника образовалось 4 квадранта или 4 конуса. Рассмторим свойства точек из этих конусов.

I: все точки хотя бы по одной координате лучше, чем рассматриваемая РТ. Поэтому конус I – конус предпочтения.

III: все точки хотя бы по одной координате заведомо хуже чем РТ.

II и IV: все точки по одной координате могут быть лучше, а по другой хуже. Поэтому эти конусы – конусы неопределенности.

Для определения более менее предпочтительных точек, чем РТ, необходимо рассмотреть различные линии, представляющие линии уравнений или линии эквивалентных решений.

Линия биссектрисы (линия 1) соответствует нейтральной критериальной функции. Линия 2 – пессимистическая критериальная функция. Линия 3 – оптимистическая критериальная функция.

Любая из линий 1, 2, 3 соединяет эквивалентные по предпочтению точки. Точки, расположенные правее и выше любой из этих линий предпочтительнее точек, лежащих левее и ниже.

Предельный случай для пессимистической функции – линии, ограничивающие I-ый квадрант. Для оптимистической – III-ий квадрант.

Определение 4. Парная игра, в которой сумма выигрышей игроков равна нулю (выигрыш первого игрока равен проигрышу второго игрока) называется парной игрой с нулевой суммой или антагонистической игрой .

Замечание. Всякую парную игру с нулевой суммой всегда можно полностью задать платёжной матрицей одного из игроков. Как правило, задают платёжную матрицу первого игрока. Предполагается, что все игроки одинаково разумны. Задача каждого игрокасостоит в том, что каждый игрок стремится обеспечить себе максимально возможный выигрыш при любых действиях другого игрока.

Пусть платёжная матрица первого игрока в игре двух игроков, имеющих соответственно и стратегий, имеет вид . Тогда матрица выигрышей второго игрока .

Построим оптимальные стратегии игроков в антагонистической игре.

Оптимальная стратегия первого игрока. Первый игрок желает получить максимальный собственный выигрыш. При этом он предполагает, что в любом случае второй игрок выберет стратегию, минимизирующую выигрыш первого игрока. Задача первого игрока – получить некоторый гарантированный выигрыш.

Обозначим минимальное значение выигрыша первого игрока при каждой его стратегии (в каждой строке матрицы ): , . Зная минимальные выигрыши при различных стратегиях второго игрока, первый игрок выберет ту стратегию, при которой максимально. Обозначим это значение . Тогда .

Определение 5. Величина – гарантированный максимальный выигрыш, который может обеспечить себе первый игрок, – называется нижней ценой игры или максимином .

Таким образом, формально оптимальная стратегия первого игрока состоит в выборе строки и в ней элемента матрицы : . Эта стратегия называется максиминной со стороны первого игрока. Если первый игрок будет придерживаться максиминной стратегии, то его выигрыш в любом случае будет не меньше максиминного значения:

Оптимальная стратегия второго игрока. Второй игрок желает минимизировать собственный проигрыш. При этом он предполагает, что в любом случае первый игрок выберет стратегию, максимизирующую собственный выигрыш. Задача второго игрока – проиграть не более некоторой гарантированной суммы.



Обозначим максимальное значение выигрыша первого игрока при каждой стратегии второго игрока (в каждом столбце матрицы ): , . Зная максимальные выигрыши первого игрока при различных стратегиях второго игрока , второй игрок выберет ту стратегию, при которой минимально. Обозначим это значение . Тогда .

Определение 6. Величина – минимальный проигрыш, который может обеспечить себе второй игрок, – называется верхней ценой игры или минимаксом .

Таким образом, формально оптимальная стратегия второго игрока состоит в выборе столбца и в ней элемента матрицы : . Эта стратегия называется минимаксной со стороны второго игрока. Если второй игрок будет придерживаться минимаксной стратегии, то он в любом случае проиграет не больше минимаксного значения:

Теорема 1. Для произвольной прямоугольной матрицы всегда выполняется неравенство или

Определение 7. Если верхняя цена игры равна нижней, то есть , то говорят, что игра имеет седловую точку (решается ) в чистых стратегиях .

Определение 8. Значение называется ценой игры (чистой ценой игры ) .

Определение 9. Элемент матрицы называется седловым элементом матрицы .

Замечание. Седловой элемент матрицы одновременно является минимальным в своей строке и максимальным в своём столбце, то есть

Определение 10. Пару чистых стратегий и , соответствующих и , называют седловой точкой игры .

Замечание. Стратегии и , образующие седловую точку, являются оптимальными. Существование седловой точки платёжной матрицы соответствует наличию состояния равновесия в данной матричной игре.

Определение 11. Тройка называется решением игры .

Пример 2.4 . В игре участвуют два игрока. Каждый из них может записать независимо от другого цифры 1, 2 и 3. если разность между цифрами, записанными игроками, положительна, то первый игрок выигрывает количество очков, равное разности между цифрами. Если разность отрицательна, то выигрывает второй игрок. Если разность нулевая, то игра заканчивается вничью. Составить платёжную матрицу и найти цену игры.

Решение. У игрока А есть 3 стратегии:

У игрока В также есть три стратегии:

Данная игра является парной игрой с противоположными интересами (антагонистической), следовательно, для её формального описания достаточно задать платёжную матрицу первого игрока.

Вычислим возможные выигрыши первого игрока:

Тогда платёжная матрица первого игрока примет вид:

Найдём оптимальную стратегию первого игрока. Для этого найдём минимальный выигрыш при каждой его стратегии (минимальный элемент в каждой строке):

Найдём нижнюю цену игры (выберем из минимальных элементов наибольший):

Таким образом, оптимальная стратегия первого игрока:

Найдём оптимальную стратегию второго игрока. Для этого найдём максимальный выигрыш первого игрока при каждой стратегии второго игрока (максимальный элемент в каждом столбце):

Найдём верхнюю цену игры (выберем из максимальных элементов наименьший):

Таким образом, оптимальная стратегия второго игрока:

Отклонение первого игрока от оптимальной стратегии уменьшает его выигрыш. Отклонение второго игрока от оптимальной стратегии увеличивает его проигрыш.

Рассмотрим игру m × n с матрицей P = (a ij ), i = 1, 2, ..., m; j = 1, 2, ..., n и определим наилучшую среди стратегий A 1 , A 2 , ..., A m . Выбирая стратегию A i игрок А должен рассчитывать, что игрок В ответит на нее той из стратегий B j , для которой выигрыш для игрока А минимален (игрок В стремится "навредить" игроку А ). Обозначим через α i , наименьший выигрыш игрока А при выборе им стратегии A i для всех возможных стратегий игрока В (наименьшее число в i -й строке платежной матрицы), т.е.

Среди всех чисел α i (i = 1, 2, ..., m) выберем наибольшее: . Назовем α нижней ценой игры , или максимальным выигрышем (максимином ). Это гарантированный выигрыш игрока А при любой стратегии игрока В . Следовательно,

13. Седловая точка.

Седловая точка - это наибольший элемент столбца матрицы игры, который одновременно является наименьшим элементом соответствующей строки (в игре двух лиц с нулевой суммой). В этой точке, следовательно, максимин одного игрока равен минимаксу другого; С. т. есть точка равновесия.

Понятие седловой точки

Если в игре с матрицей А нижнее и верхнее, чистые цены игры совпадают т.е. , то говорят, что эта игра имеет седловую точку, в чистых выражениях и чистую цену игры:

Седловая точка - это пара чистых стратегий (i 0 , j 0) первого и второго игрока, при котором достигается равенство .

В понятии седловой точки вложен следующий смысл:

если один из игроков придерживается стратегии, соответствующей седловой точки, то другой игрок не может поступить лучше, чем придерживаться стратегии, соответствующей седловой точки.

Отклонение первого игрока от седловой точки может приводить только к уменьшению его выигрыша.

Отклонение второго игрока от седловой точки может приводить к увеличению его проигрыша .

Седловой элемент - является минимальным элементом строки и максимальным элементом в столбце.

Для определения седлового элемента необходимо последовательно в каждой точке определить минимальный элемент, а затем проверять является ли он максимальным элементом столбца и если является, тогда таким образом найдена седловая точка - цена игры, оптимальные стратегии первого и второго игрока:

14. Оптимальные стратегии .

В матричной игре каждый из игроков выбирает свои стратегии, не имея сведений о действиях другого игрока. Выясним, на какие наилучшие гарантированные выигрыши они могут рассчитывать. Первый игрок, выбрав некоторую стратегию i, может получить в качестве выигрыша один из двух элементов аi1, аi2 матрицы А в зависимости от того, какую стратегию применит второй игрок. В худшем случае он должен рассчитывать на минимальный выигрыш, т. е. на

В то же время при удачном выборе стратегии i = i* первый игрок может получить максимальный выигрыш из минимальных:

Второй игрок рассуждает сходным образом. При выборе стратегии j его максимальный проигрыш из двух возможных а1 j, а2 j равен

Если выбор стратегии j = j* оказался удачным, то он может рассчитывать на минимальный проигрыш из максимальных:

Формулы (5.2), (5.3) определяют наилучшие гарантированные выигрыши игроков. Если они совпадают, то их общее значение можно считать приемлемым для игроков компромиссом, а соответствующие стратегии i*, j* - оптимальными стратегиями.

Непосредственные вычисления по формулам (5.2), (5.3) с использованием (5.1) дают

Здесь наилучшие гарантированные выигрыши не равны и оптимальных стратегий не существует.

Причина отсутствия оптимальных стратегий кроется, очевидно, в их определении. Попробуем изменить определение оптимальных стратегий, не упуская из вида игрового смысла задачи и целей игроков.

Рассмотрим с этих позиций игру со следующей платёжной матрицей:

Рассмотрим рассуждения, которыми руководствуется первый игрок. Если он сделает ход i=1, то наихудшей для него будет ситуация, когда второй игрок сделает ход j=3, так как в этом случае он получит 0. Если первый игрок сделает ход i=2, то в наихудшем случае (при ходе второго игрока j=1) он также получит 0. Аналогично, при i=3 он в наихудшем случае получит 4 (при j=2), при i=4 - 2 (при j=3) и, наконец, при i=5 он в наихудшем случае получит 0 (при j=3).

Стремясь сделать свой гарантированный выигрыш как можно больше, первый игрок должен выбрать ход i=3, так как в этом случае он гарантирует себе выигрыш, равный 4 (правда, и его максимальный выигрыш невелик - всего 5).

А теперь попробуем посмотреть на эту же матрицу с точки зрения второго игрока. Для него это –- матрица его проигрыша.

Если он выберет ход j=1, то его максимальный проигрыш будет равен 18 (если первый игрок сделает ход i=1). Аналогично, при j=2 его максимальный проигрыш будет равен 4, при j=3- – 8, и, наконец, при j=4 его максимальный проигрыш будет равен 25. Стремясь сделать свой максимальный проигрыш как можно меньше, второй игрок должен выбрать ход j=2, так как в этом случае его максимальный проигрыш, равный 4, самый маленький.

Итак, мы пришли к выводу, что первый игрок должен ходить i=3, а второй j=2. Допустим теперь, что второй игрок, как говорят, «открывает карты» и заявляет первому игроку: «Я буду делать ход j=2». Есть ли первому игроку необходимость менять свой ход? Нет, так как в этом случае его наилучший ход всё равно i=3.

Аналогично, если первый игрок заявит второму, что он будет ходить i=3, то второму игроку также нет смысла менять свой ход, так как наилучшим ответом будет всё равно j=2. Пара i=3, j=2 является, как говорят, уравновешенной парой, так как «открытие карт» игроками не даёт поводов противнику менять свою стратегию. Как говорят, пара i=3, j=2 есть решение игры, а величинавыигрыша при этом первого игрока (и одновременно величина проигрыша второго) - 4 – это цена игры .

Оформим всё это математически. Итак, пусть первый игрок выбирает ход i . В наихудшей для него ситуации он выиграет:

Стремясь сделать свой минимальный выигрыш максимальным, он выбирает свой ход из условия:

.

Такая стратегия называется максиминной , а величина α называется нижней ценой игры , или максимином .

Аналогично, второй игрок, выбирая ход j , в наихудшей для себя ситуации проигрывает:

Стремясь сделать свой максимальный проигрыш минимальным, он должен выбирать свой ход из условия:

Такая стратегия называется минимаксной , а величина β называется верхней ценой игры , или минимаксом .



Цена игры v всегда лежит между нижней ценой игры α и верхней ценой игры β .

Существуют игры, для которых нижняя цена игры равна верхней:

Эти игры занимают особое положение в теории игр и называются играми с седловой точкой. Общее обозначение нижней и верхней цены игры:

называется чистой ценой игры .

Седловая точка матрицы – элемент, который минимален в своей строке, но максимален в своём столбце. Это позволяет легко находить седловые точки матрицы.

Точка i =3, j =2, является седловой точкой. Элемент платежной матрицы a 32 =4 характеризовался именно тем свойством, что он был максимальным в своём столбце и минимальным в своей строке.

Некоторые вопросы, касающиеся седловых точек.

1. У матрицы быть несколько седловых точек, например у матрицы:

две седловых точки (i =1, j =1) и (i =1, j =3).

2. Не все матрицы имеют седловую точку, например у матрицы седловых точек нет.

Рассмотрим общие принципы решения игр двух лиц с нулевой суммой. На основании принципа разумности рекомендуется выбирать в качестве наилучшей стратегии ту, которая обеспечивает наибольший гарантированный выигрыш (то есть выигрыш, не зависящий от действий противника, выигрыш, который противник никоим образом не может уменьшить). Пусть игра определяется матрицей: . Игрок A имеет m чистых стратегий A i , а игрок B n чистых стратегий B j , . Паре стратегий

(A i , B j ) соответствует платеж C ij , выплачиваемый игроком B игроку A в конце игры, то есть выигрыш игрока A .

Если игрок A использует стратегию A i , то он получит выигрыш, по крайней мере равный , где минимум берется по всем стратегиям игрока B . И так как игрок A свободен в выборе своей стратегии, то для него естественно стремится к тому, чтобы сделать возможно большим; то есть стремится выбрать такую стратегию A i 0 , чтобы получить выигрыш не меньше, чем , где максимум берется по всем стратегиям игрока A .

Стратегия A i 0 называется максиминной стратегией игрока A . Это его наиболее осторожная стратегия, применение которой при любом поведении игрока B гарантирует игроку A выигрыш C ij не менее α . Величина α называется нижней ценой игры или максимином.

Игрок B, рассуждая таким же образом, выбирает стратегию B j 0 , при которой игрок A получит выигрыш не более чем . Стратегия B j 0 называется минимаксной стратегией игрока B . Это его наиболее осторожная стратегия, применение которой дает гарантию игроку B в том, что игрок A при любом своем поведении получает выигрыш не более чем . Величина называется верхней ценой игры или минимаксом.

Таким образом, при наиболее острожной игре игрок A должен применить максиминную, а игрок B минимаксную стратегии.

Принцип осторожности, которой диктует игрокам выбор таких стратегий называется принципом минимакса, а обе стратегии обобщенно минимаксными.

В каком же отношении находятся верхняя и нижняя цены игр. Можно показать, что для этих величин всегда справедливо неравенство

То есть нижняя цена игры всегда не больше верхней α ≤ β.

Если нижняя цена игры равна верхней, то есть если α = β , то те значения i 0, j 0 при которых это равенство достигается указывают оптимальные стратегии игроков A i 0 и B j 0 . В этом случае игрок A придерживаясь своей максиминной стратегии получает не менее чем v , а игрок B придерживаясь своей минимаксной стратегии помешает игроку A получить больше чем v .


Всякое отклонение от оптимальных стратегий невыгодно обоим игрокам, так как для любых стратегий A i и B j справедливы неравенства:

C i , j 0 ≤ C i 0, j 0 ≤ C i 0, j .

Элемент C i 0, j 0 называется седловой точкой матрицы C . Это название соответствует тому, что элемент C i 0, j 0 матрицы C является одновременно минимальным в своей строке и максимальным в своем столбце.

Этот элемент C i 0, j 0 = v называется ценой игры, а сама игра называется игрой с седловой точкой.

Пример. Рассмотрим игру с платежной матрицей.



Рассказать друзьям