Как сделать платежную матрицу

Обновлено: 07.07.2024

Платежная матрица – это метод статистической теории принятия решений, способствующий выбору руководителем правильного варианта.

Сущность игровых моделей

Математическая модель какой-либо конфликтной ситуации – это игра, стороны, принимающие участие в конфликте, - это игроки, а исход конфликта – это выигрыш.

Каждая формализованная игра имеет свои правила, т.е. систему условий, определяющих:

  • Варианты решений игроков;
  • Количество информации у каждого игрока о партнерах;
  • Выигрыш, который является следствием совокупности действий.

Обычно выигрыш (проигрыш) задается количественно, к примеру, проигрыш оценивается нулем, а выигрыш – единицей, ничья – это 1/2. Количественная оценка исхода игры – это платеж.

Игра будет парной, когда в ней принимают участие два игрока, а множественной, когда число игроков превышает два.

Игра будет называться игрой с нулевой суммой в случае, если выигрыш одного игрока равняется проигрышу второго, т.е. сумма выигрышей двух сторон равна 0. Чтобы полностью задать игру, достаточно определить величину одного. Если обозначить за $a$ выигрыш одного игрока, за $b$ выигрыш другого, то игра с нулевой суммой будет равняться $b = – a$. В данном случае достаточно рассмотреть $а$.

Определение и осуществление какого-либо действия, предусмотренного правилами игры, называется ходом игроков. Ход может быть личным или случайным. При личном ходе игрок сознательно выбирает одно из возможных действий. Состав возможных вариантов регламентируется правилами игры, а зависит от совокупности предыдущих ходов обеих сторон.

Случайным ходом является случайно совершенное действие, к примеру, выбор карты из колоды.

Некоторые игры состоят только лишь из случайных ходов, например, азартные, а некоторые – только из личных, примером которых являются шашки, шахматы. Многие карточные игры относятся к играм смешанного типа, содержащим и случайные, и личные ходы.

Готовые работы на аналогичную тему

Основное понятие теории игр – это понятие стратегии. Под стратегией игрока следует понимать совокупность правил, которые определяют выбор его действий при личном ходе в зависимости от ситуации. Игра будет конечной, если каждый игрок имеет определенное число стратегий, при обратной ситуации – бесконечной.

Чтобы отыскать решение игры, необходимо для каждого игрока определить стратегию, удовлетворяющую условиям оптимальности, другими словами, один игрок должен получить максимальный выигрыш, тогда как второй придерживается заданной стратегии. Проигрыш второго игрока должен быть минимальным, если первый следует своей стратегии. Данные стратегии являются оптимальными и должны удовлетворять условиям устойчивости, т.е. для любого игрока будет невыгодно отказываться от своей стратегии в данной игре.

Платежная матрица игры

Парная игра с нулевой суммой удобнее исследуется, если она представлена в матричном виде. Допустим, что игрок $A$ располагает m стратегиями $A_1, A_2, …, A_m$, а игрок $B$, т.е. противник, - $n$ стратегиями $B_1, B_2, …, B_n$. Данная игра будет называться игрой с размерностью $m * n$.

Предположим, что игрок $A$ выбрал одну стратегию $A_j$. Игрок $B$, не обладая информацией о результатах выбора игрока $A$, выбрал себе стратегию $B_j$. Каждой паре стратегий ($A_j, B_j$) присущ платеж $a(ij)$ первому игроку от второго, т.е. выигрыш игрока $A$. Выигрыш игрока $B$ будет равен $–a(ij)$. Подобная игра называется матрицей, а матрица, которая составлена из значений $a(ij)$, называется платежной. Строки такой матрицы соответствуют выбранной стратегии игрока $A$, а столбцы – стратегии игрока $B$. В общем виде платежная матрица игры имеет вид (рисунок 1):

Рисунок 1. Платежная матрица. Автор24 - интернет-биржа студенческих работ

С помощю этого онлайн калькулятора можно решить задачу теории игр. Для решения задачи теории игр задайте количество строк и количество столбцов матрицы. Затем введите данные в ячейки и нажимайте на кнопку "Вычислить". Теоретическую часть смотрите ниже.

Предупреждение

Теория игр − теоретическая часть

Бывают ситуации, в которых сталкиваются интересы двух и более сторон. При этом эффективность принимаемого решения одной стороны зависит от действий другой стороны. Такие ситуации называются конфликтными. Конфликтная ситуация называется антагонистической, если увеличение выигрыша одной стороны на определенную величину приводит к уменьшению выигрыша другой стороны на такую же величину. Математическая модель таких ситуаций описывается матричной игрой. Участники игры (т.е. лица, принимающие решение) называются игроками. Принятие игроком того или иного решения в процессе игры и его реализация называется ходом. Ходы могут быть личными (т.е. сознательными) и случайными. Стратегия игрока − осознанный выбор одного из множества вариантов его действий. Стратегия называется чистой, если выбор игрока неизменен от партии к партии. У первого игрока есть m чистых стратегий, а у второго игрока n чистых стратегий. Если множество стратегий игроков конечный, то игра называется конечной, а если хотя бы у одного игрока множество стратегий бесконечно, то игра называется бесконечной. Стратегия игрока называется оптимальной, если она обеспечивает данному игроку (при многократном повторении) максимально возможный средний выигрыш или минимально возможный средний проигрыш.

Игры, в которых учавствуют 2 игрока, называются парными, а игры с большим числом участников − множественными. Если в парной игре выигрыш одной стороны точностью совпадает с проигрышем другой стороны, то игра называется игрой с нулевой суммой.

В зависимости от вида функций выигрышей, игры бывают матричные, биматричные, непрерывные, выпуклые и др.

Рассмотрим матричную игру двух участников с нулевой суммой и конечным числом возможных ходов.

Решение матричной игры в чистых стратегиях

Пусть игроки A и B распологают конечным числом возможных действий (чистых стратегий). Обозначим их через и , соответственно. Игрок A может выбрать чистую стратегию . В ответ на этот выбор, игрок B может выбрать чистую стратегию . Выбор стратегии первого игрока и ответный выбор стратегии игрока B единственным образом определяет результат aij выигрыш игрока A или проигрыш игрока B.

Таким образом игра с нулевой суммой однозначно определяется матрицей

которая называется платежной матрицей или матрицей выигрышей. Строки матрицы (1) определяют стратегии первого игрока (), а столбцы соответствуют стратегиям второго игрока ().

Игра проходит партиями. Партия начинается с первого игрока. Он выбирает некоторую строку i матрицы. В ответ на это второй игрок выбирает некоторый столбец j. На этом заканчивается партия и второй игрок платит первому сумму aij, если aij>0 или первый игрок платит сумму aij второму игроку, если aij Теорема 1. В матричной игре нижняя цена игры не превосходит верхней цены, т.е. α ≤ β.

Если для чистых стратегий Ak и Bl игроков A и B имеет место равенство α = β, то пару чистых стратегий (Ak,Bl) называют седловой точкой матричной игры а γ=α = β чистой ценой игры. Элемент akl называют седловым элементом платежной матрицы.

Заметим, что отклонение игрока A от максимальной стратегии Ak ведет к уменьшению его выигрыша, а отклонение игрока B от минимальной стратегии Bl ведет к увеличению его проигрыша. Поэтому Ak и Bl являются оптимальными чистыми стратегиями игроков A и B, соответственно.

Тройку (Ak, Bl, γ) называют решением матричной игры. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях.

Решение матричной игры в смешанных стратегиях

Если матричная игра не имеет седловой точки, то α ≠ β, и, Теорему 1, получим: α * и q * называются оптимальными, если они образуют седловую точку для платежной функции M(p,q), т.е.

Значение платежной функции при оптимальных смешанных стратегиях p * и q * называют ценой игры:

Теорема 2 (Основная теорема теории матричных игр). В любой матричной игре у игроков есть оптимальные смешанные стратегии.

Доказательство. Пусть игра имеет платежную матрицу

где все элементы положительны.

Пусть и − смешанные стратегии игроков A и B , соотвестстенно.

Математическое ожидание выигрыша игрока A равна:

При любом выборе игроками своих смешанных стратегий p и q, математическое ожидание будет положительным, так как все элементы aij платежной матрицы положительны, pi неотрицательные числа и среди них есть хотя бы одно положительное число, qj неотрицательные числа и среди них есть хотя бы одно положительное число.

Нижняя цена игры

так как aij >0, i=1,2. m, j=1,2. n. Поскольку α>0 и γ не может быть меньше нижней цены игры, то γ ≥ α, а так как α>0, то γ >0.

Пусть игрок A выбирает такую стратегию p, что математическое ожидание его выигрыша независимо от того, какую стратегию выбирает игрок B было не меньше некоторой величины γ:


где pi >0, i=1,2. m, . Каждая строка в системе линейных неравенств (3) соотвесттвует определенной стратегии игрока B.

Преобразуем систему нерравенств (3), введя новые обозначения:

Разделим все неравенства системы (3) на положительное число γ. Тогда имеем:

yi >0, i=1,2. m.

Цель игрока A − максимизировать свой гарантированный выигрыш γ или минимизировать величину

Таким образом, приходим к следующей задаче линейного программирования:

Сделав аналогичные рассуждения с позиции игрока B, получим следующую задачу линейного программирования:

Покажем, что задачи линейного программирования (4) и (5) имеют допустимые решения. Так как aij >0, то можно подобрать достаточно большие положительные числа yi, i=1,2. m так, чтобы выполнялись неравенства (4b). Значит задача линейного программирования (4) имеет допустимое решение.

Допустимое решение задачи линейного программирования (5) является нулевой вектор. Таким образом, пары двойственных задач линейного программирования (4) и (5) имеют допустимые решения. Тогда, согласно теории двойственных задач линейного программирования, обе эти задачи имеют оптимальные планы , , при этом оптимальные значения целевых функций данных задач равны:

Цена игры равна:

Найдем оптимальные смешанные стратегии игроков:



,


.


Пара образует седловую точку данной матричной игры в смешанных стратегиях.


Если в матрице есть отрицательные элементы или нули, то можно сделать матрицу положительным, добавив к каждому элементу матрицы достаточно большое положительное число r. Тогда получим следующую матрицу A'(aij+r).

Математическое ожидание выигрыша игрока A с платежной матрицей A(aij):


Математическое ожидание игрока A с платежной матрицей A'(aij+r):






Игра с платежной матрицей A' имеет седловую точку в смешанных стратегиях:



Следовательно, игра с платежной матрицей A также имеет седловую точку в смешанных стратегиях а цена игры с платежной матрицей A равна:


.

Для рассмотрения численного примера матричной игры, введите в калькуляторе в начале страницы элементы матрицы и нажмите на кнопку вычислить. Онлайн калькулятор выдаст подробное рашение задачи.


Рассмотрим парную конечную игру. Пусть игрок А располагает т личными стратегиями, которые обозначим

. Пусть у игрока В имеется п личных стратегий, обозначим их. Говорят, что игра имеет размерность т х п.


В результате выбора игроками любой пары стратегий однозначно определяется исход игры, т.е. выигрыш а;. игрока А (положительный или отрицательный) и проигрыш (-ау) игрока В. Предположим, что значения а.. известны для любой пары стратегий (А:, В;.). Матрица Р = (a..), i = = 1, 2, . m j = 1, 2, . п, элементами которой являются выигрыши, соответствующие стратегиям А. и Bj, называется платежной матрицей, или матрицей игры. Общий вид такой матрицы представлен в табл. 12.1. Строки этой таблицы соответствуют стратегиям игрока А, а столбцы – стратегиям игрока В.

Таблица 12.1


























Составим платежную матрицу для следующей игры.

Игрок А может спрятаться в одном из двух убежищ (I и II); игрок В ищет игрока А, и если найдет, то получает штраф 1 ден. ед. от А, в противном случае платит игроку А 1 ден. ед. Необходимо построить платежную матрицу игры.


. ►

Рассмотрим игру т х п с матрицей Р =aj>, i = 1,2, . τη; j = 1, 2, . и и определим наилучшую среди стратегий Ау Av . Ат. Выбирая стратегию Ajy игрок А должен рассчитывать, что игрок В ответит на нее той из стратегий В., для которой выигрыш для игрока А минимален (игрок В стремится "навредить" игроку А).

Обозначим через а; наименьший выигрыш игрока А при выборе им стратегии Л; для всех возможных стратегий игрока В (наименьшее число в i-й строке платежной матрицы), т.е.


(12.1)


Среди всех чисел а (г = 1,2. т) выберем наибольшее: . Назовем а нижней ценой игры, или максимальным выигрышем (максимином). Это гарантированный выигрыш игрока А при любой стратегии игрока В. Следовательно,


(12.2)

Стратегия, соответствующая максимину, называется максиминной стратегией. Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А; выбирая стратегию В., он учитывает максимально возможный при этом выигрыш для А. Обозначим


(12.3)


Среди всех чисел β. выберем наименьшее,

и назовем β верхней ценой игры, или минимаксным выигрышем (минимаксом). Это гарантированный проигрыш игрока В. Следовательно,


(12.4)

Стратегия, соответствующая минимаксу, называется минимаксной стратегией.

Принцип, диктующий игрокам выбор наиболее "осторожных" минимаксной и максиминной стратегий, называется принципом минимакса. Этот принцип следует из разумного предположения, что каждый игрок стремится достичь цели, противоположной цели противника. Определим нижнюю и верхнюю цены игры и соответствующие стратегии в задаче 12.1. Рассмотрим платежную матрицу


из задачи 12.1. При выборе стратегии Л, (первая строка матрицы) минимальный выигрыш равен a, =min(-l; 1) = -1 и соответствует стратегии β1 игрока В. При выборе стратегии Л2 (вторая строка матрицы) минимальный выигрыш равен а2 = min(l; -1) = -1, он достигается при стратегии В.

Гарантируя себе максимальный выигрыш при любой стратегии игрока В, т.е. нижнюю цену игры а = тах(а,, а2) = = max(-l; -1) = -1, игрок А может выбирать любую стратегию: Aj или А2, т.е. любая его стратегия является максиминнои.

Выбирая стратегию В, (столбец 1), игрок В понимает, что игрок А ответит стратегией А2, чтобы максимизировать свой выигрыш (проигрыш В). Следовательно, максимальный проигрыш игрока В при выборе им стратегии В, равен β, = шах(-1; 1) = 1.

Аналогично максимальный проигрыш игрока В (выигрыш А) при выборе им стратегии В2 (столбец 2) равен β2 = max(l; -1) = 1.

Таким образом, при любой стратегии игрока А гарантированный минимальный проигрыш игрока В равен β = = πιίη(β1, β2) = min(l; 1) = 1- верхней цене игры.

Любая стратегия игрока В является минимаксной. Дополнив табл. 12.1 строкой β; и столбцом а;, получим табл. 12.2. На пересечении дополнительных строки и столбца будем записывать верхнюю и нижнюю цены игр.

Во многих практических задачах возникают ситуации, когда требуется принять решение, не имея достаточной информации. Неизвестными могут быть как условия осуществления какой-либо операции, так и сознательные действия лиц, от которых зависит успех этой операции.

· Ситуации, в которых сталкиваются интересы двух сторон и результат любой операции, осуществляемой одной стороной, зависит от действий другой стороны, называются конфликтными.

· Математическая модель конфликтной ситуации называется игрой, а математическая теория, помогающая принимать рациональные решения в конфликтной ситуации, - теорией игр.

· Конфликтующие стороны называются игроками, а действия, которые могут выполнять игроки, - стратегиями.

От реальной ситуации игра отличается тем, что в игре противники действуют по строго определенным правилам.

· Матричной игрой называется игра, осуществляемая по следующим правилам:

1. В игре участвуют два игрока;

2. Каждый из игроков обладает конечным набором стратегий;

3. Игра заключается в том, что каждый из игроков, не имея информации о действиях противника, делает один ход (выбирает одну из своих стратегий). Результатом выбора игроками стратегий является выигрыш и проигрыш в игре.

4. И выигрыш, и проигрыш выражаются числами.

· Матричная игра называется игрой с нулевой суммой, если в этой игре выигрыш одного игрока равняется проигрышу другого игрока.

Каждая матричная игра с нулевой суммой имеет платежную матрицу. Для того чтобы построить эту матрицу, обозначим одного из игроков символом А, а другого – символом В, и предположим, что А1, А2,…, Аm – стратегии, которые может применять игрок А, а В1, В2,…, Вn – стратегии, которые может применять игрок В.


· Матричная игра, в которой у игрока А имеется m стратегий, а у игрока В – n стратегий, называется игрой типа .


,


у которой элементы равны выигрышам игрока А (и проигрышам игрока В) при применении игроками стратеги Ai и Bj соответственно.

· Матрица С называется платежной матрицей игры.

Составить платежную матрицу игры.


Решение.Поскольку каждый из игроков может открыть 1, 2, 3, 4 или 5 пальцев, то у каждого из них имеется по 5 соответствующих стратегий: стратегии А1, А2, А3, А4, А5 у первого игрока, и В1, В2, В3, В4, В5 – у второго. Таким образом, рассматриваемая игра является матричной игрой типа , и можно составить таблицу выигрышей, в зависимости от стратегий, применяемых игроками (Таблица 2.1.1):


Из таблицы 1.1 следует, что платежная матрица игры имеет вид


.

Парную игру с нулевой суммой удобно исследовать, если она описана в виде матрицы.

Предположим, что игрок A имеет m стратегий (обозначим их А1, А2, …, Am), а игрок B (противник) - n стратегий (B1, B2, …, Bm). Такая игра называется игрой размерности m х n. Пусть игрок A выбрал одну из своих возможных стратегий Ai. Игрок B, не зная результата выбора игрока A, выбрал стратегию Bj. Для каждой пары стратегий (Ai, Bj) определен платеж aij второго игрока первому, т.е. выигрыш игрока A. Выигрышем игрока B будет соответственно (- aij). Никакой дискриминации по отношению ко второму игроку здесь нет, т. к. величины aijмогут быть и отрицательны, тогда -aij > 0. Например, a13 = -2 - выигрыш A, -a13 = 2 - выигрыш B. Такая игра называется матричной; матрица, составленная из чисел aij , называется платежной. В примере 1 платежная матрица имеет вид


Строки этой матрицы соответствуют стратегиям игрока A, а столбцы - стратегиям игрока B. Общий вид такой матрицы

ПРИМЕР. Игроки A и B играют в следующую игру. Игрок A записывает одно из чисел 3, 7, 8, а игрок Bзаписывает одно из чисел 4, 5. Если сумма чисел четная, то это выигрыш игрока A. Если сумма чисел нечётная, то это выигрыш игрока B (проигрыш игрока A). Найти платёжную матрицу и оптимальное решение.

Решение. Если сумма чисел чётная, игрок A получает выигрыш +1, иначе игрок B получает выигрыш +1 (т.е. Aполучает выигрыш -1). Платежная матрица:

Далее решение ищем с помощью калькулятора.

Методы упрощения платёжных матриц. Доминирование и дублирование стратегий

Рассмотрим несколько методов упрощения платёжных матриц.

Первый метод, используемый для уменьшения размерности матрицы, основан на одном из важнейших понятий в теории игр - понятии доминирования стратегий.

Если i-я строка поэлементно не меньше (?) j-й строки, то говорят, что i-я строка доминирует над j-й строкой. Поэтому игрок A не использует j-ю стратегию, так как его выигрыш при i-й стратегии не меньше, чем при j-й стратегии, вне зависимости от того, как играет игрок B.

Аналогично, если i-й столбец поэлементно не меньше (?) j-го столбца, то говорят, что j-й столбец доминирует над i-м столбцом. Поэтому игрок B не использует i-ю стратегию, так как его проигрыш (равный выигрышу игрока A) при j-й стратегии не больше (?), чем при i-й стратегии, вне зависимости от того, как играет игрок A. Стратегии, над которыми доминируют другие стратегии, надо отбросить и приписать им нулевые вероятности. На цене игры это никак не скажется. Зато размер матрицы игры понизится. С этого и нужно начинать решение игры.

Частный случай доминирования является дублирование стратегий.

Если платёжная матрица игры содержит несколько одинаковых строк (столбцов), то из них оставляем только одну строку, а остальные строки (столбцы) отбрасываем. Отброшенным стратегиям припишем нулевые вероятности.

Упрощение (уменьшение размерности) платёжных матриц за счёт исключения заведомо невыгодных чистых стратегий возможно в силу справедливости следующей Теоремы о доминирующих стратегиях:

Пусть I - игра, в матрице которой i -я стратегия первого игрока доминирует над i +1, а G - игра, матрица которой получена из матрицы I исключением i + 1 стратегии (строки). Тогда:

  • 1. цена игры I равна цене игры G;
  • 2. оптимальная смешенная стратегия Q*= (q1*,q2*,…,qn*) второго игрока в игре G является также его оптимальной смешанной стратегией в игре I;
  • 3. если P*= (p1*,p2*,…,pi*, p*i+2,…, pm*) оптимальная смешенная стратегия первого игрока в игре G, то его смешенная стратегия P*= (p1*,p2*,…,pi*, p*i+2,…, pm*) является оптимальной в игре I.

Из выше сказанного следует, что как первому, так и второму нет смысла использовать доминируемую стратегию, поэтому все доминируемые стратегии могут быть отброшены, т.е. фактически отброшены строки и столбцы исходной матрицы A, соответствующие этим строкам. Это преобразование уменьшает размерность исходной платёжной матрицы A, тем самым упрощается поиск оптимального решения.

Рассмотрим ряд примеров с использованием калькулятора.

В общем случае V* ? V* - седловой точки не существует. Оптимальное решение в чистых стратегиях также не существует. Однако, если расширить понятие чистой стратегии введением понятия смешанной стратегии, то удаётся реализовать алгоритм нахождения оптимального решения не вполне определённой игровой задачи, аналогичный рассмотренному выше. В такой ситуации предлагается использование статистического (вероятностного) подхода к нахождению оптимального решения антагонистической игры. Для каждого игрока, наряду с данным набором возможных для него стратегий, вводится неизвестный вектор вероятностей (относительных частот), с которыми следует применять ту или иную стратегию.

Обозначим вектор вероятностей (относительных частот) выбора заданных стратегий игрока A следующим образом:

где pi? 0, p1 + p2 +…+ pm= 1. Величина pi называется вероятностью (относительной частотой) применения стратегии Ai.

Аналогично для игрока B вводится неизвестный вектор вероятностей (относительных частот) имеет вид:

где qj? 0, q1 + q2 +…+ qn = 1. Величина qj называется вероятностью (относительной частотой) применения стратегии Bj. Совокупность (комбинация) чистых стратегий A1, A2, …Am и B1, B2, …Bn в сочетании с векторами вероятностей выбора каждой из них называются смешанными стратегиями.

Основной теоремой в теории конечных антагонистических игр является Теорема фон Неймана: каждая конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.

Из этой теоремы следует, что не вполне определённая игра имеет хотя бы одно оптимальное решение в смешанных стратегиях. В таких играх решением будет пара оптимальных смешанных стратегий P* и Q*, таких, что если один из игроков придерживается своей оптимальной стратегии, то и другому игроку не выгодно отклоняться от своей оптимальной стратегии.

Средний выигрыш игрока A определяется математическим ожиданием:


Если вероятность (относительная частота) применения стратегии отлична от нуля, то такая стратегия называется активной.

Стратегии P*, Q* называются оптимальными смешанными стратегиями, если

MA(P, Q*) ? MA(P*, Q*) ? MA(P*, Q)

В этом случае MA(P*, Q*) называется ценой игры и обозначается через V (V* ? V ? V*). Первое из неравенств (1)означает, что отклонение игрока A от своей оптимальной смешанной стратегии при условии, что игрок B придерживается своей оптимальной смешанной стратегии, приводит к уменьшению среднего выигрыша игрока A. Второе из неравенств означает, что отклонение игрока B от своей оптимальной смешанной стратегии при условии, что игрок A придерживается своей оптимальной смешанной стратегии,приводит к увеличению среднего проигрыша игрока B.

Решение игры в смешанных стратегиях геометрическим методом

Пусть игра задана платежной матрицей


По оси абсцисс отложим единичный отрезок А1 А2, где точкаА1 (0, 0) изображает стратегию А1, А2 (1, 0) - стратегию А2, а каждая промежуточная точка SA этого отрезка изображает смешанную стратегию первого игрока PA = (p1, p2), где p1- расстояние от точки SA до A2, p2-расстояние от точки SA до A1. Выигрыш игрока A будем откладывать на вертикальных отрезках.


Случай 1. Если игрок B применит стратегию В1, то выигрыш игрока A при стратегии А1 равен а11, поэтому на оси ординат отложим отрезок А1В1 = а11. При применении игроком A стратегии А2 выигрыш равен а21, отложим этот отрезок на перпендикуляре из точки А2, обозначим полученную точку В1'. Ордината любой точки М1 отрезкаВ1В1? равна среднему выигрышу игрока A при применении смешанной стратегии SA (действительно, этот выигрыш равен математическому ожиданию случайной величины, т.е. a11p1 + a21p2). Запишем уравнение прямой В1В1?:


тогда при x = p2 получим

y = a11 + p2a21 - p2a11 = a11(1-p2) + p2a21 = a11p1 + a21p2

Случай 2. Если игрок B применяет стратегию В2, то аналогично откладываем отрезки а12 и а22 и получаем отрезок В2В2?. Ордината любой точки М2 отрезка В2В2? - выигрыш игрока A, если A применяет смешанную стратегию SA, а B - стратегию В2.

Построим нижнюю границу выигрыша игрока А - ломаную В1 NВ2?. Ординаты точек этой ломаной показывают минимальные выигрыши игрока А при использовании им любой смешанной стратегии. Оптимальное решение игры определяет точка N, в которой выигрыш игрока А принимает наибольшее значение. Ордината точки Nравна цене игры. Проекция этой точки на ось ОХ показывает оптимальную стратегию (р1, р2).

Аналогично находится оптимальная стратегия Q = (q1 , q2) игрока B, только в соответствии с принципом минимакса надо находить верхнюю границу выигрыша, т. е. строить ломаную А2NА1? и брать точку N с наименьшей ординатой.

Абсцисса точки N определяет оптимальную стратегию игрока B, т. е. Q = (q1 , q2).


Пример. Решить игру, заданную платежной матрицей , графоаналитическим способом.


Решение. Нижняя цена игры a = 1,5, верхняя цена игры b = 2. Так как , седловой точки нет. Так как a1 = 1,5, a21 = 2 строим точки B1(0;1,5) и B2(1;2), соединяем их отрезком. Так как a21 = 3, a22 = 1 строим точки B2(0;3) и B2'(1;1), соединяем их отрезком.


Уравнение прямой В1В1?:


уравнение В2В2?:


Найдем точку N пересечения прямых В1В1? и В2В2?, для чего решим систему уравнений:


т. е. N(0,6; 1,8), откуда p2= 0,6; p1= 0,4; г = 1,8 - цена игры. Аналогично строим точки А1(0; 1,5) и А1?(1;3), А2(0; 2) и А2?(1; 1) и находим точку M пересечения прямых А1А1? иА2А2?.


Ответ: смешанная стратегия игрока А: PA= (0,4; 0,6), игрока В: QB = (0,8; 0,2); цена игры 1,8.

Читайте также: