Главная страница
Содержание
 
 

Пример выполнения задания


Игра задана платежной матрицей А.

Для определения нижней цены игры V1 выберем в каждой строке платежной матрицы минимальный элемент, затем из полученного столбца выберем максимальный элемент. Получим нижнюю цену игры: V1=8.

Для определения верхней цены игры V2 выберем в каждом столбце матрицы максимальный элемент, тогда минимальный элемент из полученной строки и есть верхняя цена игры:V2=13.

Из условия V2>V1 следует, что игру необходимо проводить в смешанных стратегиях.

1) Пусть заданы вероятности использования противником своих стратегий: у = (0,2; 0,5; 0,3).

Необходимо определить оптимальное поведение и максимальный выигрыш первого игрока. Для этого рассчитаем его выигрыш в случае применения им всех своих стратегий по формуле:

При заданных условиях первый игрок должен применить свою третью стратегию, в этом случае он получит максимальный выигрыш равный 15,1.

2) Необходимо решить задачу 2x2, вычеркнув из заданной платежной матрицы столбец и строку таким образом, чтобы полученные в новой матрице V1 и V2 не совпадали. Например, вычеркнем из исходной матрицы третью строку и первый столбец, получим новую матрицу:

у которой

Решение задачи свелось к решению системы:

Используем формулу (1.3.2):

Вычислим выигрыш первого игрока:

Отсюда вывод: первому игроку следует использовать свои стратегии с частотой при этом его гарантированный выигрыш будет равен 12,19 ед., что существенно выше чем V1=8.

Для второго игрока решение сведется к системе:

Используя смешанные стратегии с частотой второй игрок может понизить свой гарантированный протгрыш с 16 ед. до 12,19 ед.

3) Игра 3x3.

Любая игра n x m сводится к задаче линейного программирования. Для первого игрока ограничения и целевая функция выглядят следующим образом:

Для решения полученной задачи используем симплекс-метод, реализованный в программе LINPROG. При этом получим оптимальное решение:

Из полученных результатов следует, что максимальный гарантированный выигрыш первого игрока составит 11,6959 при условии, что он будет применять свою первую стратегию с частотой x1* = 0,6035, вторую - с частотой x2* 0,2316 и третью - с частотой x3* 0,1649.

Для второго игрока задача линейного программирования является двойственной к предыдущей и имеет вид:

Для решения использовалась программа LINPROG. Полученное оптимальное решение имеет вид:

Из полученных результатов следует, что минимальный гарантированный проигрыш второго игрока составит 11,6959 в случае если он будет использовать свою первую стратегию с частотой y1* = 0,5123, вторую - с частотой y2* = 0,2070, третью - с частотой y3* = 0,0240.