Пример выполнения задания
Игра задана платежной матрицей А.
Для определения нижней цены игры V1 выберем в каждой строке платежной матрицы минимальный элемент, затем из полученного столбца выберем максимальный элемент. Получим нижнюю цену игры: V1=8.
Для определения верхней цены игры V2 выберем в каждом столбце матрицы максимальный элемент, тогда минимальный элемент из полученной строки и есть верхняя цена игры:V2=13.
Из условия V2>V1 следует, что игру необходимо проводить в смешанных стратегиях.
1) Пусть заданы вероятности использования противником своих стратегий: у = (0,2; 0,5; 0,3).
Необходимо определить оптимальное поведение и максимальный выигрыш первого игрока. Для этого рассчитаем его выигрыш в случае применения им всех своих стратегий по формуле:
При заданных условиях первый игрок должен применить свою третью стратегию, в этом случае он получит максимальный выигрыш равный 15,1.
2) Необходимо решить задачу 2x2, вычеркнув из заданной платежной матрицы столбец и строку таким образом, чтобы полученные в новой матрице V1 и V2 не совпадали. Например, вычеркнем из исходной матрицы третью строку и первый столбец, получим новую матрицу:
у которой
Решение задачи свелось к решению системы:
Используем формулу (1.3.2):
Вычислим выигрыш первого игрока:
Отсюда вывод: первому игроку следует использовать свои стратегии с частотой при этом его гарантированный выигрыш будет равен 12,19 ед., что существенно выше чем V1=8.
Для второго игрока решение сведется к системе:
Используя смешанные стратегии с частотой второй игрок может понизить свой гарантированный протгрыш с 16 ед. до 12,19 ед.
3) Игра 3x3.
Любая игра n x m сводится к задаче линейного программирования. Для первого игрока ограничения и целевая функция выглядят следующим образом:
Для решения полученной задачи используем симплекс-метод, реализованный в программе LINPROG. При этом получим оптимальное решение:
Из полученных результатов следует, что максимальный гарантированный выигрыш первого игрока составит 11,6959 при условии, что он будет применять свою первую стратегию с частотой x1* = 0,6035, вторую - с частотой x2* 0,2316 и третью - с частотой x3* 0,1649.
Для второго игрока задача линейного программирования является двойственной к предыдущей и имеет вид:
Для решения использовалась программа LINPROG. Полученное оптимальное решение имеет вид:
Из полученных результатов следует, что минимальный гарантированный проигрыш второго игрока составит 11,6959 в случае если он будет использовать свою первую стратегию с частотой y1* = 0,5123, вторую - с частотой y2* = 0,2070, третью - с частотой y3* = 0,0240.
|