Теоретические сведения
Основные понятия теории матричных игр
На практике часто приходится сталкиваться с задачами, в которых необходимо принимать решения в условиях неопределенности, т. е. возникают ситуации, в которых две (или более) стороны преследуют различные цели, а результаты любого действия каждой из сторон зависят от мероприятий партнера.
В экономике конфликтные ситуации встречаются очень часто и имеют многообразный характер. К ним относятся, например, взаимоотношения между поставщиком и потребителем, покупателем и продавцом, банком и клиентом. Во всех этих примерах конфликтная ситуация порождается различием интересов партнеров и стремлением каждого из них принимать оптимальные решения, которые реализуют поставленные цели в наибольшей степени. При этом каждому приходится считаться не только со своими целями, но и с целями партнера, и учитывать неизвестные заранее решения, которые эти партнеры будут принимать.
Для решения задач с конфликтными ситуациями разработаны математической теорией конфликтных ситуаций, которая носит название теория игр.
Приведем основные понятия теории игр. Математическая модель конфликтной ситуации называется игрой, стороны, участвующие в конфликте ? игроками, а исход конфликта ? выигрышем. Для каждой формализованной игры вводятся правила, т. е. система условий, определяющая: 1) варианты действий игроков; 2) объем информации каждого игрока о поведении партнеров; 3) выигрыш, к которому приводит каждая совокупность действий. Как правило, выигрыш (или проигрыш) может быть задан количественно.
Игра называется парной, если в ней участвуют два игрока, и множественной, если число игроков больше двух. Рассматривать будем только парные игры. В них участвуют два игрока А и В, интересы которых противоположны, а под игрой будем понимать ряд действий со стороны А и В.
Игра называется игрой с нулевой суммой, или антагонистической, если выигрыш одного из игроков равен проигрышу другого.
Выбор и осуществление предусмотренных правилами действий называется стратегией игрока.
Целью теории игр является определение оптимальной стратегии для каждого игрока. При выборе оптимальной стратегии естественно предполагать, что оба игрока ведут себя разумно с точки зрения своих интересов.
Рассмотрим парную конечную игру. Пусть игрок А располагает m стратегиями, которые обозначим . У игрока В имеется п стратегий, обозначим их .
В этом случае игра имеет размерность 2x2. В результате выбора игроками любой пары стратегий
однозначно определяется исход игры, т. е. выигрыш aij игрока А (положительный или отрицательный) и проигрыш (-aij) игрока В. Предположим, что значения aij известны для любой пары стратегий (Ai,Bj). Матрица элементами которой являются выигрыши, соответствующие стратегиям Ai и Bj, называется платежной матрицей. Строки этой матрицы соответствуют стратегиям игрока А, а столбцы ? стратегиям игрока В.
Рассмотрим игру m x n с матрицей и определим наилучшую среди стратегий . Выбирая стратегию Аi игрок А должен рассчитывать, что игрок В ответит на нее той из стратегий Bj, для которой выигрыш для игрока А минимален (игрок В стремится "навредить" игроку А).
Обозначим через , наименьший выигрыш игрока А при выборе им стратегии Аi для всех возможных стратегий игрока В (наименьшее число в i-й строке платежной матрицы), т. е.
(1.1.1)
Среди всех чисел (i=1,2,..,m) выберем наибольшее: . Назовем V1 нижней ценой игры или максиминным выигрышем (максимином). Это гарантированный выигрыш игрока А при любой стратегии игрока В. Следовательно,
(1.1.2)
Стратегия, соответствующая максимину, называется максиминной стратегией. Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А; выбирая стратегию Вj он учитывает максимально возможный при этом выигрыш для А. Обозначим
(1.1.3)
Среди всех чисел выберем наименьшее и назовем V2 верхней ценой игры или минимаксным выигрышем (мииимаксом). Это гарантированный проигрыш игрока В. Следовательно,
(1.1.4)
Простые рассуждения позволяют понять, что всегда V1<=V2. При V1=V2 гарантированный 1-му игроку выигрыш совпадает с тем выигрышем, выше которого второй игрок в состоянии не допустить выигрыша 1-го игрока, т. е. имеет место некоторое равновесие, которым игроки и должны удовлетвориться (при осторожной игре, без риска, так как отступление от этого поведения грозит возможным наказанием, уменьшением выигрыша или увеличением потерь). Эта ситуация отвечает наличию у платежной матрицы «седлового элемента» - максимального в столбце и минимального в строке.
В остальных случаях V1<V2 и возникает вопрос: нельзя ли увеличить гарантированный выигрыш и добиться того, чтобы выигрыш V был между нижней и верхней ценой игры V1<V<V2?
|