Примеры конечных игр. Принцип минимакса
Приведем несколько примеров конечных игр. Каждую из них мы запишем
в нормальной форме. Рассматривается игра, которую назовем "Поиск".
В ней участвуют две стороны: К и С. K хочет найти С; С,
наоборот, хочет спрятаться от K.
У С есть два места - убежища I и II, где он может прятаться.
Выбирает он себе любое убежище. Игрок K по правилам игры тоже может
искать С где ему вздумается. Если он нашел С, то С проиграл
одно очко, если не нашел, т. е. пошел не в то убежище, где спрятался
С, то, наоборот, K проиграл одно очко. Требуется записать игру в
нормальной форме.
Решение. У К. - две стратегии: K1 - искать в
убежище I, K2 - искать в убежище II. У
С - тоже две стратегии: С1- прятаться в убежище
I, С2 - прятаться в убежище II.
|
С1 |
С2 |
С3 |
C4 |
К1,2 |
50% |
50% |
75% |
75% |
К3 |
100% |
100% |
50% |
50% |
Поступим так же со стратегиями "синих", т. е. объединим C1
и С2, С3 и C4. Получим игру
2 X 2:
|
С1,2 |
С3,4 |
К1,2 |
50% |
75% |
К3,4 |
100% |
50% |
Решение этой игры будет:
Ответ к стр. 416.
т. е. "красные" должны одинаково часто применять каждую из своих
стратегий (К12- ставить оба отряда на какую-то
одну из дорог и K3 - ставить по одному отряду на каждую
дорогу), "синие" - в одной трети всех случаев пользоваться стратегией
C12, т. е. посылать все три отряда на одну (любую) из
дорог, а в остальных двух третях распределять их по дорогам так:
два на одну и один на другую (стратегия Сз4).
Для розыгрыша стратегии можно бросить обычную игральную кость:
если выпадет 1, 2, 3 или 4 - применять K12если 5 или
6 - применять K3 В каждом равенстве, как видите, присутствуют
все 10 цифр. Возможны и другие решения.
Решение.
Игра - конечная 2 x 2, матрица игры будет:
К этой игре мы еще вернемся в дальнейшем и найдем ее решение. А
пока что просто порассуждаем за игрока K. Представим себе, что мы
игрок К, и что нам предлагается выбрать себе стратегию. Что
ж, попробуем! Выберем, например, К1, т.
е. будем искать всегда в убежище I. Но тогда разумный противник
через несколько партий догадается о нашей стратегии и будет прятаться
там, где мы его не ищем, т. е. в убежище II. Плохо! Выберем теперь
стратегию K2.
Ничуть не лучше: противник снова догадается и будет прятаться в
убежище I. Что же нам делать? Попробуем применять стратегии К1и
К2попеременно, через одну партию игры. Но ведь
противник и об этом может догадаться и будет прятаться каждый раз
не там, где мы его ищем. Как ни кинь - все клин! Что же, значит,
наше положение безвыходно? При любом выборе стратегии нам придется
проигрывать? Выходит, что так. Давайте теперь встанем на точку зрения
противника. С удивлением мы обнаружим, что его положение ничуть
не лучше нашего! Какую бы стратегию он ни выбрал - все ему невыгодно.
Позже мы с вами решим эту игру, т. е. найдем пару оптимальных стратегий
K и С. Впрочем, о них можно по секрету сообщить заранее: каждому
игроку надо будет чередовать свои стратегии, но не регулярно (через
одну), а случайным образом (например, подбросить монету и,
если она упадет гербом, искать в убежище I, а если цифрой - в убежище
II). Аналогично должен будет действовать и С. При этом в среднем
на одну партию будет приходиться нулевой выигрыш (цена этой игры
будет равна нулю): K не будет ни выигрывать, ни проигрывать. Не
очень приятно, но все-таки много лучше, чем всегда быть в проигрыше!
Здесь мы впервые столкнулись с одним из важных понятий теории игр
- с понятием смешанной стратегии, т. е. чередования нескольких
"чистых" стратегий по случайному закону в определенных пропорциях,
или, как говорят, с определенными частотами. В данном примере
каждая из стратегий применяется с частотой 1/2.
Рассмотрим теперь другую игру, решение которой уже не будет столь
очевидным.
Пример 2. Игра "Три пальца".
Два игрока К, к С одновременно и не сговариваясь показывают
друг другу один, два или три пальца. Если общее число показанных
пальцев (первым и вторым игроками вместе) будет четное, то выигрывает
K: он получает столько очков, сколько всего было пальцев, если нечетное
- выигрывает С, на тех же условиях. Требуется записать игру в нормальной
форме.
Решение. Перенумеруем стратегии по числу показанных пальцев. Игра
3 x 3. Матрица игры будет:
|
C1 |
С2 |
С3 |
К1 |
2 |
-3
|
4 |
K2 |
-3 |
4 |
-5 |
K3 |
4 |
-5 |
6 |
Поразмыслим немного над стратегиями каждой стороны. Станем сначала
на сторону K. Предположим, что мы выбрали стратегию K1.
Что будет делать противник? Он разумен и хочет отдать поменьше.
Ясно, он выберет стратегию С2; наш выигрыш
при этом будет равен -3, т. е. мы потеряем 3 очка. Плоховато! Запишем
число - 3 против первой строки в добавочном столбце (минимумы строк).
|
C1 |
С2 |
С3 |
Минимумы строк |
K1 |
2 |
-3 |
4 |
-3* |
К2 |
- 3 |
4 |
-5 |
-б |
К3 |
4 |
- 5 |
6 |
-5 |
Максимумы столбцов |
4* |
4* |
6 |
|
Попробуем другую стратегию - К2. На нее разумный
противник ответит С3. Мы тогда потеряем 5 очков. Еще
хуже! Третья стратегия - K3 - дает точно тот же результат:
выигрыш ( - 5). Что же делать? Пожалуй, лучше других будет все-таки
стратегия К1 - при ней мы по крайней мере
не проиграем больше 3 очков! Ведь против этой стратегии стоит максимальное
число дополнительного столбца - в таблице мы его отметили звездочкой.
Выбрав стратегию К1, мы гарантируем себе,
что, как бы ни вел себя противник, мы никак не проиграем больше
3 очков (т. е. не выиграем меньше (- 3) очков). Величина (- 3) есть
максимальный гарантированный выигрыш, который мы ("красные") можем
себе обеспечить, применяя только одну-единственную стратегию. Такой
стратегией должна быть K1. Как мы получили ( - 3)? Нашли
минимум каждой строки и из этих минимумов взяли максимальный. Эта
величина называется максимином или нижней ценой игры.
Будем обозначать ее а.
Подумаем теперь за противника. Он тоже хочет отдать поменьше, а
получить побольше. Но, какую бы он стратегию ни выбрал, мы ("красные")
поведем себя таким образом, чтобы получить с него побольше. Значит,
противник ("синие") должен в каждом столбце выписать не минимальное,
а максимальное число (см. нижнюю добавочную строку в матрице).
Из этих максимумов он должен найти минимальный (он называется минимаксом
или верхней ценой игры); обозначим его бета. Эта величина
в нашем случае равна 4 и отмечена звездочкой. Чтобы не проиграть
больше 4, "синие" должны придерживаться любой из своих двух стратегий
С1, С2.
Значит, если каждому участнику предлагается выбрать одну-единственную
стратегию, то эти стратегии должны быть K1 для "красных"
и C1 или С2для "синих". Как мы выбрали эти
стратегии? Руководствуясь принципом осторожности, который говорит:
в игре веди себя так, чтобы получить наибольшую выгоду при наихудших
для тебя действиях противника. Этот принцип называется принципом
минимакса и является в теории игр основным.
Применяя этот принцип, мы пока что рекомендовали игроку К, показывать
один палец, игроку С -показывать один или два пальца.
Но нашли ли мы решение игры, т. е. такую пару стратегий, которая
является равновесным положением? Легко убедиться, что нет.
Найденные нами стратегии обладают досадным свойством: они неустойчивы.
Действительно, пусть оба игрока держатся рекомендованных чистых
стратегий: К1и, скажем, С1.
Пока оба держатся этих стратегий, выигрыш будет равен 2, т.
е. на каждую партию игры С проигрывает K два очка. К, может
быть, и доволен, но С досадно. Он не хочет проигрывать. Допустим,
он откуда-то узнал, что мы придерживаемся стратегии K1.
Что он будет делать? Разумеется, немедленно перейдет к стратегии
С2 и будет получать по 3 очка, т. е. сведет наш выигрыш
к -3. А если мы теперь узнаем о поведении С? Перейдем на стратегию
K2. В ответ на это С перейдет на стратегию С3.
И т. д.
Мы убедились, что пара стратегий, вытекающих из принципа минимакса,
неустойчива: стоит одному игроку узнать, что делает другой, как
равновесие нарушается... Всегда ли это будет так? Оказывается, не
всегда.
|