Надежная покерная стратегия

С тех пор, как чемпион мира Гарри Каспаров проиграл компьютерной Deep Blue в 1997 году, мы привыкли к тому, что машины в шахматах определенно сильнее людей. В конце концов, шахматы — это чисто математические рассуждения.

Но покер? Эта игра, в которой столько же расчетов, сколько и психологии, где нужно уметь окружать и блефовать, иногда рисковать, время от времени быть осторожным … компьютер победит чемпиона мира по покеру?

Люди знают, что ситуация еще хуже. Несколько дней назад было объявлено не то, что компьютер может победить человека, а то, что этот компьютер способен разыгрывать идеальную стратегию и математически непобедим.

Решайте игры

Говорят, что с технической точки зрения покер стал решительной игрой. Решить игру — значит найти стратегию, которая обязательно обеспечит победу. Конечно, эта стратегия не обязательно должна быть серией заранее заданных ходов, а скорее процедурой реакции на действия противника, ведущей его к определенному поражению.

Чтобы объяснить это, давайте возьмем простой пример: игра в палку . В этой игре, получившей известность благодаря телешоу « Форт Боярд», играют следующим образом. Перед двумя игроками есть 20 маленьких клюшек. Каждый раз, когда наступает их ход, игрок должен брать 1, 2 или 3 палки. Тот, кто берет последнюю клюшку, проигрывает.

Что ж, если вы первый игрок, есть надежная стратегия огня. Сделайте 3 палки для первого выстрела, а затем, если ваш противник взял N, возьмите 4-N . Я позволю вам проверить, что это позволяет вам наверняка курить другого игрока!

Следует отметить, что для игр, в которых может быть «равенство», не обязательно существует безошибочная стратегия, обеспечивающая победу. Но есть хоть один, обеспечивающий ничью. Так обстоит дело, например, с игрой Морпион: если вы привыкли к этому, вы очень легко можете помешать противнику выиграть.

Есть куча простых игр, которые решаются сегодня. Это, например, случай Power 4, для которой существует стратегия, позволяющая выиграть первому игроку; но и игра в шашки, «резолюция» которой была опубликована в 2007 году.

По сей день игра в шахматы еще не решена, тем более что вряд ли она будет решена в ближайшее время. Итак, в наши дни, когда компьютеры побеждают людей в шахматах, это происходит не потому, что у них есть математически совершенная стратегия: они просто очень, очень сильны.

Игры с неполной информацией

Такие игры, как шахматы или клюшки, являются так называемыми играми с «полной информацией». Это означает, что у обоих игроков одинаковая информация: все на столе, ничего не спрятано. Но во многих играх вы должны решить, какой ваш ход, не имея всей информации: это называется играми с неполной информацией . Более того, в решениях, которые нам приходится принимать в повседневной жизни, мы никогда не располагаем всей информацией. Джон фон Нейман, один из отцов теории игр, сказал:

Реальная жизнь не похожа на шахматы. Реальная жизнь состоит из блефа, из маленьких тактик обмана, из того, чтобы спросить себя, что другой мужчина подумает, что я собираюсь сделать. В моей теории игры именно об этом.

Покер, безусловно, является прототипом этих игр с неполной информацией. В покере мы должны решить, что делать, когда нам не хватает важной информации: карты, которые, конечно, выйдут, но особенно карты, которые есть у оппонента!

Версия покера, которую только что разработала Исследовательская группа компьютерного покера при Университете Альберты в Канаде, называется холдем с ограничением один на один . Это покер для двух игроков в так называемом «лимитном» варианте, где величина повышения фиксирована, а количество повышений ограничено. В этой версии, когда приходит ваша очередь играть, у вас есть только три варианта: сбросить карты, уравнять или поднять.

Та же исследовательская группа в прошлом уже создала программу под названием Polaris , которая в 2008 году первой опередила профессиональных игроков. Но, как я уже говорил, здесь мы намного выше этого, поскольку их новая программа под названием Cepheus математически непобедима: она играет идеальную стратегию.

Стратегия Cepheus — это не результат усвоения знаний, которыми обладают покерные эксперты, а результат исследования игры, которую программа сделала сама по себе, играя против самой себя. По сути, он исследовал все возможные ситуации и выработал на их основе идеальную стратегию. Для этого программа играла в среднем 6 миллиардов игр в секунду более двух месяцев. Достаточно сказать, что каждую секунду он, вероятно, играл в больше игр, чем все человечество с момента изобретения покера!

В случае такой игры, как покер, важно прояснить, что подразумевается под «идеальной стратегией». Действительно, учитывая, что в игре есть фактор удачи, если вы сыграете против Цефея только 10 ходов и у вас их чертовски много, вы можете выиграть. Но в конечном итоге, когда фактор удачи исчезнет из-за большого количества сыгранных игр, Цефей наверняка выиграет.

Некоторые уроки

К счастью, стратегия, разработанная Cepheus, не сводится к нескольким простым правилам, как в случае игры с палкой. Я говорю «к счастью», потому что покер стал бы немного безвкусным, если бы каждый мог играть безупречную стратегию. На самом деле стратегия настолько сложна, что для ее хранения вам потребуется 11 терабайт памяти! Но если вам интересно, вы можете перейти на сайт Cepheus и представить ему конкретную ситуацию : тогда вы узнаете, какое решение лучше всего принять.

Из анализа первых возможных ходов мы можем извлечь некоторые интересные уроки для игроков в покер. Например, Cepheus математически демонстрирует то, что мы знали по опыту: дилер имеет преимущество, потому что он играет последним. Еще один урок: вы можете проконсультироваться с решениями, которые Цефей примет в первый ход на основе двух начальных карт, которые он получает.

Конечно, пуристы должны отнестись к этому с недоверием, потому что здесь мы говорим о «предельной» версии. Поскольку вы не можете выбрать сумму рейза, это удаляет все стратегии вроде «Я поднимаю 100 000!» «. Не факт, что стратегия Cepheus может легко адаптироваться к «безлимитному». Итак, у людей еще впереди светлое будущее, когда дело касается машин!

Самые сварливые скажут нам: что хорошего в том, что исследователям платят за изучение выигрышных стратегий в покере! Что ж, забавно, в опубликованной статье авторы делают вывод, обосновывая возможные применения своей работы и цитируя ситуации, в которых мы оказываемся в конфигурации, близкой к играм с неполной информацией, например, определенные аукционы или даже в случаях выбора лечения. Но, честно говоря, авторы заканчивают свою статью этой цитатой Тюринга, еще одного отца-основателя этой области:

«Было бы лукавством с нашей стороны скрыть тот факт, что основным мотивом, побудившим к созданию работы, было чистое развлечение»