Загадочный овербет искусственного интеллекта

42 комментария
Загадочный овербет искусственного интеллекта

Светлые головы форума Run It Once обсудили раздачу, в которой HU-бот Клодико поставил Джейсону Лесу овербет-олл-ин 11 банков, когда у Леса был блокер на первый натс.

8 мая 2015 года в казино Rivers в Питтсбурге завершился марафонский матч по дубликатному покеру между четырьмя регулярами HU NLHE во главе с Дугласом Полком и ботом Клодико, разработанным в университете Карнеги – Меллон. Освежить воспоминания об этом событии можно с помощью материалов на нашем сайте:

NLHU – человек против машины
Хэдз-ап против бота: люди пока сильнее

В ходе матча, который транслировался в прямом эфире на нескольких каналах Twitch.tv, было сыграно немало любопытных раздач, связанных с большими овербетами. Одну из них подробно разобрали на форуме Run It Once покерные теоретики Бен Сульски и Game Theory.

Game Theory
HU NLHE, стеки по 200 больших блайндов. На баттоне Клодико, на большом блайнде Джейсон Лес.

Блайнды 50/100
Клодико рэйзит до 250, Джейсон Лес делает колл с As 2h .

Флоп Ah 3s 4s (500)

Джейсон Лес ставит 100 (тактику небольших донкбетов против бота регулярно применяли в этом матче все его участники), Клодико делает колл.

Тёрн Ah 3s 4s Qs (700)

Джейсон Лес – чек, Клодико ставит 525, Джейсон Лес – колл.

Ривер Ah 3s 4s Qs 8d (1750)

Джейсон Лес – чек, Клодико ставит 19,125, Джейсон Лес начинает думать...

C каким диапазоном вы заколлируете и включает ли он в себя As 2h ?

Game Theory
Если коллировать только с флешами и голым тузом пик, для бота нет смысла пушить с 5x 2x или двумя парами, так как он никогда не будет старше в случае колла. (Конечно, это зависит от того, как много этих рук в диапазоне Леса после чек-колла тёрна.)

Впрочем, беспокоиться об этом не стоит, так как с этими комбинациями есть значительно лучший вариант розыгрыша – ставка меньшего размера.

dodgybob
Меня удивляет, что в стратегическом арсенале бота есть такой огромный овербет без натса или натсового блокера.

Если предположить, что его диапазон блефа включает в себя в основном руки с тузом пик, нам лучше выбирать для блефкетчера руки без As .

GameTheory
Я считаю этот сайзинг плохим, учитывая диапазон бота. Он заколлировал очень маленький лид на флопе и сделал ставку нормального размера на тёрне. Если бы он сыграл рэйз на флопе и/или поставил приличный овербет на тёрне, шоудаун-вэлью его слабейших комбинаций с тузом пик (от As 2x до As 5x ) было бы заметно ниже. Такая линия позволила бы ему не сжигать EV, блефуя олл-ином c натсовым блокером.

Если блефовать без туза пик и ставить олл-ин для вэлью только с натсовым флешем, все руки с пиковым тузом становятся идеальным блефкетчером для Джейсона Леса. Позволить Лесу делать сверхвыгодные коллы с As x было бы катастрофой.

Если блефовать без туза пик и добирать не только с натсовым флешем, сайзинг становится чрезмерным, так как младшие флеши будут проигрывать старшим флешам 11 банков слишком часто.

Можно сделать вывод, что либо бот предполагает, что в диапазоне Джейсона Леса слишком мало пиковых тузов и флешей, либо игра на ривере запрограммирована с ошибкой.

Бен Сульски
Моя первая гипотеза: диапазон бота должен состоять в основном из натсового флеша и воздуха. Проблема с ней в том, что лучшая карта для блефа – это туз пик, но EV олл-ина с As x не может быть выше чека или небольшого вэльюбета, если только соперник не фолдит 95% своего диапазона.

Также следует учесть, что если бот блефует без туза пик (с другим пиковым блокером или даже без него), значительную часть диапазона GTO-колла на ривере составят натсовые флеши. Я практически уверен в том, что равновесная стратегия для игрока на ББ будет включать чек-колл тёрна с частью As spade , поэтому бот не может «предполагать» у соперника капнутый диапазон, и вообще я не думаю, что он играет по эксплуатирующей стратегии.

Если эти соображения справедливы, бот должен блефовать с очень небольшим количеством слабых рук, добирать с натсовыми флешами и некоторым количеством вторых флешей, может быть, даже третьих. Игрок без позиции будет коллировать с частью As x и крупными флешами.

Проблема тут в том, что идея ставить олл-ин 11 банков выглядит хуже ставки меньшего размера, так как у игрока без позиции есть диапазон чек-рэйза, а игрок в позиции не может часто блефовать олл-ином, ибо ключевая блефовая карта (туз пик) является топ-парой, блефовать с которой нехорошо.

Отсюда я пришёл ко второй гипотезе – диапазон бота сконструирован с ошибкой: он либо чересчур расширяет диапазон вэльюпуша (до слабых флешей) и использует много разных пиковых блокеров, либо пушит натсовый флеш и воздух без As , из-за чего в его диапазоне возникает избыток пустых рук. Эта гипотеза наиболее вероятна, поэтому на месте Джейсона я бы, пожалуй, сделал колл, но история раздач против бота могла бы изменить моё решение.

Возможно также, что игрок без позиции должен коллировать олл-ины строго с натсовым флешем, а любой колл с As x будет минусовым, но вероятность этого я оцениваю невысоко.

Бен Сульски
Попробую обощить всё это с точки зрения Hero.

a) Количество комбинаций As x , с которыми Hero оказывается на ривере, заметно выше необходимого для минимальной частоты защиты от овербета в 11 банков.

b) Hero почти наверняка слоуплеит достаточно флешей, чтобы сделать 11-кратный овербет для вэлью неоптимальным для любых флешей, кроме натсового и, возможно, второго и третьего.

c) Следовательно, если бот играет хорошо, колл с As x будет нулевым или минусовым.

d) Следовательно, если бот играет хорошо, мы должны фолдить, а если бот играет плохо, мы должны коллировать.

Ник Ховард
Думаю, мы можем с уверенностью заявить, что колл лучше, основываясь на последнем посте Бена. Если колл с As минусовой, то этот минус невелик, и мы должны оценивать вероятность хорошей игры бота очень высоко, чтобы выбросить карты в пас, поскольку профит от колла в случае слабой игры бота намного выше. Другими словами, даже если он играет хорошо в 80% случаев и плохо в 20%, колл всё равно будет +EV.

Кевин Рабичоу
Кто-нибудь объяснит, зачем все участники матча донкали один блайнд на флопе против бота? Это действие кажется важной частью раздачи, поскольку вялый экшен на флопе увеличивает силу топ-пары для игрока без позиции, и он вряд ли захочет прочекать тёрн, если только у него не натсовый флеш.

JulianR
Насколько я могу судить, идея донкбета – экспоненциально увеличить дерево перебора для Клодико, в идеале сделав полный расчёт невозможным.

GameTheory
Бену Сульски:

Моя первая гипотеза: диапазон бота должен состоять в основном из натсового флеша и воздуха. Проблема с ней в том, что лучшая карта для блефа – это туз пик, но EV олл-ина с Asx не может быть выше чека или небольшого вэлью-бета, если только соперник не фолдит 95% своего диапазона.

Если грубо прикинуть диапазон Леса – 80%!10%:(3,4,Q,A,56,52,9s-As) (80% диапазона минус 10% сильнейших карт, с которыми он ставит 3-бет, среди которых есть 3x , 4x , Qx , Ax , 5x 6x , 5x 2x и пика от девятки до туза – ред.), у туза пик – As:(2,5)!ss – 68% эквити. Допустим, небольшой ставкой можно реализовать 70% банка.

11-кратный овербет бесспорно превращает руку в блеф. Минимальная частота колла – 1/12 = 8.33%. Но если олл-ин ставит As:(2,5)!ss, пытаясь таким образом забрать дополнительные 0.3 банка, минимальная частота колла понижается до 2.65%!

С учётом мёртвых карт, 80%!10%:(3,4,Q,A,56,52,9s-As) даёт 382 комбинации.
С учётом мёртвых карт, 80%!10%:(3,4,Q,A,56,52,9s-As):ss даёт 26 комбинаций.

Но 2.65% от 382 это всего 10 комбинаций, а флешей 26. То есть Джейсон Лес может выбрасывать некоторые флеши. Конечно, в своих расчётах мы не учитывали, что диапазон Леса с высокой вероятностью капнут и флешей в нём меньше. Но пока у него есть хотя бы 30% возможных флешей, некоторые из них по-прежнему можно будет фолдить.

Ещё более важное соображение состоит в том, что олл-ин – очень плохой способ собрать вэлью с натсовыми флешами! Когда тебя коллируют в 2.65% случаев за 11 банков, вы добавляете к ожиданию 0.3 банка. Если сравнить со ставкой в банк, игнорируя card removal-эффект и возможность рэйза, колл в 50% случаев уже даёт вам ожидание в 0.5 банка!

Вывод: невозможно грамотно сбалансировать 11-кратный овербет только натсами и воздухом, используя в качестве блокера только туза пик, поскольку туз пик имеет шоудаун-вэлью. Следовательно, бот должен использовать для блефа руки, не содержащие туза пик.

Бот блефует без туза пик (с другим пиковым блокером или даже без него)...

Конструирование такого диапазона – просто катастрофа! Например, вот что может получиться, если использовать 9 комбинаций As*s и 6 блефовых, чтобы сделать флеши безразличными к выбору между коллом и фолдом:

Однако теперь любой блефкетчер Леса, содержащий As , будет иметь 100% эквити против диапазона ставки!

As составляет примерно 8% диапазона 80%!10%:(3,4,Q,A,56,52,9s-As). Теперь понятно, почему я назвал эту стратегию катастрофой. Мы не только дадим 8% диапазона соперника плюсовой колл ценой 191 бб, но и никогда не получим колл, когда у нас натс!

Конечно, колл олл-ина исключительно с As x позволяет боту делать более тонкие вэльюбеты с руками типа двух пар, поэтому оптимальная стратегия должна включать замещение некоторых комбинаций As флешами, чтобы парировать эту атаку. Но в любом случае видно, что 11-кратный овербет в данной ситуации является грубой ошибкой.

Samu Patronen
А существуют ситуации, когда 11-кратный овербет будет хорошей игрой?

GameTheory
Да, конечно. Например, доска As Ks 9s 8d 4d . Соперник сделал 3-бет префлоп, поставил флоп, тёрн и ривер, и тут мы поставили олл-ин 11 банков. Наш диапазон здесь будет поляризован между натсовыми флешами и голыми Qs .

GameTheory
Результат:

Джейсон Лес сделал колл. Бот показал Tx 5x без пик.

Мой вывод – колл был корректным, особенно с учётом того, что бот даже не использовал пиковые блокеры, что должно заметно повысить EV колла: старшие пиковые карты блокируют все старшие флеши, колл с которыми обязателен, следовательно, их наличие у бота повышает фолдэквити.

Выше мы показали, что пуш с голым тузом пик – плохая игра. А если эффективно использовать блокеры невозможно, следует уменьшать сайзинг.

Рейтинг:

+1 -1
-

Зачем регистрироваться на GipsyTeam?

  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.

Мы тоже не любим спам! За всю историю сайта мы не отправили ни одного письма нашим пользователям. Вы не будете получать от нас ни рекламных предложений, ни обзоров обновлений.