Взгляд в будущее покерной теории с экспертом GTO Wizard

Почему при игре на блайндах МБ с любой рукой миксует бет и чек?

У этого есть достаточно простое объяснение. В общем случае, когда оптимальная стратегия для конкретной руки оказывается смешанной, это означает, что бет и чек приносят одинаковое количество денег. Подразумевается, что большой блайнд от флопа до ривера в среднем вложит в банк одинаковую сумму, как бы мы ни начинали торги на флопе. Кажется немного парадоксальным, но на самом деле нет.

Предположим, ББ вложит больше денег против ставки и меньше – против чека. В этом случае зачем малому блайнду вообще чекать сильные руки? Ставить с ними выгоднее. С другой стороны, если ББ активнее вкладывается в банк против чека, для МБ полностью пропадает смысл ставить с вэлью. Очевидно, ни одна из этих ситуаций не может быть стабильным неэксплуатируемым равновесием. Поэтому солвер, создавая равновесную стратегию, на ранних улицах стремится сделать руки безразличными к выбору между бетом и чеком.

Цикл решения выглядит примерно так: ББ активнее атакует наш чек – чаще чекаем более сильные руки – ББ переходит к пассивной игре против чека и охотнее коллирует против ослабленного диапазона бета – усиливаем диапазон бета... и так до тех пор, пока не наступит равновесие, при котором любое действие с вэлью-рукой будет иметь одинаковое EV.

У этой закономерности есть исключения. Главное из них – когда одна из сторон слишком слаба, чтобы сделать другую безразличной. Поэтому регулярно встречаются ситуации, когда игрок без позиции вынужден начинать розыгрыш с чека со всем диапазоном. Другое важное исключение – вэлью-руки с идеальными обратными блокерами, например, средний сет на сухой доске. Из-за ремувала такие руки будут оплачиваться чаще других. Но даже с ними EV бета и чека остаётся очень близким.

Почему плюсовым игрокам стоит фолдить играбельные руки в зум-покере

У форматов, позволяющих сделать быстрый фолд и сразу же перейти к следующей раздаче, есть любопытная особенность – фолды с пограничными плюсовыми руками могут увеличить доходность игры.

Если ваш винрейт – 5 бб/час, и вам сдают играбельную руку с ожиданием 0 бб, разыгрывая её, вы понижаете своё ожидание в час.

Если ваша нитовость станет очевидной, соперники смогут под неё подстроиться, но я считаю, что равновесие в формате быстрого покера объективно более тайтовое, чем в обычной игре. Ту же концепцию можно применить к любой ситуации, когда фолд существенно ускоряет игру – например, делёжу блайндов при игре в офлайне.

Также задумайтесь над следствием: раз плюсовым игрокам выгоднее играть тайтовее, чтобы ускорить процесс, значит, минусовым игрокам, вероятно, стоит немного расширить свой диапазон, чтобы проигрывать медленнее. Неожиданная мысль, не правда ли?

Мы говорим о нулевом EV или о слабоплюсовом тоже? Насколько плюсовые руки мы готовы фолдить?

Зависит от нашего перевеса. При винрейте 3 бб/100 я бы фолдил руки с EV < 0.03 бб или чуть меньше.

Интересно. Если применить эту поправку к стратегии лоуджека против опена из UTG, получится, что у нас вообще не будет блефовых 3-бетов.

Но ведь отказываясь от сложных розыгрышей околонулевых рук, мы тормозим рост своего уровня игры! Например, я люблю защищать ББ против рэйза и охотно коллирую с руками с нулевым EV, чтобы тренировать на постфлопе линии, ключевые для моей общей стратегии защиты (особенно любимый чек-рэйз). Мне кажется, многие из этих рук на практике имеют хорошее положительное ожидание, так как большинство регов моего лимита (NL100 Zoom) не любят и не умеют сопротивляться агрессии, допускают много ошибок. Может быть, как раз потому что реже меня играют руки такого типа, и им не хватает практики?

Думаю, для такой тренировки идеально подходит HU. Играя один на один, вы вынуждены разыгрывать очень широкие диапазоны и постоянно оказываетесь в очень некомфортных ситуациях.

Согласен! Жаль, что подходящих для этого столов нет ни на Старзах, ни на GG.

Несколько мыслей о 72-покере

72-покер – разновидность кэш-игры, в которой участник, выигравший раздачу с рукой , получает дополнительную выплату от каждого игрока за столом (обычно порядка пяти блайндов с человека).

Это довольно увлекательно, так как побуждает участников включаться в борьбу с худшим стартером в игре. Солверных решений для такого покера нет, но мы можем обсудить его с позиций теории.

1) Фолд становится -EV

Когда вы выбрасываете карты, EV этого действия больше не нулевое, а слегка отрицательное, так как победитель раздачи может показать и вынудить вас платить баунти. Минусовость фолда пропорциональна тому, насколько часто победитель показывает .

Это значит, что агрессор должен увеличивать сайзинги и недоблефовывать, чтобы сделать соперника безразличным к выбору между минусовым фолдом и минусовым продолжением розыгрыша.

2) должны быть во всех линиях розыгрыша

Большинство игроков думают, что обязательно разыгрывать максимально агрессивно. На мой взгляд, оптимальная стратегия – распределить по всем линиям. Иногда колл, иногда рэйз. Иногда чек, иногда бет. Наличие в диапазоне – а это целых 16 комбинаций! – заметно утяжеляет его блефовую часть, а ценность должна быть в её редкости.

Если вы изображаете полярный диапазон, состоящий из и натсов, оппонент должен коллировать очень широко, чтобы ваш блеф с не стал выгоднее отказа от блефа. Если в вашем диапазоне есть и другие блефы, оппоненту придётся фолдить чаще, а это увеличит EV ваших и всей вашей стратегии в целом.

3) Доборы становятся более тонкими

Скорее всего, на ранаутах, на которых являются блефом, необходимо добирать существенно шире и тоньше. Так как в этой игре вам приходится чаще блефовать, блефы должны балансироваться безумно широкими доборами. Заставляйте себя ставить со многими руками, с которыми хочется спокойно прочекать и пойти на вскрытие.

4) >

Некоторые спрашивают: насколько плохо вообще не играть ? Может быть, правильная подстройка – это затайтиться?

На мой взгляд, ценность в такой игре выше, чем у в обычном покере. Это безумно прибыльная рука. При этом вы не обязаны всегда нацеливаться с ней на стек. Если оппонент очевидно не настроен сдаваться, нет смысла отгружать ему все 100 бб.

5) Тайтовые диапазоны = больше = более резкие подстройки

В тайтовых диапазонах будут встречаться чаще, поэтому вам придётся заметно поменять стратегию по сравнению с дефолтной. В игре с широкими диапазонами доля понижается, поэтому подстройки в ней (широкие коллы, пониженная частота блефа и так далее) должны быть более мягкими.

6) Чаще добирайте с руками, которые содержат или

Оптимальная стратегия максировки силы руки – ваше вэлью должно пересекаться с ключевыми картами ваших блефов. Поэтому среди ваших доборов на почётном месте должны быть руки, содержащие семёрку и двойку, а оппонент, в свою очередь, должен менее охотно коллировать, когда у него самого есть эти карты.

7) Когда – вэлью, начинается настоящий цирк

Вот тут я немного теряюсь. может быть и у агрессора, и у защитника. Но когда к диапазону вэлью внезапно добавляется огромное количество дополнительных комбинаций, блефов может не хватить. Видимо, придётся намного шире блефовать с другими руками.

О чём я забыл? Уверен, у этой разновидности покера есть масса других особенностей.

Геометрический сайзинг становится главным для солвера, так как получает меньше всего фолдов из всех вариантов игры на стек. В SPR 13 при использовании геометрического сайзинга до вскрытия не дойдёт 87.5% рук оппонента. Олл-ин размером 13 банков даст 93% фолдов. Так как EV генерируют в основном фолды, возможно, теоретически оптимальной версией сайзинга будет противоположность геометрическому – крошечные ставки на ранних улицах и огромный овербет в конце.

Я несколько раз участвовал в игре по таким правилам. Поле подстраивается тем, что бешено расширяет диапазоны защиты. Томбос верно указывает, что нужно распределять по всем линиям, но на практике так никто не делает. Также линии вроде чек-рэйза ривера вряд ли могут/должны иметь много из-за слишком высокого риска увидеть чек следом. Но даже против таких линий люди начинают защищаться, как ненормальные.

Против большинства оппонентов я бы эксплойтно никогда не блефовал без и всегда блефовал с ними.

Вообще шикарная игра, хотелось бы играть в неё чаще.

В защиту лимпов на префлопе

Правило никогда не лимпить на префлопе больше не догма. В лимпах как таковых нет ничего плохого. Всё, как обычно, упирается в цену.

Думайте о лимпах, например, так: когда вы лимпите 1 бб, вы коллируете 1 бб, борясь за банк 1.5 бб. Это значит, что вы должны выигрывать 1/1.5 = 40% банка, чтобы выходить в ноль. Это такие же шансы банка, как против овербета в два банка.

Вам понравится коллировать двойной овербет в мультипоте, где ещё не высказались несколько человек с некапнутыми диапазонами? Наверное, не очень. Поэтому в стандартных префлоп-чартах лимпов обычно нет.

Но что случится, если увеличить начальный банк? За счёт анте или кэш-дропа, например.

Большие анте (начальный банк – 4.5 бб вместо 1.5 бб) резко улучшают шансы банка, и солвер внезапно начинает лимпить кучу рук с катоффа даже в глубине 200 бб!

Кэш-дроп 10 бб делает ситуацию совершенно экстремальной. У лоуджека пропадает рэйз, зато лимпить можно почти с половиной всех рук. Отметим, что рейк никуда не делся!

Ну и, конечно, все знают, что лимп с малого блайнда – совершенно стандартная история в МТТ.

Для игры лимпами существуют законные эксплойтные основания – поле всё ещё слишком широко изолирует лимперов. С другой стороны, лимпы заметно усложняют нашу общую стратегию и увеличивают рейковую нагрузку. Так что это палка о двух концах.

Солверы слишком усложняют?

Меня всегда впечатляло, как много избыточной сложности заложено в популярные солверные решения просто потому что сложность исполнения не имеет значения для компьютера.

Сравните традиционную запутанную схему защиты ББ с упрощённой версией, которую я модифицировал для исполнения человеком.

Моя стратегия обеспечивает практически такое же покрытие текстур, как у солвера, поэтому теряет меньше 0.0% банка по сравнению с оптимальной, и при этом она на несколько порядков проще!

Сравнение EV на первом шаге; во втором случае малый блайнд играет максимально эксплуатирующую стратегию против моей:

Очевидно, что мы можем придумывать стратегии, несравнимо более простые, чем солверные, и при этом практически не теряющие EV. Это навело меня на мысль разработать солвер, который смог бы сам искать баланс между максимальным EV и простотой исполнения. Однако формализовать критерии оказалось слишком сложно.

Прежде всего, требуется дать определение сложности, которое было бы релевантно человеческому опыту. Самое честное определение – это K-сложность или длина описания: минимальное количество правил, которые пришлось бы заучить, чтобы хорошо играть раздачу. Именно это на самом деле подразумевается под простотой. Проблема в том, что считать это очень дорого, поэтому на практике, мне кажется, придётся использовать какой-то суррогат.

Во-вторых, то, как мы сейчас решаем покер (Counterfactual Regret Minimization), по своей природе локально: обновление стратегий происходит на уровне конкретных комбинаций. Это значит, что любой штраф за сложность должен быть представлен как сумма штрафов на уровне отдельных комб. Если метрика не может быть представлена как сумма локальных поощрений/штрафов на уровне комбинаций, она будет работать в солвере очень плохо.

В-третьих, упрощение комбинаторики не равно упрощению стратегии. Распространённая идея – штрафовать энтропию стратегии каждой руки, то есть вынудить солвер предпочитать чистые действия смешанным. Но низкая энтропия на уровне отдельных рук всё равно может породить глобально очень сложную стратегию. Может получиться лоскутное одеяло из чистых действий, где соседние руки делают совершенно разные вещи без внятной для человека причины. Такая стратегия может оказаться гораздо менее интуитивной, чем смешанная, но построенная по простым и единообразным правилам.

Поэтому пока что приходится упрощать солверные стратегии вручную.