Строим равновесие Нэша, пошаговая инструкция

45 комментариев
Строим равновесие Нэша, пошаговая инструкция

По многочисленным просьбам хардкорных фанатов покерного обучения выкладываем перевод двух глав книги Expert Heads Up No Limit Hold'em Уилла Типтона, в которых предлагается методика поиска оптимальных линий розыгрыша своего диапазона.

Книгу можно и нужно купить, например, на Amazon.com. Во время Мировой серии покера она активно продавалась в коридорах Rio, в какой-то момент продавцам пришлось заказать несколько дополнительных партий. В качестве живой рекламы выступал Никлас Хайнекер, увлеченно читавший ее по ходу турнира за $25,000.

Но предупреждаем! Акт покупки обучающего материала не является сакральным и не повысит ваш винрейт сам по себе (впрочем, есть исключение: чрезвычайно мнительные и романтичные натуры могут побить на пару лимитов больше, просто пожав руку Филу Гальфонду). Необходимым условием усиления игры является довольно скучная работа, погрузившись в которую, вы в какой-то момент спросите себя: почему именно покер? Почему не программирование, ядерная физика или проектирование стадионов для «Газпрома»? Некоторые из вас, освоив рутину нудной ежедневной работы, бросят покер и найдут себе другое, более прибыльное занятие, требующее данного качества. Кстати, это частный случай равновесия Нэша на рынке труда.

2.2.2 Упражнение на равновесие


Разобравшись с тем, как строить максимально эксплуатирующие диапазоны, мы можем использовать полученное знание для совершенствования своего понимания стратегии. Следующее упражнение мы назовем упражнением на равновесие, скоро поймете, почему. Это весьма эффективный способ тренировать эксплуатирующую стратегию в целях улучшения собственной игры. И вот в чем он заключается.

1) Задайте ситуацию

Желательно представить ее в виде дерева решений. Нарисуйте его. Возможно, вы захотите сосредоточиться на одной ветви, отдельном решении на префлопе или одной из улиц постфлопа.

2) Определите стратегию для одного из участников раздачи, Игрока 1

Напишите диапазоны для всех решений в дереве для одного из игроков. Эти диапазоны могут описывать вашу стандартную стратегию, либо стратегию, которую использует определенный тип оппонентов, либо являться «стандартными» с вашей точки зрения в целом. Все зависит от того, что вы собираетесь узнать.

3) Найдите идеальную подстройку за Игрока 2

Далее вам следует найти идеальный ответ за Игрока 2, который принесет ему максимальную выгоду на дистанции, если Игрок 1 не изменит свою стратегию.

Допустим, вы задали Игроку 1 собственную стратегию, используемую по умолчанию. Обнаружив идеальное противоядие за соперника, задайте себе несколько вопросов:

– Насколько выгодна для соперника такая стратегия? (Не является ли ваша стандартная линия крайне эксплуатируемой?)
– По каким признакам (статистика, руки, показанные на шоудауне и т. п.) можно определить, что соперник приспособился к вашей стратегии?
– Используя эксплуатируемую стратегию, важно сознавать ее слабости и то, как соперники могут на них зарабатывать. Насколько часто ваши оппоненты на рабочем лимите подстраиваются под эти слабости?

Имеет смысл подумать и о неправильных методах подстройки со стороны Игрока 2, но сейчас мы не будем останавливаться на этом.

4) Найдите идеальную подстройку под новую стратегию Игрока 2

Вернитесь и измените действия Игрока 1 так, чтобы они приносили максимальную выгоду против новой стратегии Игрока 2. А потом еще раз, и еще раз. Часто бывает очень полезно пройти несколько циклов, отслеживая взаимные подстройки и изменения стратегии игроков.

Следует помнить, однако, что чем слабее ваши соперники, тем меньший интерес представляют более глубокие способы подстройки. Скажем, мы правильно расшифровали стратегию оппонента в определенном споте и успешно подстроились. Отреагирует ли он на изменение нашей стратегии? Применять подстройку второго уровня разумно только если мы знаем, что соперник точно определил суть нашей первой подстройки и правильно приспособился ее использовать. Термины «предполагаемые диапазоны» и «предполагаемая стратегия» означают мнение оппонента о вашей игре. На практике мы стараемся быть на один уровень впереди него, поэтому важнее всего будут подстройки соперника к вашей предполагаемой стратегии.

При выборе сценариев для расчета не ищите чего-то необычного. Чем чаще встречается в ваших играх определенная ситуация, тем больше денег на ней можно заработать улучшением своей стратегии...

Во многих случаях пользу принесет даже правильная постановка вопроса. Достаточно нарисовать дерево решений, и ответ придет сам собой. Это происходит потому что стратегия почти всех игроков изобилует жуткими дырами, которые становятся очевидны, стоит нам перенести их на бумагу и немного подумать. На практике их спасает лишь то, что покер – игра с неполной информацией.

Например, допустим, что Hero рэйзит на малом блайнде с широким диапазоном, и Villain часто 3-бетит с большого блайнда. В отдельно взятой разадче Hero делает колл, и выходит флоп As 9h 3c . Допустим, стратегия оппонента Hero состоит в том, чтобы ставить контбет на флопе с частотой 100%, а потом чек-фолдить терн без пары тузов или более сильной руки. Вполне возможно, что это довольно точно описывает поведение слабых ТАГов в вашей игре и приносит им определенный доход до тех пор, пока их стратегия остается незамеченной. Но как только она ясно сформулирована, идеальная контрстратегия становится кристально ясной: колл на флопе с частотой 100% и ставка на чек терна со 100% рук с воздухом.

Расчет идеальных подстроек вручную порой требует немалой методичности и усидчивости, особенно в случаях сложного дерева решений. Поэтому для расчетов разумно использовать компьютерные программы. Все расчеты по GTO в этой книге производились с помощью специально написанного софта. Однако программы, с помощью которых можно искать оптимальные подстройки под стратегии соперников, существуют и в общем доступе.

Это упражнение интересно рассматривать и в контексте проверки своей интуиции. Попробуйте сначала угадать наилучшую подстройку, а потом найти ее математически и сверить полученные результаты.

2.2.3 Упражнение на равновесие на практике


Следующий пример поможет вам разобраться, как применять данное упражнение на практике.

Эффективный стек 75 бб

Префлоп:
Оппонент рэйзит 2.5 бб, мы делаем колл 1.5 бб.

Флоп: Js 6h 3s (в банке 5 бб)
Hero – чек, Villain ставит 3 бб, Hero рэйзит до 9 бб, Villain – колл.

Терн: Jd (в банке 23 бб)
Hero ставит 15 бб, Villain – колл.

Ривер: 2d (в банке 53 бб)

Эффективный стек 48.5 бб.

Так как мы решили сосредоточиться на одной ветке дерева решений, а не на всей раздаче, нам придется задать игрокам диапазоны, с которыми они придут на ривер. То есть мы будем оперировать некоторыми разумными представлениями об игре участников раздачи на более ранних улицах и, разумеется, наши выводы будут во многом зависеть от точности наших допущений.

Сужать диапазоны можно уже на префлопе. Допустим, оба игрока компетентные, думающие и агрессивные. Villain открывает рэйзом с баттона, скажем, 80% рук. Hero защищает примерно 40% рук, но ставит 3-бет с наиболее сильными из них, поэтому его диапазон колла состоит из неплохих, но не премиумных рук.

Выходит флоп Jx 6x 3x с флеш-дро. Наш соперник обычно будет продолжать с большинством своих рук: мы сравнительно редко попадем во флоп, на котором лежит всего одна большая карта, поэтому это хорошая ситуация для контбета. В диапазоне нашего чек-рэйза для вэлью будут следующие руки: хорошие валеты, 3x 3x , 6x 6x , Jx 6x (если мы защищаем их префлоп) и редкие оверпары (которые мы иногда слоуплеим на префлопе). Из полублефов там будут пиковые дро и стрит-дро.

Помимо этого, поскольку мы считаем, что соперник часто будет блефовать на флопе, мы с некоторой частотой будем рэйзить его контбет с чистыми блефами. Наличие флеш-дро на флопе важно для нас, так как оппонент с меньшей вероятностью будет ставить блефовый 3-бет, когда в нашем диапазоне достаточно много неготовых рук, которые поставят олл-ин (все флеш-дро). В диапазон блефового рэйза имеет смысл включить руки с одной пикой, так как они позволят продолжать атаку на пиковых тернах.

В общем, мы рэйз, соперник колл. Его диапазон колла – руки с одной парой (хотя слабейшие из них он, вероятно, выкинет), а также дро. Иногда он будет слоуплеить сильные готовые руки. Заметили разницу между диапазонами игроков? У обоих много дро, и у обоих возможны монстры (хотя и очень редко, так как флопнуть монстра очень трудно), но у нашего соперника много слабых и средних готовых рук, а у нас больше сильных рук (за счет тайтового префлопа и сравнительно узкого диапазона рэйза для вэлью), но есть также чистые блефы.

На терне спаривается валет. В целом это хорошая карта для любых готовых рук на флопе и плохая для дро. Средние пары нашего соперника значительно прибавляют в силе, так как в нашем диапазоне становится меньше рук с валетом. Поэтому продолжать блеф на таком терне не слишком разумно. Впрочем, так как это понимают оба игрока, доверие к ставке на терне будет велико, следовательно, эффективность блефа возрастет. Также у нас в запасе остается олл-ин на ривере, который окажет максимальное давление на не слишком сильный диапазон соперника. Бетсайзинг Hero не слишком удачен для хороших дро в его диапазоне в случае ответного олл-ина, поэтому часть таких рук мы искючим.

Наконец, 2d на ривере – очень хорошая карта для готовых рук и плохая – для дро, так как закрыла только относительно маловероятное стрит-дро. В итоге наш диапазон на ривере состоит из достаточно большого количества рук, не представляющих ценности на шоудауне, а также сильных и практически натсовых рук. В диапазоне соперника значительно меньше полного воздуха, так как он часто избрал бы более агрессивную линию с сильными дро или выкинул слабые. У него значительно больше слабых готовых рук – тройки, шестерки, карманные пары.

Попробуем задать Hero диапазон на ривере:

Ac Jc , Kc Jc , Qc Jc , Jc Tc , 5c 4c , Kc Jh , Qc Jh , Kd Jc , Qd Jc , 5d 4d , Kd Jh , Qd Jh , Kh Jc , Qh Jc , Ah 2h , Ah 5h , Ah 8h , Ah Jh , Kh Jh , Qh Jh , Jh Th , As Tc , Ks Jc , Qs Jc , As Td , As Th , Ks Jh , Qs Jh , Qs 6s - Qs Ts , Ts 7s , 9s 7s , 8s 7s , 3d 3c , 3h 3c , 3h 3d , 6s 6c , 6d 6c , 6d 6s , As Ac , Ad Ac , Ah Ac , всего 45 комбинаций. Мы включили половину рук AJs и AA, так как с ними возможен 3-бет префлоп, несколько чистых блефов и дро.

Диапазон нашего оппонента на ривере состоит из:

44-55, 77-JJ, A3s, A6s, K6s, KJs, Q6s, QJs, J2s+, 62s-64s, A6o, K6o, Q6o, J4o+, T6o, 96o, 86o, 76o, 65o, Ts 4s +, 9s 4s +, 8s 4s +, 7s 6s , 6s 5s , 3d 3c , 6d 6c , Qs Qc , Qd Qc , Qh Qc , Ks Kc , Kd Kc , Kh Kc , As Ac , Ad Ac , Ah Ac , всего 218 комбинаций. Мы также исключили некоторые сильные руки и дро, с которыми соперник играл бы более агрессивно на предыдущих улицах.

Теперь мы можем очертить круг стратегических возможностей участников раздачи. Для простоты и поскольку эффективный стек меньше банка, будем считать любую ставку Hero олл-ином. Так как наш диапазон довольно сильно поляризован, нам нет смысла выделять категорию рук для чек-колла, поэтому наш чек всегда означает чек-фолд. В случае пуша от Hero оппонент может выкинуть или сделать колл. Дерево решений получается следующим:

Теперь нам нужно выбрать стратегию для каждого игрока. Заметьте, что выбор здесь довольно узкий – всего одно решение. У Hero два диапазона – олл-ин и чек-пас. У его оппонента важна только реакция на олл-ин, так как на чек от Hero он может всегда ставить олл-ин. Так что Villain должен лишь определиться с диапазоном колла олл-ина соперника.

Попробуем для начала предугадать стратегию оппонента. Мы уже упомянули, что Hero любит баррелить ривер со всеми блефами. Учитывая это, его соперник может счесть нелогичным колл терна и фолд на бланковом ривере с рукой, которая бьет блеф. Поэтому давайте для начала рассмотрим колл ривера со всеми руками, которые бьют блеф, начиная с А-хай.

Прежде чем мы перейдем к процессу решения, попытайтесь самостоятельно предугадать оптимальные действия для каждого игрока.

В качестве меры EV мы будем считать размер стека игрока в конце раздачи. Если бы раздача завершилась принудительным чек-чеком на ривере, стек Hero был бы равен 82.5 бб, а стек его соперника – 67.5 бб. Очевидно, что на вскрытии Hero выигрывает несколько чаще. Посмотрим, как скажется позиционное преимущество его соперника на ожидании от разадчи.

Итерация 1

Допустим, соперник заколлирует наш олл-ин со всеми руками с шоудаун-вэлью. Его диапазон в этом случае: 44-55, 77-JJ, A3s, A6s, K6s, Q6s, QJs, J2s+, 62s-64s, A6o, K6o, Q6o, J4o+, T6o, 96o, 86o, 76o, 65o, Ts 6s , 8s 6s , 7s 6s , 6s 5s , 3d 3c , 6d 6c , Qs Qc , Qd Qc , Qh Qc , Ks Kc , Kd Kc , Kh Kc , As Ac , Ad Ac , Ah Ac , это 205 комбинаций.

Лучшим ответом на это со стороны Hero будет следующий диапазон пуша: 33, 66, AJs, KJs, QJs, JTs, KJo, QJo, 5c 4c , 5d 4d , Qs 6s , As Ac , Ad Ac , As Ac , то есть олл-ин с 32 комбинациями и чек-пас со всеми остальными. В этом случае EV Hero составит 106.8 бб, что существенно лучше ожидания от игры чек-чек.

Итерация 2

Если стратегия Hero на ривере соответствует найденной нами в Итерации 1, лучшей подстройкой для его соперника будет мегатайтовый диапазон колла: JJ, KJs, J6s, J6o, 3d 3c , 6d 6c . Это всего 15 комбинаций. Остальные 203 соперник будет выкидывать в пас. В этом случае EV Hero составит 81.9 бб.

Обратите внимание, что стратегия оппонента полностью поменялась. Если в начале он отказывался выкидывать какие-либо руки, имеющие ценность на вскрытии, во второй итерации он заиграл дико аккуратно, вплоть до паса с Qx Jx (!). Если Hero вовсе не блефует на ривере, именно так играть выгоднее всего.

Итерация 3

Допустим, мы знаем, что соперник вскрывает наши ставки на ривере с диапазоном, найденным с помощью Итерации 2. Лучшей подстройкой будет олл-ин на всем своем диапазоне, 45 комбинаций. EV Hero в этом случае равно 95.9 бб. Олл-ин со всеми руками – лучший способ использовать сверхузкий диапазон колла соперника.

Итерация 4

Если Hero пушит все свои руки, лучшей контрстратегией будет колл с 98 комбинациями: JJ, K6s, KJs, QJs, J2s+, K6o, J4o+, Ac 3c , Ac 6c , Qc 6c , Ac 6d , Qc 6d , Ac 6s , Qc 6s , Ad 6c , Qd 6c , Ad 6d , Qd 6d , Qd 6s , Qh 6c , Qh 6s , Qh 6d , 3d 3c , 6d 6c , Qd Qc , Qh Qc , Ks Kc , Kd Kc , Kh Kc , Ad Ac . EV Hero составит 90.8 бб.

Итерация 5

Лучшей подстройкой под указанный выше диапазон колла будет... по-прежнему олл-ин со всем своим диапазоном. EV Hero составит все те же 90.8 бб.

Итерация 6

Так как ни у одного из соперников нет причин менять свою стратегию, найденные диапазоны являются оптимальными для задачи с указанными условиями.

Благодаря этому упражнению можно сделать некоторые выводы. Прежде всего, обратите внимание на огромную разницу максимально эксплуатирующих стратегий в ранних итерациях. Мы начали с того, что соперник делает колл с 205 комбинациями, после чего сузили свой диапазон пуша до 32 сильнейших вэлью-рук. Оппонент начал выкидывать все карты в пас, сузив диапазон колла до 15 топовых комбинаций. В ответ мы стали пушить все 45 комбинаций, с которыми дошли до ривера, на что соперник отреагировал расширением диапазона колла. Если Hero не блефует, Villain не блефкетчит и т. п. – подстраиваться легко, когда знаешь стратегию соперника. Отметим также, насколько велик был выигрыш игрока, применявшим максимально эксплуатирующую стратегию.

После четвертой итерации ситуация изменилась. Оба игрока пришла к равновесию, их диапазоны стабилизировались.

А мы пришли к равновесию Нэша, обсуждение которого продолжим в следующей главе...

Рейтинг:

+1 -1
-

Зачем регистрироваться на GipsyTeam?

  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.

Мы тоже не любим спам! За всю историю сайта мы не отправили ни одного письма нашим пользователям. Вы не будете получать от нас ни рекламных предложений, ни обзоров обновлений.