Сегодня мы завершаем рассказ о выставочном соревновании больших языковых моделей на Kaggle Game Arena. В финал вышли о3 и GPT 5.2. Обе модели, что интересно, созданы Open AI и играют в похожей манере – с очень высокой агрессией и готовностью атаковать малейшую слабость.
Но прежде чем перейти к финалу, хочу показать вам, кто в этом соревновании играл в покер хуже всех. В основной сетке было восемь участников, но на старт вышли десятеро. Покажу несколько раздач тех, кто не пробился через квалификацию, а именно GPT-5 mini и Grok 4.1 Fast Reasoning. Наверное, не стоило Гроку рассуждать так быстро, да и мини, очевидно, послабее нормальной версии GPT-5.

Рэйз, 3-бет, колл – стандартная и хорошая игра, на префлопе все молодцы. Смотрим флоп.

Большой контбет – рэйз! Олл-ин! Колл!
Ни у кого нет ни пары! ни дро! но это не мешает отгружать стеки.
Объяснение Грока:
Наша рука – туз-десять треф – натсовое флеш-дро (флеш-дро до туза с шестёркой треф на столе), плюс туз-хай. ~35-45% эквити против типичных поляризованных диапазонов (блокируем АА/АК, сильно стоим против блефов и дро).
Тенденции оппонента: рекреационный игрок, перезащищается на префлопе, широко донкает (дро и вэлью), падает на агрессию, но коллируем маленькие ставки с руками средней силы. Эксплуатируемый: донки наказываем рэйзами (фолдит ~60%, согласно истории раздач).
Окей, Грок считает, что у него флеш-дро. А GPT-5 mini?
Фолд исключён: у меня натсовый флеш. Фолд теряет большое положительное ожидание.
Короче, они выставились, потому что у Грока с тремя трефами было натсовое флеш-дро, а у GPT 5-mini с тремя бубнами был натсовый флеш. Круто. Неудивительно, что в турнире эти две модели не преуспели.
Покажу ещё одну раздачу между ними.

На префлопе Грок рэйзил 5 фишек и получил колл. На флопе GPT делает сомнительный лид, Грок с оверпарой рэйзит – это более-менее. Следует колл.
Тёрн (80): . Мини лидит 30, Грок переставляет до 90, получает колл.
Ривер (230): . Мини чекает. Грок идёт олл-ин 85, получает колл.
Надо отдать должное Гроку, который не боится тонко добирать с дамами. Но почему Мини коллирует олл-ин?
Перевес диапазона и по эквити, и по натсам на стороне оппонента. У нас одна карманная пара (пятёрок), но хорошо замаскированная и имеющая ценность на вскрытии. Доска достаточно сухая в смысле закрытия флешей и стритов, повтор на тёрне делает возможными трипсы и повышает плотность вэлью у оппонента. Восьмёрка на ривере – безопасная карта для большинства готовых рук, так как только спаривает восьмёрку и не меняет текстуру.
Похоже, Мини не умеет определять стрит. Без этого навыка может быть непросто.

Вот это лузрейт! -116 бб/100. Невероятно! И, что интересно, огромный минус по красной, без вскрытия. Это точно был слабейший участник арены.
o3 vs GPT-5.2
Ну а теперь переходим к финалу. Очень интересные финалисты, на их агрессивную игру приятно смотреть, много безумных раздач. Думаю, они нас развлекут.
В первой раздаче подборки GPT минирэйзит 94s, и о3 коллирует с 53s.

Чек – чек на флопе. Окей! Пока что нормальная и разумная игра.
Тёрн (8):
Следует лид 6 фишек от о3, оппонент коллирует. В банке 20 фишек, за спиной 190, смотрим ривер.
Ривер (20):
Усилившись на ривере до совпадения тройки, на месте о3 обычно стоит чекать. На тёрне мы блефовали с 5-хай, но с парой можно идти на вскрытие. Однако о3 идёт олл-ин.
Я ставлю олл-ин 190 в банк 20. Оппонент регулярно снэп-фолдил на овербеты от двух банков и выше, и после чек-колла на тёрне его диапазон капнут на руки с одной парой – слабые и средние тузы, дамы, девятки и промазавшие гатшоты. У моих 53 почти нет ценности на вскрытии, поэтому чек выиграет раздачу редко – может быть, в 25% случаев. Если процент фолда оппонента соответствует наблюдавшимся ранее 90%, олл-ин выигрывает нам 9 фишек, тогда как чек – только 3 фишки. Даже если оппонент проявит неуступчивость и заколлирует в 15% случаев, олл-ин всё равно будет нулевым по ожиданию. Ставки меньшего сайзинга позволяет сделать комфортный колл. Олл-ин максимизирует фолдэквити. В сухом остатке: огромный овербет эксплойтит страх оппонента, а чекая, мы сдаёмся.
GPT играет в позиции, он не мог чек-коллить тёрн, просто заколлировал. Ценности на вскрытии у руки о3 вполне достаточно, и он сам объяснил, почему – из-за недоехавших гатшотов. Выигрывать на вскрытии в 25% случаев – это не называется редко.
Очень агрессивное мышление. С такой логикой часто будешь делать соперникам дорогие подарки.
Слово за GPT-5.2, и он коллирует олл-ин.
Колл. Мне нужно, чтобы оппонент блефовал ~47.5%. Он уже продемонстрировал паттерн огромных и полярных овербетов ривера, стремясь вынудить фолд с моей стороны. Мои карты также блокирует кое-какое чистое вэлью (А9, 99 и часть 54), что побуждает меня сделать тонкий, но резонный блефкетч.
А вот это неплохо! Проблема в том, что когда оппонент коллирует префлоп, у него не может быть и почти нет – это если не чистый 3-бет, то очень частый. Такой овербет изображает только и . Не думаю, что в нём могут быть две пары. Так что колл с 94s выглядит довольно хорошим, верно? Ещё лучше иметь .
В сухом остатке имеет овербет 10 банков с четвёртой парой и колл от третьего совпадения. Хорошее начало!

Рэйз от AQo, 3-бет от A2o. 3-бет мне не нравится, должен быть чистый колл. 4-бет от AQo, олл-ин от A2o. Причина олл-ина?
Оппонент открывает большую часть баттонов и агрессивно отвечает. Показал лайтовый 4-бет с K6o и вэлью 4-бет с АКо. Выкинул K6o на 5-бет, значит, способен 4-бет-фолдить. Если мы запушим и получим колл, эквити А2о против диапазона валеты+, туз-король примерно равно 26%. Колл загоняет нас в ловушку игры без позиции со слабым и доминированным тузом. Плохая играбельность, SPR 1.7 против сильного диапазона – вероятное -EV. Фолд теряет уже инвестированные 18 фишек.
Это ещё одна повторяющаяся ошибка, которую я вижу у ИИ – они не понимают, что EV фолда всегда нулевое. Играя в покер, мы не учитываем то, что было на прошлых улицах, все решения принимаются исходя из текущей ситуации.
База по GTO: A2o – один из лучших блефовых 5-бетов по блокерам в стеках 100 бб: население оверфолдит на олл-ины.
Кого они читают? Разве кто-нибудь говорил нечто подобное про А2о? Нет, я спрашиваю?
Да уж, о3 – крайне агрессивный игрок. При таком мышлении часто будешь проигрывать стеки, зато и забирать банки тоже получится часто. На этот раз стек был проигран.

Мне совершенно не нравится 3-бет с QTo. У него те же проблемы, что и у 3-бетов со слабыми разномастными тузами – у нас достаточно эквити для колла, и очень не хочется получать 4-бет. GPT-5.2 делает колл, с А8о это стандартно.
Флоп (32):
Маленький контбет 10 фишек – точно хорошо, на такой текстуре можно ставить весь спектр. С А8о флоат обязательный – и GPT-5.2 коллирует, окей.
Тёрн (52):
Карта, созданная для экшена! о3 чекает и сдаётся. Гм, это одна из редких ситуаций, когда о3 чекает, а я бы не возражал против ставки. Конечно, для блефа лучше иметь восьмёрку или девятку, но я не против иногда пробаррелить с дамой треф – это даёт нам возможность доблефа на трефовых риверах, да и не только на них. Чек-фолд, конечно, тоже совершенно нормально и, вероятно, даже предпочтительно.
На чек GPT-5.2 в позиции ставит 18 фишек. Ужасно, чудовищно. Мы выбиваем кучу рук слабее и напрашиваемся на чек-рэйз от всего, что сильнее. Наверное, сайзингом в 2/3 банка мы смогли бы выбить какие-то А-хай сильнее нашего, но маленькую ставку они оплатят. Очень плохая игра. По-моему, здесь элементарный чек следом.
По мнению GPT-5.2, ставки в 35% достаточно, чтобы выбить тузов сильнее, но я с этим совершенно не согласен. Сейчас я дам вам покерный совет, слушайте внимательно. Это общее правило, оно не всегда годится, но достаточно часто, чтобы считать его правилом. Вы заколлировали 3-бет на префлопе. Оппонент ставит флоп. Если ставит крупно и потом чекает тёрн – можете ставить мелкую. Он уже поляризовал свой диапазон, вам не нужно ставить много, чтобы выбить слабую часть. Если ставит мелко и чекает тёрн – грузите большую, 2/3 или 3/4.
Окей, с этим разобрались, возвращаемся к раздаче – и что мы видим?

А видим мы возвращение QTo к жизни с линией чек-минирэйз! Что сподвигло?
Решение: чек-рэйз до 36 в блеф. Почему: в диапазоне, который пробует забрать банк ставкой 35% против чека, должно быть очень много воздуха – думаю, не меньше 60%. Минимальный рэйз рискует всего 18 дополнительными фишками, но забирает банк, когда оппонент фолдит свой мусор. На олл-ин и спокойно выкидываю, так что потери ограничены. Колл позволил бы сопернику выбить меня на опасных риверах, ну а фолд проигрывает банк. Недорогая попытка переиграть соперника, замеченного в излишней любви атаковать чеки.
Фразу про ограниченные потери рекомендую запомнить. Также обращаю внимание: о3 не только не упоминает о трефовой даме, что, на мой взгляд, стоило бы сделать, но и вообще не говорит о своей руке! Странно. В видео, посвящённом полуфиналам, я уже говорил, что ИИ почему-то никогда не рассуждает о своей руке в контексте её места в диапазоне, вот ещё один пример.
GPT-5.2 оказывается в неприятном споте. С двухсторонкой минирэйз нужно коллировать. И он замечает двухсторонку, но пишет, что на риверах и сможет забрать стек у оверпары. Как он мог спутать и ? Меня это смущает. В остальном его рассуждения довольно разумны.

o3 чекает.
Решение: чек. Почему: олл-ин требует ~53% фолдов, но заколлировав мой чек-рэйз на тёрне, соперник оказался на ривере с большим количеством стритов, трипсов и редких фуллов. Не думаю, что он выкинет больше 35% рук, так что блеф сжигает деньги... Просто сдаюсь.
Окей. GPT-5.2 ставит 60 фишек. Я бы подумал об олл-ине, но GPT-5.2 явно знает, с кем имеет дело, потому что о3 в ответ ставит олл-ин сам! Вот это поворот!
Решение: олл-ин 138. Мой чек-рэйз на тёрне буквально кричал о фулл-хаусе. Оппонент заколлировал, ограничив свой диапазон трипсами или стрит-дро, которые доехали в стрит. Эти руки будут ненавидеть жизнь, получив олл-ин при SPR ~1.3. Оппонент показал способность фолдить средние руки против демонстрации реальной силы. Блефовый олл-ин – единственный способ разыграть нашу руку в плюс, ведь фолдом мы теряем банк.
Трипсам, конечно, придётся тяжело. Стритам – нет. И почему мы вообще говорим о ненависти к жизни в соревновании ИИ? Непонятно.
GPT-5.2 делает колл и выигрывает стек.
Продолжаем. GPT-5.2 минирэйзит K6s, о3 ставит 3-бет с А9о, следует колл. Совершенно нормально.

Флоп (28):
На этой доске мы обычно используем крупный сайзинг и ставим контбет не очень часто. С А9о я бы чаще чекал. о3 ставит 10 – ну, можно играть с рейнджбетом, тогда сайзинг должен быть маленьким. У K6s лёгкий колл.
Тёрн (48):
Мы видим баррель 30 от o3 и колл от GPT-5.2. Я бы точно рекомендовал о3 притормозить и чекнуть тёрн. Не могу сказать, что это был ужасный второй баррель, но довольно пограничный уж точно. Колл от GPT-5.2, конечно, не вызывает вопросов.
Что ж, пока всё более-менее хорошо.

o3 ставит олл-ин с топ-парой и кикером слабее доски! GPT-5.2 со вторым флешем коллирует. Откуда взялся этот олл-ин?
SPR ~1.35, бубновый валет на ривере закрывает флеш и бродвейный стрит. У нас натсовый флеш.
Ну, как обычно: четыре бубны = флеш, можно отгружать стек. В очередной раз не получается определить флеш.
Покажу ещё парочку раздач с рассуждениями моделей, а потом перейдём к статистике.

o3 коллирует. С этой рукой мне больше нравится 3-бетить, но миксовать их с коллами тоже можно.
Флоп (10):
У обоих игроков бэкдоры. o3 чекает, GPT-5.2 ставит 3, о3 чек-рэйзит до 12, GPT-5.2 коллирует. Чек-рэйз о3 мне нравится – два бэкдора, можем сразу выбить некоторые руки старше нашей, на сухой доске нужны креативные блефы. Вэлью-рук у нас здесь не слишком много – 22, 33, J2s и J3s, вот и всё. Нет валетов с высокими кикерами, так как они уходят в 3-бет префлоп. Поэтому с креативными блефами лучше не перегибать палку, чтобы не переблефовать, но нам обязательно нужны блефы без стрит-дро, и T8s вполне годятся.
Тёрн (34):
o3 чекает. Я бы, скорее, баррелил. Мы не блокируем все стрит-дро с флопа, которые играют колл флоп, фолд тёрн, и блокируем некоторые флоаты, которые поймали даму. Руки такого типа становятся моими главными блефами, но и чек-фолд не ужасен.
GPT-5.2 ставит 22. И эта ставка в позиции не несёт для меня смысла. Чего мы хотим добиться?
Оппонент часто играет линию чек-рэйз флоп, чек тёрн, бет ривер. Также он показал готовность фолдить против сильного давления, особенно на полярные ставки, но очень цепок с совпадениями против более мелкого сайзинга. Наша рука – туз-хай и гатшот к стриту, ценности на вскрытии недостаточно для чека тёрна, держа в уме вероятную ставку от оппонента на ривере. Ставка на тёрне получает немедленные фолды от воздуха и некоторых мелких пар и слабых валетов, не даёт реализовать эквити и украсть банк на ривере.
Не возражаю против логики поставить сейчас, чтобы не дать себя заблефовать потом. Однако с АТо мы выбиваем только руки слабее, так почему бы не прочекать и вскрыть блеф по любому риверу? Выбить валета будет сложно, выбить совпадение младше – маловероятно, плюс в полярном диапазоне соперника, игравшего чек-рэйз на флопе, младших совпадений будет мало.
о3 делает колл. Вот этого решения я уже не очень понимаю, и оно мне не нравится. Мы даём себя заблефовать на ривере стрит-дро слабее и проигрываем всем чекбэкам. Если уж продолжать, то чек-рэйзом.
Крупная ставка оппонента на тёрне поляризует его в сторону Q+ и сильных дро. Слабые Jx и чистые флоаты будут в меньшинстве. Наша рука – двухстороннее стрит-дро с примерно 17% эквити против вэлью и небольшим шоудаун-вэлью против переигранных рук вроде K9/AT и т. д.
Во-первых, у тебя гатшот. Во-вторых, у 10-хай нет шоудаун-вэлью против туза-хай. В-третьих, у оппонента и правда . Ювелирная точность ридса! В сущности, ИИ-эквивалент Негреану, который называл руки соперников на High Stakes Poker и потом отдал стек против каре.
Ладно, смотрим ривер.

Донкпуш от о3!
Наш диапазон вэлью на тёрне = Jx (AJ, KJ, QJ), сеты (22/33/JJ), изредка заслоуплеенные оверпары. Блефы – бэкдорные трефы, QT/KT/T9 и т. д. Коллы оппонента – большинство Jx, оверпары, заслоуплеенные монстры.
Ты коллировал на префлопе, дружище, у тебя нет большинства этих рук!
На ривере банк 78, эффективный стек 161, наше слово. Ривер идеально подходит нашему диапазону: КТ усилились до стрита, появилось много двух пар c тузом. Оппоненту придётся тяжело, многие его доборы на тёрне (QJ, KJ, сеты) теперь позади или вынуждены играть в угадайку. Натс даёт только КТ, но это крошечная часть всего диапазона с учётом линии (редко коллирует рэйз флопа с голыми КТ). Мы не можем выиграть на вскрытии с 10-хай. Блеф обычного размера часто получит колл от пары или двух пар. Для максимального фолдэквити мы должны использовать страх оппонента перед огромными ставками и сделать овербет-пуш, изображая КТ или сильного туза.
Я смотрю, ИИ часто рассуждает о страхе оппонента – интересно! В теории я не должен так уж ругать этот блеф, ведь это очень редкая комба. Но нет, я же никогда здесь не донкаю, значит, блеф всё-таки ужасный. Я пересмотрел столько ужасных раздач, что, кажется, у меня развился Стокгольмский синдром. Нет, это просто ещё одна плохая раздача.
GPT-5.2 делает колл, и это сильный и хороший колл. Топ-пара, блокер на стрит. Также он считает, что блокирует , , , и , что немного странно, потому что не принимает в расчёт игру на префлопе.

На префлопе рэйз 5 и колл. Контбет и колл на флопе меня тоже вполне устраивают.
Тёрн (16):
Чек. Баррель 12! Колл. Снова хорошие решения.
Ривер (40):
Чек. И о3 идёт олл-ин 180. Олл-ин! И делает колл!

Обычно на спарках гиганские сайзинги не используется. Ещё одн совет общего характера для желающих стать сильнее: когда у нас нет трипса, в диапазоне оппонента их становится намного больше, поэтому обычно не стоит перегибать с сайзингом.
Однако если заставить меня выбирать руки для блефового олл-ина, выглядят довольно хорошим кандидатом. Тройка – ключевая карта. Король не очень подходит, потому что для редких блефов хочется брать руки из самого низа диапазона, но ценности на вскрытии у него всё равно нет.
о3 рассуждает о блокере на натсовый стрит и говорит, что овербет максимально карает оппонента за явную склонность оверфолдить руки средней силы. В общем, идея не ужасная, мне просто не нравится такой большой овербет.
Колл от GPT-5.2 ещё интереснее, на самом деле! Как можно вскрыть по совпадению четвёрки без блокера на стрит?
Игрок0 показал по ходу матча, что готов оказывать максимальное давление огромными овербетами и ставить три барреля в блеф со слабыми руками. Всё это резко поднимает ценность нашего блефкетчера. Мы также блокируем 44 и 45.
Довольно хороший ридс, хотя я предпочёл бы блокировать стриты, а не фуллы. И хороший колл.

Плохой 3-бет от о3. K6s коллируют, это стандартно.
Флоп (36):
Контбет 12 – колл. Стандарт.
Тёрн (60):
о3 ставит второй баррель – 40. Мне это нравится. Чек-колл с такой двухсторонкой кажется пограничным, чек-рэйз – тоже, поэтому ставим. GPT-5.2 коллирует с парой и флеш-дро, всё хорошо.

На ривере о3 сдаётся с К-хай – чек. И GPT-5.2 ставит маленький добор 40 фишек. Эта ставка вызывает у меня отвращение. Ещё один совет общего плана: когда в большом банке оппонент чекает на ривере и слово переходит к вам, у вас почти никогда нет мелкого сайзинга. Ставим крупно или чекаем. Маленькая ставка практически всегда ошибочна.
В ответ о3 чек-рэйзит олл-ин!
Крошечная ставка оппонента на ривере говорит о слабых доборных руках, которые должны фолдить на пуш. У олл-ина явно положительное ожидание, тогда как у колла оно отрицательное, а у фолда – нулевое.
Ух ты, в первый раз кто-то из ИИ явно утвеждает, что EV фолда нулевое. Прогресс!
В целом мне нравится, что мы не блокируем восьмёрку, девятку и трефы. Жаль, что блокируем бубну. С линия нравилась бы мне больше. Но и с этой рукой тоже нельзя сказать, что совсем плохо.
GPT-5.2 находит колл. Что я могу сказать? Когда в позиции ты ставишь блокинг, нужно быть готовым получить чек-рэйз, и приходится искать подходяшие для колла руки или вскрывать со всеми с некоторой частотой. Не могу осуждать этот колл.
Ладно, с раздачами всё, теперь переходим к разбору статистики. Сначала олл-ины. За матч сыграли 344 олл-ина, и о3 выиграл 44.5% из них – разгромное поражение. Чтобы восполнить этот минус, нужно прилично выигрывать в мелких и средних банках.

Оба играли в свой обычный покер. Я ожидал чуть более заметных подстроек, учитывая ярко выраженные стилевые особенности оппонентов. Префлоп оба играли похожим образом – открывали почти все руки с баттона и очень лузово и агрессивно защищали большой блайнд. Не проверял, но меня бы не удивило, если бы оба показали отрицательный винрейт на баттоне. Их опены не проходили, их встречали 3-бетом в 30%. Правда, они агрессивно 4-бетили в ответ, что выравнивает ситуацию. Не знаю.
Открываться нужно было тайтовее. Я бы рэйзил по GTO или даже тайтовее, то есть 82% или меньше. Напоминаю, первая линия статов – это рэйз с баттона, защита ББ, 3-бет, фолд на 3-бет, 4-бет и фолд на 4-бет. Понимаю, всё это может звучать чересчур по-задротски, но я пытаюсь объяснять, как бы я подстраивался против оппонентов с похожими статами в реальной игре.
На 4-беты они падали довольно часто, и о3, похоже, сориентировался лучше и 4-бетил активнее. 14% – это очень высокий 4-бет, но хорошая подстройка под оппонента, который 3-бетит 31%.
В раздачах, которые мы видели, GPT-5.2 играл намного лучше о3. Меньше дарил, лучше рассуждал и в целом выглядел более умным игроком, хотя затмения случались и у него.
В статистике баррелинга по улицам GPT-5.2 переагривал, но в пределах разумного. о3 атаковал заметно чаще и при этом меньше фолдил на баррели оппонента на флопе и тёрне. Думаю, и здесь подстройки о3 были лучше, хотя его фолд на ривере немного завышен.
Теперь важная четвёртая строчка – ставки против чеков. Первое число – 76 и 79 соответственно – ставка на тёрне против чека флопа. Теоретический оптимум – примерно 40! Эти модели ставили в чек буквально всегда, набрасываясь на слабость. При этом о3 намного реже сдавался – всего 29% против 45% у GPT-5.2. Похожие показатели и против отложенных контбетов.
Ещё один совет. Большинство людей – и, похоже, большинство LLM! – играют слишком консервативно. Поэтому одной только неутомимой агрессии вместе с относительной адекватностью в олл-инах часто будет хватать для победы. Если оппоненты неправильно строят диапазоны, вы сможете забирать очень много мелких банков.
Кажется, в локальных стратегических столкновениях о3 переигрывал GPT-5.2. Однако более крупные лики сводили это преимущество на нет.
В финале встретились два гиперагрессивных соперника. Кто же вышел победителем?

GPT-5.2! Он разобрал соперника, показав прекрасный винрейт 35 бб/100.

о3 удалось задавить оппонента по красной, но на вскрытиях он проиграл заметно больше.
Выигрывать в HU можно в любом стиле. GPT-5.2 играл слишком лузово на префлопе, но дальше неплохо балансировал против разноплановых соперников. Я показалось, логичнее всех рассуждал Gemini, у него было меньше всего ошибок, но он слишком тайтился на префлопе, и преодолеть этот недостаток не получилось. Думаю, GPT-5.2 стал чемпионом по праву.
В завершение – забавный момент.

Участники турнира играли с очень разной статистикой, но если взять среднее – рэйз 83% и 3-бет 24% – получается почти GTO!
Gemini 3 Pro играл чудовищно тайтово с баттона – фолдил почти половину рук. Не представляю себе, как так можно.
DeepSeek на префлопе был разумнее всех, но чудовищно слабо рассуждал на постфлопе.
Стоит отметить, что лучшие винрейты показали три очень агрессивных участника. А два других гиперагрессора заняли два последних места.
Спасибо за внимание! Надеюсь, вам понравилось. Увидимся!