Прощай, лимитный холдем (2015)

Покорение покера программными методами началось в североамериканских университетах, с лимитного холдема один на один.

В начале 2015 года команда ученых из канадского университета Альберты, усиленная специалистом из Финляндии, объявила о решении лимитного холдема один на один. Созданная ими программа Cepheus («Цефей», по-английски читается как «Сифиус») играет максимально близко к GTO. Префлоп-чарт, стратегия на постфлопе и код программы выложены на сайте проекта.
Читать

В статье мы подробно описываем стратегию бота на префлопе и разбираем для примера одну раздачу.

Изучать решённый «Цефеем» префлоп можно на сайте университета. Поддержка постфлопа и тренировочных матчей с ботом, похоже, уже отключена.

Анатомия лимитного холдема (2015)

Через несколько дней мы выпустили вторую часть статьи, посвящённой «Цефею».

Классические раздачи Феруэлла, TexasLimitKing и Брайана Гастингса, а также некоторые стандартные ситуации лимитного холдема один на один раскрываются по-новому, когда их оценивает «Цефей» – главный на сегодня специалист по этой игре.
Читать

В подборку раздач вошёл эпичный коллдаун с 4-хай и ряд примеров из творчества известных профессионалов. За исключением самой первой раздачи, мы приводим не только действия бота с пояснениями, но и комментарии Феруэлла – легендарного хайроллера и лучшего в истории лимитного холдема популяризатора этой игры.

Далее мы разбираем оптимальную машинную игру на двух текстурах – и , на которых людям особенно сложно защищаться с правильной частотой и правильными руками.

NLHU – человек против машины (2015)

В конце апреля того же года мы рассказали о матче уже по безлимитному холдему. Бот университета Карнеги-Меллон играл против четырёх хэдз-ап специалистов, сильнейший из которых – Даг Полк – был в то время признанным лидером человечества по игре один на один.

В эти дни проходит историческое для покера событие – четверо топ-регуляров безлимитного холдема один на один во главе с Дугласом Полком сражаются против бота, созданного в университете Карнеги – Меллон. Игра на четырёх столах транслируется с открытыми картами.
Читать

Чтобы как можно сильнее снизить вероятность случая, расклады карманных и общих карт в каждых двух матчах между людьми и компьютером были «зеркальными».

Много интересных раздач, комментарии игроков и разработчиков! Матч на момент написания статьи ещё продолжался, а человечество с оптимизмом смотрело в будущее.

Хэдз-ап против бота: люди пока сильнее (2015)

Итоги матча и впечатления его участников мы опубликовали в середине мая. Стоит отметить, что больше всех у машины выиграл Бьорн Ли – тот самый AsianFlushie, который сейчас играет в плюс хэдз-апы с Линусом Лёлигером.

8 мая в казино Rivers в Питтсбурге завершился марафонский матч по дубликатному покеру между четырьмя регулярами HU NLHE во главе с Дугласом Полком и ботом Клодико, разработанным в университете Карнеги – Меллон. О правилах и первых днях поединка мы писали в конце апреля.
Читать

Заголовок, на самом деле, слегка вводит в заблуждение: по мнению авторов эксперимента, на самом деле люди с ботом сыграли вничью! В статье мы объясняем, откуда взялось это противоречие.

Стоит обратить внимание на речь Дага Полка, в которой он слегка прошёлся по действиям организаторов и поделился впечатлениями от игры оппонента.

Кстати, как вы думаете, в чью пользу было бы считать олл-ины не по результату, а по эквити? Кому заметно больше везло в олл-инах, живым игрокам или машине?

Загадочный овербет искусственного интеллекта (2015)

Бонус вдогонку – глубокий разбор одной очень странной раздачи из этого матча, в котором поучаствовали Бен Сульски, Кевин Рабичоу, Ник Ховард и специалисты по GTO с форума 2+2.

Светлые головы форума Run It Once обсудили раздачу, в которой HU-бот Клодико поставил Джейсону Лесу овербет-олл-ин 11 банков, когда у Леса был блокер на первый натс.
Читать

Искусственный интеллект учится играть в трипл-дро (2015)

Этот текст предназначен для настоящих маньяков трипл-дро – или для тех, кто хочет освоить базовые принципы этой игры и проверить себя на Phenom Poker. Очень подробное обсуждение логики каждого решения и альтернативных вариантов – настоящий мастер-класс по 2-7 трипл-дро.

Бывший покерный профессионал из Нью-Йорка Николай Яковенко рассказал читателям PokerNews (http://www.pokernews.com/strategy/teaching-an-artificial-intelligence-system-to-play-2-7-tripl-22530.htm), как учит искусственную нейронную сеть играть в 2-7 трипл-дро.
Читать

Создатель бота, американец Николай Яковенко, профессионально игравший в покер в начале 2010-х, давно ушёл в программирование и сейчас занимается проектом DeepNewz – лентой новостей, моделируемой нейросетью.

Статистическая победа (2017)

Через два года усилившийся ИИ покоряет-таки безлимитный холдем! Команда друзей Дага Полка, заметно ослабленная отсутствием AsianFlushie и самого Дага, демотивированного условиями предыдущего матча, терпит разгромное поражение от нового бота университета Карнеги – Меллон.

30 января 2017 года программа Либратус пробила оборону человечества в безлимитном холдеме один на один, разгромив команду четырёх друзей Дага Полка с винрейтом 14.7 бб/100. Ни один из соперников бота не смог сыграть в плюс.
Читать

В статье можно ознакомиться с хроникой матча, его результатами, узнать о причинах поражения и разобрать самые глупые и самые гениальные раздачи в исполнении машины.

Как думаете, на какой улице превосходство машины над людьми больше всего? Донг Ким уверен, что правильный ответ очевиден.

Нейросеть пленяет шахматистов (2017)

Инициативу в создании нейросетей, способных обыграть кого угодно в сложные стратегические игры, подхватил Google. Нейронка от компании DeepMind сначала одолела чемпиона Европы по го (что примерно соответствует чемпиону Африки по лыжному спорту), а потом, почти без перерыва, легенарного корейского профессионала Ли Седоля. Ли Седоль выиграл у машины всего одну партию – но сейчас это выглядит грандиозным успехом, а об этой партии даже написали отдельную книгу.

Мы подробно рассказываем, как эти матчи повлияли на современное го. Однако основная часть статьи «Нейросеть пленяет шахматистов» посвящена успехам следующего проекта DeepMind – шахматной нейросети Alpha Zero.

5 декабря произошло событие, после которого шахматный мир не будет прежним: нейросеть Alpha Zero, созданная разработчиками DeepMind, научилась играть в шахматы на невиданном уровне – некоторые гроссмейстеры уже называют его божественным. В ситуации разобрался Михаил «BadSeed» Савинов.
Читать

Гроссмейстеры уже научились жить в мире, в котором они проигрывают смартфону. Теперь они наблюдают за тем, как в одночасье на их месте оказались ведущие движки старого поколения, о которые вытирает ноги нейросеть, изначально созданная для другой игры.

Мы подробно рассказали о том, как создавалась Alpha Zero, цитируем восхищённых шахматистов, скептических конспирологов и их оппонентов. В конце статьи приведена шедевральная партия Alpha Zero против Stockfish с большим количеством диаграмм, позволяющих следить за ходом игры без доски. Нейросеть жертвует фигуру, причём, можно сказать, интуитивно – математическое оправдание этой жертвы лежит далеко за пределами компьютерного перебора.

Эксперимент Facebook AI: Плурибус побеждает профессионалов, включая Линуса Лёлигера, в 6-макс (2019)

Летом 2019-го пал последний бастион покера – безлимитный холдем 6-max. Из-за сложностей работы с бесконечным числом сайзингов и мультипотами, а также в силу отсутствия равновесия Нэша за пределами игры один на один, многие эксперты предсказывали, что люди ещё долго будут сильнее машин на 6-max-столах. Но, как известно из анекдота, когда убегаешь от медведя, достаточно бежать быстрее товарища. Может быть, новый бот Карнеги – Меллона не так близок к божественному уровню, как «Цефей» в лимитном холдеме, но оказался достаточно сильным, чтобы побить всех, кроме Линуса Лава.

Новое и, видимо, последнее слово в покорении безлимитного холдема программами университета Карнеги – Меллона: бот Плурибус показал 5 бб/100 на коротком столе против пяти профессиональных игроков.
Читать

В статье мы рассказываем подробности эволюции «Плурибуса», детали постановки экспериментов, приводим их результаты и мнения участников, среди которых внезапно оказался Крис Фергюсон, показавший, как ни удивительно, отнюдь не худший лузрейт.

Так ли силён Плурибус? (2019)

По горячим следам у нас вышел лонгрид, вывод которого получился одновременно шокирующим и многообещающим.

С этим вопросом мы обратились к создателям солверов Simple Poker и регуляру высоких лимитов Илье friendlykam, чтобы разобраться в реальном значении эксперимента Facebook AI для покерной индустрии.
Читать

Нейросеть DeepMind прошла Старкрафт? Объясняем, почему это не так (2019)

Ещё одна сенсация от DeepMind – достижение их ботом гроссмейстерского уровня в StarCraft 2. Выйти на высокий уровень в стратегии реального времени с туманом войны – это настоящее чудо. Вот только вопросов к этому результату оказалось слишком много. Мы не стали цитировать содержание статьи в Nature и её комплементарные пересказы в СМИ, а обратились к специалисту – Alex007, главному русскоязычному эксперту по Старкрафту. Эксклюзивное большое интервью с Алексом – праздник для любого любителя Старкрафта.

Как это ни парадоксально, агенты проявляют себя довольно по-разному в зависимости от расы. Такое впечатление, что у них разный уровень стратегической подготовки. Например, агента-зерга каждый раз откровенно ставила в тупик угроза с воздуха. Может быть, слишком малый процент реплеев, по которым он обучался, содержал примеры воздушной агрессии, особенно массовой. Агент-протосс действовал более разнообразно. У него тоже были странности в стратегии, но за счёт более богатого подбора билдов и, как следствие, составов армий он мог лучше реагировать на широкий спектр угроз. Думаю, поэтому агент-протосс и выступил на ладдере лучше всего. Почему-то – только DeepMind известно, почему – агент-протосс стратегически оказался сильнее.

Но это всё частности. В целом ситуация следующая: стратегически арсенал бедный, но неплохой. Большинство стратегий, отобранных для игры на ладдере, сами по себе весьма эффективны: упор на серьёзную халяву в начале с довольно слабой разведкой; практика показывает, что на высоком уровне это работает хорошо. На уровне ладдера 6000+ MMR пул стратегий в целом не очень широкий. Люди тренируют механику, шлифуют исполнение билдов, играют по лекалам профессионалов. Когда у тебя узкий диапазон стратегий и ты не особо разведываешь, тебе выгодно, чтобы у соперника тоже был узкий диапазон. Боты AlphaStar хорошо адаптированы к задачам, которые нужно было решать на ладдере.

В большом интервью Михаилу Савинову главный аналитик русскоязычного Старкрафта Алексей «Alex007» Трушляков призывает воздержаться от фанфар в адрес искусственного интеллекта и внимательно проверить факты.

Читать

Тему со Старкрафтом в DeepMind развивать не стали, а вместо этого пошли в химию. CEO DeepMind Демис Хассабис в прошлом году удостоился Нобелевской премии.

Прекрасный ум (2015)

Последняя статья в подборке, как несложно догадаться, посвящена памяти гениального Джона Нэша, без открытий которого не появилась бы ни одна из предыдущих.

Величайший математик XX века, лауреат Нобелевской премии, основоположник теории игр Джон Форбс Нэш-младший погиб в автокатастрофе вместе со своей женой Алисией. Нэшу было 86 лет, Алисии – 82. GipsyTeam вспоминает человека, которым восхищались многие в покерном мире.
Читать