NLHU – человек против машины

84 комментария
NLHU – человек против машины

В эти дни проходит историческое для покера событие – четверо топ-регуляров безлимитного холдема один на один во главе с Дугласом Полком сражаются против бота, созданного в университете Карнеги – Меллон. Игра на четырёх столах транслируется с открытыми картами.

Первым о запланированном матче между ботом Клодико и четырьмя представителями человеческой расы сообщил в своём блоге 20 апреля Нолан Далла. Позднее запись была удалена. В тот же день была создана тема на 2+2.

Подробная информация появилась спустя пару дней на сайте университета Карнеги – Меллон. Проект Brains Vs. AI стал продолжением долгосрочной программы университета по исследованию искусственного интеллекта, начатой в 1956 году. Именно в этом университете работал Ганс Берлинер, чемпион мира по шахматам в игре по переписке 1965-1968, ставший известным в 70-80-е годы как один из пионеров шахматного программирования. Созданная Берлинером в качестве побочного продукта программа по игре в нарды в 1979 году впервые в истории обыграла в матче действующего чемпиона мира. Три ученика Берлинера, окончившие университет Карнеги – Меллон, создали компьютер Deep Blue, нанесший поражение Гарри Каспарову в 1997 году. Работа над покерным ботом по безлимитному холдему для игры один на один началась около 11 лет назад.

Университет Карнеги – Меллон
Университет Карнеги – Меллон

Условия матча

– Игра проходит в казино Rivers в Питтсбурге.

– За две недели с 24 апреля по 7 мая 2015 года будет сыграно 80,000 раздач, по 20,000 против каждого из четырёх приглашённых профессионалов.

– Соперники: бот Клодико (Claudico – от латинского «хромой», англ. limp) сыграет с Дугласом «WCGRider» Полком, Донгом «Donger Kim» Кимом, Бьорном «asianflushie» Ли и Джейсоном «cheet» Лесом. Ник последнего на PokerStars неясен, среди версий – megabanny, ForTheSwaRMm и JLlama.

– При любом исходе игроки получат $100,000, выделенных спонсорами – Microsoft Research и Rivers Casino.

– Время игры – с 11 утра до 8 вечера с перерывами по просьбам игроков.

– Расклады карманных и общих карт в каждых двух матчах между людьми и компьютером являются «зеркальными», чтобы минимизировать влияние случая. Игроки, чьи матчи с машиной являются зеркальным отражением друг друга, будут находиться на разных этажах казино.

– Все раздачи играются с глубиной стеков в 200 больших блайндов.

– Матч в полном объеме и с открытыми картами будет показан на соответствующих каналах Twitch.TV:

Клодико – Дуглас Полк http://www.twitch.tv/claudico_vs_dougpolk
Клодико – Донг Ким http://www.twitch.tv/claudico_vs_dongkim
Клодико – Бьорн Ли http://www.twitch.tv/claudico_vs_bjornli
Клодико – Джейсон Лес http://www.twitch.tv/claudico_vs_jasonles

По словам создателя Клодико профессора Туомаса Сандхольма, покер сейчас находится в центре внимания учёных, занимающихся проблемой искусственного интеллекта, как ранее шахматы. Это исключительно сложная игра для машины, вынужденной принимать решения в условиях неполной и противоречивой (блеф, слоуплей...) информации.

Стратегия Клодико была алгоритмизирована профессором и его аспирантами Ноамом Брауном и Сэмом Ганцфридом. Расчёты проводились на суперкомьютере Blacklight в суперкопьютерном центре в Питтсбурге.

«Мы отрабатываем алгоритм на покере, но возможности их применения гораздо шире, – говорит Сандхольм. – Борьба с киберпреступностью, торговля, медицина...»

Шансы своего бота на успех профессор оценил как 50 на 50.

Дуглас Полк был более оптимистичен относительно возможностей человеческого разума: «Надеюсь, мы сможем выступить от имени человечества и разбить компьютер! Понимаю, что со временем компьютеры обыграют людей, но мы постараемся затянуть это противостояние, как Каспаров в шахматах».

Профессор Сандхольм
Профессор Сандхольм

Обсуждение на 2+2

timfbmx (veteran)
Итак, кого считаем фаворитом?

WowLucky (veteran)
Бот должен быть аутсайдером.

Loctus (Carpal/Tunnel)
WCG и Донг разнесут бота вхлам.

Akimka (adept) (Zedmor)
Кто мог согласиться на это? У WCG, очевидно, нет шансов, потому что его перевес базируется на использовании ошибок в стратегии людей, а в этом матче его приближение к равновесию Нэша столкнётся с более совершенным. Победитель очевиден.

what is check (centurion)
Очевидно, ты понятия не имеешь, о чем говоришь.

Akimka (adept)
Очевидно, ты не понимаешь теорию игр.

good2cu (Pooh-Bah) (Эндрю Робл)
Боты для HU NL сегодня подошли вплотную к тому, чтобы обыгрывать регуляров NL100, но никак не лучших в мире игроков один на один.

Посмотрим, что изменится через пять лет :)

punter11235 (Pooh-Bah)
В холдеме всего 1,755 стратегических различных видов флопов. Думаю, через 2-3 года максимум на ноутбуках появятся программы, непобедимые для обычного человека. К счастью, за пределами хэдз-апа ситуация совсем другая, и покер для нескольких человек не решат ещё долго (если решат вообще), потому что к нему неприменимо равновесие Нэша – достаточно одного игрока, который творит ерунду, чтобы игра по равновесию Нэша стала для некоторых других игроков сильноминусовой.

Думаю, для WCG неплохо остаться в памяти человеком, обыгравшим в покер суперкомьютер. Через пару лет, когда его укатает ноутбук среднего класса, в таком матче не будет никакого смысла.

День 1

Первая сессия:

Вторая сессия:

Итоги дня по мнению Клейтона Ньюмана:

Аспирант Ноам Браун ответил в чате Twitch.TV на вопросы зрителей:

– Учитывает ли Клодико тайминги соперников?
– Нет, мы не стали вводить этот параметр, чтобы профессионалы не тратили на каждую раздачу по три минуты... как это делаем мы.

– Можно ли ускорить принятие решений на ривере?
– Для полного расчёта стратегии на ривере требуется время – порядка трёх минут...

– Будет ли Клодико менять игру на следующий день?
– Этого стоит ожидать...

– Довольны ли вы промежуточными результатами?
– Я очень доволен тем, как идёт матч. У Клодико есть очевидные слабости, но он усилится.

Дуглас Полк:
– Этот бот – настоящий Кану среди ботов: играет не очень хорошо, но обожает странные рэйзы.

День 2

Первая сессия:

После 10,000 раздач выигрыш команды Полка упал до 85,700 (+8.75 бб/100), результат после 12,000 раздач обнаружить не удалось.

Фрагменты матчей, отмеченные на 2+2

Бот поставил два банка на ривере с Ks 6x , доска Ts 7s 5s 8x 8x , молодец! Но у Дага были Qc 8c .

Компьютер сделал 3-бет в семь раз больше рэйза (21 бб на рэйз 3 бб)!

Стандартная ставка в 19 с половиной банков:

Бьорн Ли только что заколлировал овербет в 19 банков на ривере с двумя парами и ему показали стрит: Ax 6x на доске Ax 6x 7x 4x 9x против 8x 5x . В такой же ситуации Донг тоже поставил большой овербет-пуш, и компьютер сделал колл, но банк получился немного больше.

У WCG Kx Kx , бот сделал лимп, WCG переставил, бот сделал 4-бет, WCG предпочёл колл. Флоп Qx 9x x , WCG сыграл чек-рэйз, бот заколлировал. Тёрн 9x , выставились в олл-ин, бот показал Ax 9x .

На другом столе cheet сделал рэйз с Ax 9x и заколлировал рерэйз. На флопе Qx 9x x бот поставил два банка (4,400 в банк 2,200), cheet сделал хороший пас.

Неплохой пример дисперсии в дубликатном покере!

У flushie на большом блайнде Ax Qx , он сделал 3-бет и поставил на флопе Ax Qx x с двумя трефами, сыграл чек-колл на терне Tx , прочекал на ривере Kx и после долгих раздумий заколлировал ставку в полбанка. Бот показал Kx x треф.

Donger на другом столе заколлировал 3-бет, заколлировал ставки в банк на флопе и терне, а на ривере сыграл пуш после того, как компьютер поставил 10% банка (1,350 в банк 13,500; доставить на пуш оставалось около 11,000). Бот сфолдил.

Ещё одна интересная дубликатная раздача.

WCG рэйз 300 ( Kd Ts ), бот 2,100, WCG колл.

Флоп Kx 4d 2d , чек – чек. Терн 7h . Бот 4,200, WCG колл. Ривер Ac . Бот 13,200, WCG танк-колл и проиграл Ax Kx .

На другом столе: бот – рэйз 250, Джейсон Лес с Ax Kx – рерэйз 800, колл.

Флоп Kx 4d 2d , Джейсон – 1,200, колл. Терн 7h . Джейсон – 3,000, бот – колл. Ривер Ac – чек – чек, у бота Kd Ts .

Бот сошёл с ума? Сделал рэйз 250 с Ax 3x , Полк заколлировал с Qx Jx . На флопе Kx Tx x (банк 500) Полк донкнул 100 и получил колл. Тёрн – Ax (банк 700), чек – чек. Ривер x (банк 700). Полк – чек, бот – 2/3 банка (469), Полк, посмеявшись, овербет олл-ин 19,181. Бот моментально нажал на колл.

Что это такое вообще? По крайней мере второй раз бот коллирует огромный овербет чек-пуш на ривере со слабым тузом!

(Моментальная реакция одного из разработчиков, Сэма Ганцфрида: «Должен коллировать только в 7.8% случаев! Просто не повезло...»)

Судя по первым дням, подстройка со стороны людей состоит в следующем: фолдить на огромные овербеты; дёшево блефовать без позиции; слишком часто контбетить флоп, не переживая из-за несбалансированного диапазона ответного чека на тёрне.

Рейтинг:

+1 -1
-

Зачем регистрироваться на GipsyTeam?

  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.