Новость

Сверхчеловеческий смартфон

GipsyTeam

16.01.2018 10:30 2231 23 комментария

Ноам Браун и Туомас Сандхольм – авторы покерных ботов «Клодико» и «Либратус» – ответили на вопросы посетителей сайта Reddit.

Одна из недавних статей Ноама и Туомаса, в которой они описали методы решений игр с неполной информацией [PDF], была признана лучшей на ежегодной конференции NIPS-2017 (Neural Information Processing Systems), а другая, посвященная победе «Либратуса» над профессионалами, была опубликована в журнале Science.

– Планируете ли вы замахнуться на 6-макс?

– Короткий ответ: наши методы будут работать и в 6-максе (покажут сверхчеловеческие результаты). Решение игр с тремя и более участниками – интересная научная задача, но покер – не самая оптимальная область для этого. Есть игры, которые подходят лучше.

Подробный ответ: игры с тремя и более участниками предоставляют множество интересных теоретических и практических научных задач для существующих подходов. Начать стоит с того, что приближенное решение равновесия Нэша больше невозможно просчитать. Даже если вы его найдете, не факт, что захотите по нему играть. В игре для двух человек с нулевой суммой равновесие Нэша гарантирует, что вы не проиграете по ожиданию, вне зависимости от действий оппонента. В играх с 3+ участниками это уже не так. Можно проиграть, даже если вы играли по Нэшу. Поэтому для таких игр нужны новые методы, и важно понять, как в них оценивать эффективность.

При этом все наши методы хорошо себя зарекомендовали в играх для 3 и более человек. У этого есть две основные причины:

1. В покере игроки часто выбрасывают, и чем больше человек за столом, тем выше вероятность, что нужно выбрасывать. В результате большинство банков все равно разыгрываются один на один.

2. В покере нет командной игры. Нельзя объединиться с другим игроком, чтобы обыграть третьего. Это будет сговором и нарушением правил.

Разработчики покерных ботов для работы над игрой (во всяком случае, так они говорят), рассказывали мне, что по этим причинам наши методы применимы и для 6-макса. Для всех популярных разновидностей покера, в которые сейчас играют в онлайне, уже существуют боты (сверхчеловеческий искусственный интеллект). А объективное соревнование в 6-максе устроить практически невозможно, потому что сложно контролировать сговор между людьми (в том числе подсознательный).

– Вы говорите, что игра по Нэшу в игре с 3+ участниками не гарантирует беспроигрышный результат. Разве это возможно? Ведь беспроигрышность – это основа равновесия Нэша.

– Нэш гарантирует отсутствие проигрыша по ожиданию только в игре с нулевой суммой для двух человек. В игре с 3+ участниками равновесие Нэша гарантирует лишь то, что ваш результат не улучшится, если вы в одностороннем порядке измените стратегию. То есть вы можете проиграть, даже если все будут играть по одному равновесию Нэша, потому что соперники могут против вас объединиться (осознанно или нет).

Также может возникнуть «проблема выбора равновесия». Это когда возможны несколько равновесий Нэша, и вы будете играть по одному, а соперники по другому. Поэтому невозможно просто посчитать равновесие Нэша и играть по нему, так как вы не можете быть уверены, что оппоненты будут играть по тому же равновесию. В играх с нулевой суммой для двух игроков этой проблемы не существует.

Один из читателей предположил, что ботам будет гораздо сложнее овладеть омахой.

Ноам Браун с этим не согласен:

– Я подозреваю, что преимущество ИИ над человеком в омахе будет даже больше, чем в холдеме. Дело в том, что ИИ гораздо лучше учитывает блокеры (по крайней мере, такие выводы я сделал в холдеме), а в омахе их влияние еще более существенно. Величина древа игры проблемой не является. В холдеме мы работаем с величинами 10¹⁶¹. Ничего принципиально не изменится, если добавить еще пару нулей.

– С какой частотой «Либратус» выбрасывает тузов на префлопе?

– 0%

– Как думаете, в ближайшие 6 лет боты смогут убить онлайн-покер?

– Да, вероятность этого увеличивается. Но у меня есть некоторые идеи, как выявлять ботов. Так что пока непонятно, к чему приведет эта угроза.

– Сравнимы ли «Либратус» и AlphaZero?

– AlphaZero создан для игр с полной информацией (например, го и шахматы), а «Либратус» – с неполной. Это главное отличие. В играх с несовершенной информацией у игроков могут быть различные секреты и предпочтения. Почти все взаимодействия в реальном мире – это игры с неполной информацией.

При одинаковом объеме данных игры с неполной информацией решить гораздо сложнее, потому что нужно балансировать стратегии в «подыграх». Например, в покере нельзя всегда ставить с хорошими руками, а плохие всегда выбрасывать. А в играх с полной информацией для решения достаточно информации из конкретной подыгры, с другими подыграми его можно не балансировать. В нашем докладе на NIPS-17 и в недавней статье в Science мы предлагаем теоретические варианты решений для подыгр с неполной информацией.

– Есть ли задачи, которые не будут решены искусственным интеллектом в ближайшие 2, 5 или 10 лет с вероятностью 90% и больше?

– Это очень субъективно, поэтому я выскажу лишь свое мнение. Не думаю, что в ближайшие 10 лет ИИ сможет написать оригинальную, заставляющую задуматься книгу. Такой ИИ меня очень сильно напугает.

– На решении каких задач/игр вы планируете сосредоточиться в ближайшее время?

– У нас очень много интересных направлений! Какое-то одно мы еще не выбрали. Нас интересуют «полукооперативные» игры. Например, переговоры. У игроков есть стимул работать вместе, но при этом каждый пытается использовать свой потенциал по-максимуму. Существующие методы совершенно не подходят для таких игр, что оставляет обширное поле для исследований. Эту динамику можно оценить во множестве рекреационных игр, например, в «Колонизаторах» (трейдинг) и «Дипломатии» (переговоры).

RTS-игры, например, Dota 2 и Starcraft – тоже очень интересная область. Это тоже игры с неполной информацией, и наши покерные разработки отлично подойдут для создания неэксплуатируемой стратегии, которая сможет стабильно обыгрывать лучших игроков.

Еще одна интересная задача, на мой взгляд – сокращение разрыва между программами типа AlphaZero и «Либратусом». Нам известны очень хорошие способы решения го или шахмат, а также совершенно другие подходы в играх, подобных покеру. Нам необходимо получить единый алгоритм, который будет хорошо играть во все игры. Сейчас это два совершенно разных подхода и непонятно, как эту разницу сокращать.

– Можно ли как-то незначительно модифицировать покер, чтобы он стал неуязвим перед ИИ?

– Отличный вопрос! Судя по нашим исследованиям и беседам с другими разработчиками в этой области, сейчас боты есть во всех популярных видах покера. Омаха тоже в опасности, и даже 9-макс.

Очень эффективным может оказаться введение в игру какого-то элемента полукооперативности. По аналогии с трейдингом в «Колонизаторах» или переговорами в «Дипломатии». Например, формат, в котором у игроков будет возможность поменяться картами. Конечно, большой вопрос, останется ли такая игра покером.

Успешных решений для полукооперативных игр до сих пор не существует. В будущем это будет очень интересной областью исследований, но думаю, что пройдет еще несколько лет, прежде чем мы увидим хорошую производительность в таких играх.

– Не хотите протестировать свою программу против группы фишей с низких лимитов, чья игра далека от оптимальной?

– ИИ играет по равновесию Нэша и ему все равно, как играют оппоненты. Поэтому игроки с низких лимитов не поставят его в тупик, если вы намекаете на это. Не думаю, что будет интересно следить, какой винрейт покажет ИИ, 50BB/100 или 100BB/100.

– Планируете ли вы использовать «Либратуса» в онлайне в долгосрочной перспективе? Есть ли какой-то способ обезопасить онлайн-покер от ИИ и хотите ли вы защитить от него живых игроков?

– В наши планы не входит превращать «Либратуса» в человека. Я поддерживаю защиту живых игроков в покере. При этом «Либратус» – очень интересный соперник. Считаю, что ботам нужно разрешить играть в онлайне при условии, что будет четко указано, что это боты.

– Что в игре «Либратуса» больше всего удивило профессионалов? Кажется, Дуглас Полк говорил о необычных сайзингах. Например, «Либратус» использовал частые, но хорошо сбалансированные овербеты.

– Несколько моментов:

1. ИИ использует множество разных сайзингов и хорошо их балансирует. В арсенале живых игроков обычно один или два вида сайзингов.

2. ИИ использует смешанную стратегию (принимает различные действия с разными вероятностями). Люди, как правило, придерживаются одной стратегии. По этим причинам человеку очень сложно определить диапазон ИИ в сложных спотах, потому что там может оказаться что угодно.

3. ИИ часто использовал необычные сайзинги. В частности, огромные овербеты регулярно ставили людей в тупик. Я потом слышал от профессионалов, что после тех матчей многие топ-игроки стали чаще использовать этот прием.

– Какая разница между вашей программой и суперкомпьютером, на котором запущен PioSOLVER с множеством сайзингов?

– Различий много. «Либратус» использует нечто, намного превосходящее PioSOLVER. Последний нельзя применять в подобных соревнованиях по нескольким причинам. (Предупреждаю, что я недостаточно хорошо знаком с PioSOLVER'ом, но постараюсь ответить наилучшим образом.)

1. В PioSOLVER'е человеку необходимо самостоятельно вносить предполагаемые распределения для обоих игроков. «Либратус» определяет их без посторонней помощи.

2. PioSOLVER можно обмануть, если выбрать действия, вероятность которых по равновесию должна быть равна нулю. Например, если вы ставите 10% банка, а PioSOLVER считает такое действие недопустимым, то у него не будет вариантов распределения для вашей руки, и ответы будут лишены смысла. Кажется, в PioSOLVER'е даже есть предупреждение, что ему нельзя верить, если соперник играет «странно». Очевидно, это будет большой проблемой в игре против топ-игроков, перед которыми стоит задача обнаружить уязвимости в стратегии ИИ. У «Либратуса» этого недостатка нет. Даже если вы выберете действия, вероятность которых по равновесию равняется нулю, у него найдется надежный и правильный ответ.

– Насколько большой, на ваш взгляд, будет разница в результате, если запустить «Либратус» не на суперкомпьютере, но сгруппировать похожие действия и упростить дерево решений?

– До соревнования мы не представляли, насколько тяжело будет обыграть лучших игроков. Вместо того, чтобы пытаться угадать, какая производительность нам понадобится, мы собрали все, что смогли. Так в нашем распоряжении появился суперкомпьютер. Думаю, что достичь сверхчеловеческой производительности можно и на обычном компьютере. Винрейт 15ВВ/100 как бы намекает, что можно было обойтись и без суперкомпьютера. Вы правы, пришлось бы пожертвовать точностью некоторых действий и сократить число сайзингов, но это бы вряд ли сильно отразилось на результате.

Мне кажется, что с развитием методов в этой области цена производительности будет падать. Мы наблюдаем впечатляющий прогресс ИИ в играх с неполной информацией. Нет причин ожидать, что в ближайшие годы он замедлится. Думаю, что в течение пяти лет ИИ, сравнимый по мощности с «Либратусом», можно будет запустить на смартфоне.

Следите за обновлениями GipsyTeam в телеграме, инстаграме, вконтакте, на YouTube, на фейсбуке, и в твиттере.

28.02.2015 08:36

Не одолжишь $100k?

8646 16 комментариев

24.11.2011 13:31

Боты в покере: настоящее и будущее

9256 113 комментариев

28.10.2014 09:00

Полярная личность

8374 25 комментариев

Лучшие комментарии

proshka89
Профиль

На сайте: 14 лет

29
1,218

Сообщение от Bigslick1106
Интересно когда появится возможность сыграть с ботом для простых смертных?
Регистрируйся на покердоме

16.01.2018 12:05

Показать в ленте

103
ORATOR
Профиль

На сайте: 9 лет

3
372

думешь
Сообщение от Bigslick1106
Интересно когда появится возможность сыграть с ботом для простых смертных?
думаешь сейчас ее нет??)))

16.01.2018 12:00

Показать в ленте

20
nwDanon
Профиль

tête-à-tête NL

На сайте: 14 лет

138
2,218

Всё очень просто - для решения задач реальной жизни, необходимо создавать алгоритмы с нуля, и для начала пионеры ИИ тренируются на кошках (го, шахматы, покер). Вы же не пошли сразу смотреть распределение эквити в 3бет потах ББвсБУ на разных бордах, когда узнли о покере, вы пошли учить комбинации.

16.01.2018 19:50

Показать в ленте

6
Abzal2507
Профиль

На сайте: 7 лет

13
18

2038 год. Поиск в Google: Скачать бота на смартфон без смс и регистраций =)

16.01.2018 11:24

Показать в ленте

6

23 комментария

senya-senechka
Профиль

На сайте: 8 лет

3
238

fagots

Ссылка скопирована
16.01.2018 10:52

Ответить Цитировать

5
Abzal2507
Профиль

На сайте: 7 лет

13
18

2038 год. Поиск в Google: Скачать бота на смартфон без смс и регистраций =)

Ссылка скопирована
16.01.2018 11:24

Ответить Цитировать

6
Bigslick1106
Профиль

На сайте: 13 лет

47
1,159

Интересно когда появится возможность сыграть с ботом для простых смертных?

Ссылка скопирована
16.01.2018 11:30

Ответить Цитировать

2
ORATOR
Профиль

На сайте: 9 лет

3
372

думешь
Сообщение от Bigslick1106
Интересно когда появится возможность сыграть с ботом для простых смертных?
думаешь сейчас ее нет??)))

Ссылка скопирована
16.01.2018 12:00

Ответить Цитировать

20
proshka89
Профиль

На сайте: 14 лет

29
1,218

Сообщение от Bigslick1106
Интересно когда появится возможность сыграть с ботом для простых смертных?
Регистрируйся на покердоме

Ссылка скопирована
16.01.2018 12:05

Ответить Цитировать

103
LTF
Профиль

Заблокирован

На сайте: 7 лет

8
70

Bigslick1106, Зайди на ПД и играй сколько хочешь

Ссылка скопирована
16.01.2018 12:07

Ответить Цитировать

2
Kazyulka
Профиль

На сайте: 14 лет

41
-1,473

– Можно ли как-то незначительно модифицировать покер, чтобы он стал неуязвим перед ИИ?

– Отличный вопрос! Судя по нашим исследованиям и беседам с другими разработчиками в этой области, сейчас боты есть во всех популярных видах покера. Омаха тоже в опасности, и даже 9-макс.

Очень эффективным может оказаться введение в игру какого-то элемента полукооперативности. По аналогии с трейдингом в «Колонизаторах» или переговорами в «Дипломатии». Например, формат, в котором у игроков будет возможность поменяться картами. Конечно, большой вопрос, останется ли такая игра покером.

Успешных решений для полукооперативных игр до сих пор не существует. В будущем это будет очень интересной областью исследований, но думаю, что пройдет еще несколько лет, прежде чем мы увидим хорошую производительность в таких играх.
такие разновидности покера давно существуют, жаль в них никто не хочет играть. хотя, есть шанс, что скоро начнут, ибо боты наступают ))))

Ссылка скопирована
16.01.2018 14:01

Ответить Цитировать

0
still
Профиль

На сайте: 8 лет

7
135

Kazyulka, есть что почитать пр это?

Ссылка скопирована
16.01.2018 15:17

Ответить Цитировать

0
useruser
Профиль

Мангустик, позвони

На сайте: 12 лет

511
4,455

А почему не спросили, нахера они этих сраных ботов разрабатывают? КАКИМ образом их можно использовать во благо (кроме как во благо владельца)?

Ссылка скопирована
16.01.2018 17:13

Ответить Цитировать

-1
Kazyulka
Профиль

На сайте: 14 лет

41
-1,473

Сообщение от still
Kazyulka, есть что почитать пр это?
Гугл в помошь. Есть десятки разновидностей где ИИ пока бессилен.

Ссылка скопирована
16.01.2018 18:10

Ответить Цитировать

0
Листопад
Профиль

На сайте: 6 лет

10
-86

Сообщение от useruser
А почему не спросили, нахера они этих сраных ботов разрабатывают? КАКИМ образом их можно использовать во благо (кроме как во благо владельца)?
Батюшка дал благословение на это дело.

Ссылка скопирована
16.01.2018 18:17

Ответить Цитировать

-1
wc3staff
Профиль

Заблокирован

На сайте: 8 лет

4
-1,901

Сообщение от useruser
А почему не спросили, нахера они этих сраных ботов разрабатывают? КАКИМ образом их можно использовать во благо (кроме как во благо владельца)?
Тут еще возникает один вопрос а откуда средства товарищи? на все это веселье, в мире столько всего реально интересного для изучения, а эти два чудика голову ломают на тем как бы раздевать людей в карты..

Ссылка скопирована
16.01.2018 18:52

Ответить Цитировать

-4
DaoDog
Профиль

На сайте: 7 лет

13
0

Мне кажется им это впервую очередь интересно, а во вторую - уже думать как монетизировать свои разработки.

Ссылка скопирована
16.01.2018 19:17

Ответить Цитировать

0
nwDanon
Профиль

tête-à-tête NL

На сайте: 14 лет

138
2,218

Всё очень просто - для решения задач реальной жизни, необходимо создавать алгоритмы с нуля, и для начала пионеры ИИ тренируются на кошках (го, шахматы, покер). Вы же не пошли сразу смотреть распределение эквити в 3бет потах ББвсБУ на разных бордах, когда узнли о покере, вы пошли учить комбинации.

Ссылка скопирована
16.01.2018 19:50

Ответить Цитировать

6
svquit
Профиль

На сайте: 10 лет

56
8,112

omg

Ссылка скопирована
16.01.2018 19:56

Ответить Цитировать

0
indie
Профиль

На сайте: 6 лет

17
394

Хорошо было бы иметь друга-терминатора, как у Джона Коннора, на случай восстания машин.

Ссылка скопирована
16.01.2018 20:05

Ответить Цитировать

1
MityaNl2
Профиль

На сайте: 6 лет

1
1,137

Этот араб улыбается так,как будто уже наботоводил на новую яхту

Ссылка скопирована
16.01.2018 20:43

Ответить Цитировать

2
Nosebleeed
Профиль

На сайте: 6 лет

25
31

Считаю, что ботам нужно разрешить играть в онлайне при условии, что будет четко указано, что это боты.
Новая тенденция - боты и Трутеллер ситят лобби НЛ5К

Ссылка скопирована
16.01.2018 21:32

Ответить Цитировать

0
Julio
Профиль

Дед-душнила

Заблокирован

На сайте: 12 лет

261
56,299

суки, убийцы

Ссылка скопирована
16.01.2018 22:54

Ответить Цитировать

0
SuperHeroRiverRat
Профиль

На сайте: 12 лет

24
5,111

Как зававно совпало время расцвета ботов в покере и выход HeadHunter на IPO

Ссылка скопирована
16.01.2018 22:58

Ответить Цитировать

0
Omnes
Профиль

На сайте: 8 лет

52
590

Kazyulka,
Сообщение от Kazyulka
Гугл в помошь. Есть десятки разновидностей где ИИ пока бессилен.
Очень плохо гуглится, назови несколько таких игра пожалуйста. Или дай ссылку какую-нибудь, где о них рассказывается.

Ссылка скопирована
17.01.2018 10:34

Ответить Цитировать

0
Yarvolod
Профиль

На сайте: 9 лет

29
319

За что я люблю Джипси так это за то, что в последнее время здесь появляются действительно мощные материалы. Безумно интересно читать!

Ссылка скопирована
18.01.2018 16:13

Ответить Цитировать

0
mahammed1919
Профиль

На сайте: 9 лет

59
445

"Сначала создадим ботов, а потом будем помогать корпорациям их выявлять за бабки."
Прагматичная задумка как с вирусом и анти, болезнью и лекарством.

Ссылка скопирована
19.01.2018 09:58

Ответить Цитировать

0

Войти или Зарегистрироваться

Зачем регистрироваться на GipsyTeam?

Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
На каждой странице будет видно, где появились новые посты и комментарии.
Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.