Новость

Нейросеть пленяет шахматистов

GipsyTeam

10.12.2017 10:16 8605 67 комментариев

5 декабря произошло событие, после которого шахматный мир не будет прежним: нейросеть Alpha Zero, созданная разработчиками DeepMind, научилась играть в шахматы на невиданном уровне – некоторые гроссмейстеры уже называют его божественным. В ситуации разобрался Михаил «BadSeed» Савинов.

В DeepMind начали этот проект в 2014 году и с совершенно другой игры. Сначала они написали нейросеть для игры го. Alpha Go получила в своё распоряжение базу человеческих партий, с помощью которой обучалась игре, потом тренировалась против других программ, и в октябре 2015 года стала первой в истории компьютерной программой, которая нанесла поражение обладателю профессионального дана (чемпиону Европы Фан Хую) в серьёзной партии без форы.

В марте 2016 года состоялся матч Alpha Go против великого корейского игрока Ли Седоля, на тот момент занимавшего третью строчку в мировом рейтинге. Ли Седоль проиграл первые три партии, выиграл четвёртую, проиграл пятую и получил $150,000 за участие. Приз победителю матча $1,000,000 Google направил благотворительным организациям, в основном UNICEF.

В марте 2017-го Alpha Go сыграла матч из трёх партий с 20-летним китайским профессионалом Ке Цзе, сильнейшим игроком мира, c призами $1.5 млн и $300k. После матча (0-3) Ке Цзе сказал: «Человечество потратило тысячи лет, совершенствуя стратегию игры в го, но компьютер показал, что мы не смогли даже коснуться истины».

В октябре 2017-го DeepMind представили принципиально новую версию – Alpha Go Zero. Ноль в названии символизирует отказ от использования человеческих партий при обучении нейросети. Вместо этого в неё просто запрограммировали правила игры, после чего предоставили играть самой с собой.

Этого оказалось достаточно, чтобы через три дня обучения уничтожить первую версию Alpha Go со счётом 100-0, а через три недели с таким же счётом выиграть у версии, победившей Ке Цзе.

Подробный и довольно глубокий (сложный, как и сама тема!) рассказ о том, как работает алгоритм Alpha Go Zero, можно найти на Хабрахабре.

После матча Alpha Go с Ке Цзе команда DeepMind опубликовала 50 партий, сыгранных Alpha Go против Alpha Go. На этих партиях сейчас учится всё элитное го-сообщество. Ке Цзе после поражения радикально изменил свой стиль игры в дебюте (в частности, полностью отказался от ориентированных на влияние ходов в 4-4) и поставил личный рекорд, выиграв 22 партии подряд в профессиональных турнирах.

Программы семьи Alpha Go работают на тензорных процессорах (ноу-хау Google, оптимизированы для работы с нейросетями), а их код, разумеется, закрыт. Но направление работы уже указано, и по нему пошли многие другие. Сильные программы на базе нейросетей делают китайские и японские разработчики, тестируя их на игровых серверах против ведущих игроков и программ старого и нового поколения.

Существуют и бесплатные варианты. Создатель программы с открытым кодом – Leela, играющей в силу 9-го дана на сервере KGS, в октябре этого года выпустил версию Leela Zero, которая работает по принципу Alpha Zero. Учится она, правда, довольно медленно – бесплатному софту гугловские мощности не полагаются – и к старшей сестре за месяц с небольшим приближается медленно. Но неуклонно.

На этом закончим с го и перейдём к шахматам.

23 ноября 2017 года, интервью с Робертом Ударом, создателем топового шахматного движка Houdini:
Я с интересом следил за развитием истории с Alpha Go. Знаете ли, глава DeepMind Демис Хассабис – мастер по шахматам. Считалось, что го – более сложная игра, чем шахматы, но в шахматах подобную самообучающуюся программу создать не смогли. Успехи Alpha Go не имеют отношения к шахматам. Самообучающаяся программа, которая играет на равных с Houdini или Komodo – это выдумки. Может быть, Google попробует сделать нечто подобное? Кто знает.

Глава DeepMind в детстве был шахматистом и вроде бы даже неплохим – в Wikipedia пишут, что когда ему было 13 лет, по рейтингу в своём возрасте он уступал только Юдит Полгар. Весьма вероятно, что так оно и было – игрок с нынешним рейтингом (2249) давно не игравшего в турнирах Демиса Хассабиса (Великобритания) в чемпионате мира до 14 лет 2017 года был бы 9-м в стартовом списке. Как бы то ни было, следующим шагом Alpha Zero после го стали шахматы. (За компанию под раздачу попал также японский аналог шахмат – шоги, но их мы касаться не будем.)

Гром грянул 5 декабря, когда в интернете опубликовали статью Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm, подписанную коллективом сотрудников DeepMind. Они научили Alpha Zero правилам шахмат, после чего заставили нейросеть играть саму с собой девять часов. Сначала она делала случайные ходы, потом убирала из поиска неудачные и постепенно училась играть всё сильнее и сильнее. После окончания обучения она достигла сверхчеловеческого уровня игры. Доказательство – матч из 100 партий против одной из сильнейших программ «старого поколения», работающих по методу альфа-бета отсечения – Stockfish. Alpha Zero одержала 28 побед, 72 партии свела вничью и ни одной не проиграла. По ходу партий Stockfish оценивала 70 миллионов позиций в секунду, Alpha Zero – 80 тысяч: огромная разница, подчёркивающая мощь нейросети в умении отсекать ненужное.

Были также проведены тематические матчи в разных дебютах, по 100 партий на каждый. В них Stockfish удалось зацепить несколько побед, но перевес Alpha Zero всё равно впечатляет.

Уровня, равного Stockfish, Alpha Zero достигла уже после четырёх часов обучения, отсюда фигурирующая во многих источниках цифра. Но матчи, результаты которых были обнародованы, игрались с полностью обученной нейросетью.

В статье опубликовали десять избранных партий основного матча. Третий день ими восхищается весь шахматный мир. Это поистине космические партии, одну из которых мы покажем в конце статьи.

Гроссмейстеры уже научились жить в мире, в котором они проигрывают смартфону. Теперь они наблюдают за тем, как в одночасье на их месте оказались ведущие движки старого поколения, о которые вытирает ноги нейросеть, изначально созданная для другой игры.

Пара цитат из твиттера.

Йон Людвиг Хаммер, гроссмейстер (Норвегия):
AlphaZero с крупным счётом громит ранее непобедимую Stockfish. Играет в безумно атакующие шахматы на здоровой позиционной основе. По-моему, шахматы от этого стали ещё интереснее!

Евгений Перельштейн, гроссмейстер (США):
Хотите узнать, как Бог играет в шахматы? Посмотрите партии Alpha Zero, они дадут примерное представление.

Петер-Хайне Нильсен, гроссмейстер (Дания), тренер чемпиона мира Магнуса Карлсена:
Порой мне хотелось увидеть, как на Землю спускается превосходящая нас раса и показывает нам своё умение играть в шахматы. Именно это сейчас и произошло.

Критика

Шапочку из фольги в основном примеряют люди, занимающиеся шахматным программированием. Их эмоции можно понять – тысячи часов они корчевали пни и укладывали асфальт, в то время как под рукой лежал почти готовый телепорт, ведь нейросети – не какое-то сверхсекретное изобретение, а становящийся вполне стандартным метод решения ранее тупиковых проблем. Уже одно это заставляет меня с некоторым недоверием относиться к их претензиям к DeepMind. И всё же отчасти они, конечно, небеспочвенны.

Среди сомневающихся на удивление много опытных российских шахматистов. Их споры в фейсбуке читать порой смешно, порой страшно. Конечно, люди из очень закрытых профессиональных сообществ редко выглядывают за пределы этого кокона. Но не интересоваться происходящим в мире вокруг – это одно, а пылко отрицать то, чего не понимаешь – немного другое.

Есть среди недовольных чистотой эксперимента и люди, не имеющие отношения к шахматному программированию, но по каким-то причинам яростно болеющие за Терминатора Т-800 против Терминатора Т-1000. Может быть, они таким образом надеются отодвинуть Судный день?

Пройдёмся по главным тезисам.

Главная претензия к чистоте эксперимента – железо: AlphaGo играла на четырёх тензорных юнитах, а это безумная мощь, доминирующая Stockfish на 64 ядрах, которой, к тому же, дали всего 1 гигабайт хэша – мало! Разницу в быстродействии оценить чрезвычайно сложно из-за принципиального различия CPU и TPU, но обычно дают от 7 до 70 раз. Насколько существенно это влияет на силу игры – вопрос открытый, но как-то влияет точно.

Контроль времени, выбранный для матча – минута на ход, подходит нейросети и не подходит обычной программе, которая расходует время неравномерно – в начале больше, потом – меньше. А ошибки, сделанные в начальной стадии, исправить сложнее.

Сравнительная сила игры в зависимости от времени на обдумывание хода

Версия Stockfish, использованная для матча, не была новейшей. Почему? Может быть (надеваем шапочку), программисты Google долго анализировали именно эту версию, чтобы «заточить» нейросеть Alpha Zero разорвать её в лоскуты? Добавлю, что разница в рейтинге между версиями составляет примерно 40 пунктов. Alpha Zero сильнее более старой версии Stockfish на 100 пунктов, то есть разница в матче с более новой версией была бы не столь впечатляющей.

Один из аргументов за использование старой версии Stockfish – именно она выиграла чемпионат мира среди компьютеров 2016 года. Да, слабее, зато чемпионка мира.

Stockfish якобы играла без дебютной библиотеки. Перечитал статью DeepMind, упоминаний об этом нет. Но, может быть, это подразумевается по умолчанию. Гроссмейстер Шипов утверждает, что её отсутствие видно из опубликованных партий. Alpha Zero тоже не пользовалась библиотекой, но её предшествующее самообучение можно расценивать как своего рода дебютную книгу. Некоторые опубликованные партии матча, в которых Alpha Zero шпарит по наиболее актуальным вариантам современных шахмат, подтверждают такое мнение. В тематических матчах по отдельным дебютам превосходство Alpha Zero упало со 100 пунктов до 77.

Где-то мелькали совсем уж конспирологические теории о том, что некий гроссмейстер-человек помогал Alpha Zero принимать стратегические решения. Обсуждать их всерьёз немного странно по нескольким очевидным причинам, но вообще было бы интересно протестировать в корректных условиях нечто подобное: усилит или ослабит компьютерную программу помощь человека по ходу партии...

Гарри Каспаров и Демис Хассабис открывают первый тур London Chess Classic в лондонском офисе Google. Белые фигуры – у чемпиона мира Магнуса Карлсена, напротив него второй шахматист мира Фабиано Каруана

Другим конспирологам, считавшим, что некоторые ответы Stockfish вообще чуть ли не подтасовали, ответил Александр Морозевич, проверивший ходы на своём компьютере и подтвердивший их совпадение (согласно сообщению Александра Динерштейна в сообществе «Игра го. Секреты мастерства»).

Основываясь на упомянутых выше вменяемых аргументах, скептики снижают силу Alpha Zero на 100-200 пунктов, а самые отъехавшие – и на все 500, приближая её по силе к Магнусу Карлсену (вот так унижение для компьютера!). В DeepMind редко снисходят до ответов на вопросы, но надо ли на такое отвечать вообще?

В оригинальной статье (вернее, конспекте – Хассабис обещает вскоре опубликовать и более полную версию) вкратце рассказывается, какие именно вводные получала нейросеть, в каком виде возвращала информацию разработчикам, прочие подробности. Выложили там и любопытнейшие графики изменения дебютных предпочтений программы по мере «взросления». Но на этом мы остановимся – все эти детали несложно найти на шахматных ресурсах, например, на chess24.

Выводы

Alpha Zero играла сама с собой всего девять часов, но это были часы на тех ещё стероидах – более 5,000 тензорных процессоров, разработанных Google специально для машинного обучения. За это время она сыграла 44 миллиона партий – в несколько раз больше, чем все шахматные профессионалы в истории человечества. Чтобы сыграть такое количество партий на обычном компьютере, понадобилось бы порядка 1,700 лет. Обучалась она на 64 тензорах второго поколения, примерная цена которых – десятки миллионов долларов. Повторить такое в домашних условиях смогут немногие, а Google вряд ли интересует ниша создателя сильнейшей в мире шахматной программы, чтобы портировать Alpha Zero на PC. Но дело не в этом. Результат эксперимента – доказательство того, что концепция является рабочей: нейросети могут эффективно работать в шахматах без дополнительной тонкой настройки (в DeepMind от неё отказались умышленно). На смену Stockfish и Komodo придут более сильные программы (может быть даже от тех же авторов), созданные по образу и подобию Alpha Zero, только, наверное, поначалу не такие космически могучие, как разработка DeepMind.

За комментариями мы обратились к одному из ведущих разработчиков проекта Isaac компании NVIDIA Виктору Маковийчуку.

В постановке экспериментов была PR-составляющая, конечно, как и во многих прошлых громких релизах DeepMind. Есть некоторые замечания по поводу использованного железа, например, что памяти на то количество ядер, на которых запускали Stockfish, должно быть больше, но в целом эксперимент выглядит вполне корректно поставленным. В чистых ФЛОПСах производительность железа, на котором запускалась Alpha Zero, выглядит гораздо больше, но стоит понимать, что это достаточно узкоспециализированное железо, и Stockfish на нём не запустишь.
Согласно оценке шахматистов уровня гроссмейстеров, Alpha Zero играла на качественно другом уровне, особенно доминируя в позициях с несимметричным материалом. С более мощным железом разрыв мог быть меньшим, но результат бы принципиально не изменился.
Многие сравнивают этот матч со Stockfish с матчем Alpha Go против чемпиона Европы Фан Хуя. К матчу были претензии и после него никто не верил, что Alpha Go сможет выиграть у Седоля. Но программа усилилась очень резко за прошедшее между этими матчами время.
Так и в случае со Stockfish, если вдруг решат организовать официальный матч против последней версии на более мощном железе, против него будет играть гораздо более сильная версия Alpha Zero, и результат будет столь же печальным для традиционных программ.
Ставить ли крест на шахматном программировании без нейросетей? Во многом это зависит от того, насколько идеи DeepMind могут быть хотя бы частично использованы в движках, разработчики которых не имеют ресурсов гугла для тренировки.

Да, главный эмоциональный аргумент в пользу мощи Alpha Zero – запредельные шахматы, продемонстрированные этой программой. Дайте Stockfish в сто раз больше времени на обдумывание, она всё равно не начнёт играть так. (Некоторые позиции из матча уже протестировали, и Stockfish не смогла найти выигрывающие ходы от Alpha Zero.) И я – любитель, кандидат в мастера, и гроссмейстеры, которых я опрашивал во время чемпионата России по шахматам в Петербурге, восприняли опубликованные партии примерно одинаково: игра огромной силы, бесспорно компьютерная по чистоте, но при этом на удивление «человеческая» по общей манере. Особенно впечатляют жертвы, выглядящие интуитивными – материал нередко отдаётся надолго и за довольно трудно формализуемые блага вроде пресловутой инициативы или позиционного зажима. Шокируют дебютные познания нейросети: она регулярно играет центральные варианты нынешней теории при отсутствии специально сконструированной дебютной библиотеки – дошла своим умом. Это можно понять в дебютах, в которых идёт прямая игра по центру, но как, чёрт возьми, оно придумало гамбитный вариант новоиндийской защиты?!

Будем надеяться, что, как и в случае с Alpha Go, DeepMind опубликует партии, в которых его движок играл сам с собой. Уверен, в них найдётся чему поучиться.

Alpha Zero – Stockfish

1. Nf3 Nf6 2. d4 e6 3. c4 b6 4. g3 Bb7 5. Bg2 Be7 6. 0-0 0-0 7. d5

7...exd5 8. Nh4

В этом ходе состоит суть гамбитного варианта новоиндийской защиты, который ещё называют вариантом Полугаевского. Белые отдают пешку, получая в качестве компенсации инициативу. Играя белыми, победы в этом варианте одерживали Полугаевский, Тимман, Каспаров, Мамедьяров... Современная элита вариант практически не играет.

8...c6 9. cxd5 Nxd5 10. Nf5 Nc7 11. e4 d5 12. exd5 Nxd5 13. Nc3 Nxc3

14. Qg4

Это пока не настоящая жертва фигуры, а временная – белые не взяли коня, но напали на мат в один ход. Конь не убежит.

14...g6 15.Nh6+ Kg7 16. bxc3 Bc8 17. Qf4 Qd6 18. Qa4 g5

19. Re1

А вот теперь всё по-настоящему! Stockfish на моём компьютере считает ход Alpha Zero проигрывающим, однозначно предпочитая ему сбежать конём на g4. Но чем дольше думает компьютер, тем сильнее корректируется оценка этого продолжения. На глубине 25 полуходов это уже не «зевок фигуры», а просто чуть худший ход, после которого чёрные впереди примерно на 0.7 пешки.

База анализов на сайте ChessBase показывает, что, во-первых, эту позицию смотрели и анализировали уже 843 раза, и Stockfish 8 на глубине 35 полуходов, хоть и продолжает предпочитать 19.Ng4, считает ход в партии ведущим к равной игре. Глубже вроде бы не заглядывали.

19...Kxh6 20. h4 f6 21. Be3 Bf5 22. Rad1 Qa3 23. Qc4 b5 24. hxg5+ fxg5

Следует оригинальный перевод ферзя на пассивную позицию в тыл – в стиле Тиграна Петросяна!

25. Qh4+ Kg6 26. Qh1 Kg7

27. Be4

Снова совсем не очевидный ход. Конечно, белые не берут ненужную пешку, ведь это избавит соперника от пассивного коня и соединит ладьи. Но – меняться? В позиции без фигуры?

27...Bg6 28.Bxg6 hxg6 29. Qh3

Белая пружина начинает медленно распрямляться. Чёрные ничего не могут этому противопоставить, разве что мстительно съесть ещё одну пешку.

29...Bf6 30. Kg2 Qxa2 31. Rh1 Qg8

32. c4

Stockfish на моём компьютере предлагает сделать активный ход 32.Rd6 с равенством. Ход Alpha Zero в его переборе третий. Судя по той же базе анализов, адская сила этого хода выявляется доступными нам программами на глубине под 40 полуходов. При более дальновидном расчёте разница в оценке очень велика – больше пешки!

32...Re8 33. Bd4

Alpha Zero cнова идёт на размен!

33...Bxd4 34. Rxd4 Rd8 35. Rxd8 Qxd8

У чёрных лишний конь и две пешки, но они гибнут после сурового тихого – без шаха или взятия – хода соперника.

36. Qe6

От угрозы шаха с е5 хорошей защиты нет. Stockfish не нашла ничего лучшего, чем откупиться материалом. Отдавать пришлось целую ладью, иначе на алтарь пошёл бы либо ферзь, либо король.

36...Nd7 37. Rd1 Nc5 38. Rxd8 Nxe6 39. Rxa8 Kf6 40. cxb5 cxb5 41. Kf3

Положение чёрных безнадёжно, через 15 ходов они сдались.

Следите за обновлениями GipsyTeam в телеграме, инстаграме, вконтакте, на YouTube, на фейсбуке, и в твиттере.

29.09.2017 23:09

Sberbank Holdem Challenge глазами команды Simple Poker

6249 40 комментариев

18.03.2016 06:33

В турнире суперхайроллеров Aria не осталось свободных мест: обзор новостей

12 комментариев

18.10.2015 03:15

Искусственный интеллект учится играть в трипл-дро

14 комментариев

Лучшие комментарии

wQQds
Профиль

На сайте: 9 лет

9
1,662

Огромное спасибо за настоящую журналистскую работу, Gipsyteam. Желаю, чтобы вы баловали читателей подобным гораздо чаще. Автору респект, жаль, что ты пожелал остаться неизвестным.

10.12.2017 13:34

Показать в ленте

88
Volk13
Профиль

На сайте: 9 лет

23
2,805

Судный день,приближается.

10.12.2017 10:37

Показать в ленте

88
fatxer
Профиль

На сайте: 11 лет

7
2,018

Ожидал увидеть матч в конце статьи в формате более удобном для просмотра.

10.12.2017 11:41

Показать в ленте

42
MoonlightAA
Профиль

На сайте: 7 лет

2
2,430

Такой маленький, а уже скайнет

10.12.2017 14:57

Показать в ленте

38
Fiat
Профиль

светоч

На сайте: 11 лет

216
16,883

Сообщение от Volk13
Судный день,приближается.
А почему не "судный,день,приближается"?

10.12.2017 14:11

Показать в ленте

31
guano_apes
Профиль

На сайте: 12 лет

3
2,051

И ни одной шутки про Фан Хуя в комментах ((

10.12.2017 18:32

Показать в ленте

30

67 комментариев

Volk13
Профиль

На сайте: 9 лет

23
2,805

Судный день,приближается.

Ссылка скопирована
10.12.2017 10:37

Ответить Цитировать

88
Leo_Manowar
Профиль

На сайте: 14 лет

226
48,508

Обсуждать их всерьёз немного странно по нескольким очевидным причинам, но вообще было бы интересно протестировать в корректных условиях нечто подобное: усилит или ослабит компьютерную программу помощь человека по ходу партии
Насчет АльфаЗиро я не знаю, а обычные программы помощь живого шахматиста усиливает, на этом в принципе основано такое направление шахмат, как адванс. Только человек нужен даже необязательно гроссмейстерского уровня, но хорошо разбирающийся в специфике компьютерных шахмат и недостатках программ.

Ссылка скопирована
10.12.2017 10:46

Ответить Цитировать

0
Gagarinec
Профиль

На сайте: 12 лет

12
1,362

Невероятное качество партий! Просто инопланетный уровень игры. Современные ведущие профессионалы просто ковыряются в детской песочнице, в сравнении с этим монстром.

Ссылка скопирована
10.12.2017 11:40

Ответить Цитировать

7
fatxer
Профиль

На сайте: 11 лет

7
2,018

Ожидал увидеть матч в конце статьи в формате более удобном для просмотра.

Ссылка скопирована
10.12.2017 11:41

Ответить Цитировать

42
MakeMeBelive
Профиль

На сайте: 14 лет

177
2,797

При чем в шахматы и го, люди учились тысячелетиями, чтобы достичь нынешнего уровня. А в покер всего-лишь пол века. Представляю, что эта гугл-убийца сделает с нынешними хайроллерами))

Ссылка скопирована
10.12.2017 11:54

Ответить Цитировать

16
khrisanfov
Профиль

На сайте: 7 лет

49
1,276

Крутая новость, уже много дней обсуждается в шахматном комьюнити. Думаю еще увидим новый матч.

Ссылка скопирована
10.12.2017 13:32

Ответить Цитировать

2
wQQds
Профиль

На сайте: 9 лет

9
1,662

Огромное спасибо за настоящую журналистскую работу, Gipsyteam. Желаю, чтобы вы баловали читателей подобным гораздо чаще. Автору респект, жаль, что ты пожелал остаться неизвестным.

Ссылка скопирована
10.12.2017 13:34

Ответить Цитировать

88
Fiat
Профиль

светоч

На сайте: 11 лет

216
16,883

Сообщение от Volk13
Судный день,приближается.
А почему не "судный,день,приближается"?

Ссылка скопирована
10.12.2017 14:11

Ответить Цитировать

31
MoonlightAA
Профиль

На сайте: 7 лет

2
2,430

Такой маленький, а уже скайнет

Ссылка скопирована
10.12.2017 14:57

Ответить Цитировать

38
Volk13
Профиль

На сайте: 9 лет

23
2,805

Сообщение от Fiat
А почему не "судный,день,приближается"?
Потому что, нас уже спрашивать не будут.Если сверх разум решит, что человеческий вид делает больше вреда, чем пользы, мы обречены. Хотя я не могу знать, по каким критериям будет приниматься решение.

Ссылка скопирована
10.12.2017 15:11

Ответить Цитировать

-6
Zykov
Профиль

На сайте: 7 лет

74
8,046

Интересная статья, спасибо. Как шахматист кайфанул от просмотра партии. Действительно сильно играет.
Немного страшно за будущее. Эти нейронные сети могут распространиться абсолютно на все интеллектуальные умения людей: го, шахматы, покер, торговля на бирже, компьютерные игры. Короче говоря человеку останется только физическая работа, типо ямы копать

Ссылка скопирована
10.12.2017 15:54

Ответить Цитировать

9
S1mple
Профиль

На сайте: 6 лет

15
0

Хочу так же быстро учиться!)Когда уже Гугл представит нам сверхчеловека? Мне кажется не за горами тот день...
П.с. Сам играю в шахматы , рейтинг 2к.Хорошая партия представлена в разборе.Спасибо автору.

Ссылка скопирована
10.12.2017 16:16

Ответить Цитировать

-2
RusalkaEmma
Профиль

На сайте: 8 лет

2
76

Лучшая русскоязычная статья по матчу. Автор - Супер!!!

Ссылка скопирована
10.12.2017 17:19

Ответить Цитировать

3
NewPokerSoft
Профиль

На сайте: 9 лет

15
1,715

В матче со StockFish программа Alpha Zero одержала 28 побед и 72 партии закончились вничью (в статье допущена неточность). Stockfish не выиграла ни одной партии.
Вместе с тем, надо отметить, что условия были неравные. Неотъемлемой частью Stockfish являются библиотеки дебютов и эндшпилей. Их отключили по требованию Гугл.
Alpha Zero все построила сама и запомнила в своей сети до матча в процессе обучения.
Stockfish пришлось искать дебютные ходы прямо в ходе игры.
Также Alpha Zero использовала просто огромные вычислительные мощности, занимающие целый этаж. У Stockfish вычислительные ресурсы были значительно скромнее.

Все это, конечно, не ставит под сомнение превосходство Alpha Zero. На ютубе есть несколько партий матча с подробными комментариям и обзор результатов.

Также отмечу, что на последнем первенстве мира среди компьютеров Stockfish не проиграла ни одной партии, а здесь ей был учинен разгром. Люди уже давно играют хуже компьютеров в шахматы. Недавно был матч из 4-х партий Comodo с Накамурой, одним из сильнейших гроссмейстеров в мире. Компьютер во всех партиях давал фору (пешку f7, пешку f2, качество и 4 темпа). Первые 3 партии закончились вничью, а 4-ю человек проиграл.

Однако, в покер ничего пока и близко нет.

Ссылка скопирована
10.12.2017 17:41

Ответить Цитировать

7
RusalkaEmma
Профиль

На сайте: 8 лет

2
76

Так в статье описаны эти "неравенства".

Могу дополнить, что от того , что у бедного стокфиша не было очень даже отъемлемой базы, бедный стокфиш ни разу по дебюту не играл чепуху.
Во всех партиях, что выложены, стокфиш играл вполне себе играемые дебюты и был переигран именно в миттершпиле по игре.

Покер немного другая игра - информация не полная, но, очевидно, Дота сложнее в разы. Ее с начала покорять первую

Ссылка скопирована
10.12.2017 17:47

Ответить Цитировать

1
guano_apes
Профиль

На сайте: 12 лет

3
2,051

И ни одной шутки про Фан Хуя в комментах ((

Ссылка скопирована
10.12.2017 18:32

Ответить Цитировать

30
AUMRAM
Профиль

Tempora mutantur...

На сайте: 11 лет

5
5,843

Сообщение от fatxer
Ожидал увидеть матч в конце статьи в формате более удобном для просмотра.
Вот другая партия, с тем же дебютом и не менее впечатляющая

https://www.youtube.com/watch?v=nIy8E8yndcA

Ссылка скопирована
10.12.2017 18:54

Ответить Цитировать

3
Spaceman1
Профиль

На сайте: 8 лет

52
518

Zykov, скоро и ямы копать будут роботы) человеку уже делать нечего будет на Земле

Ссылка скопирована
10.12.2017 20:14

Ответить Цитировать

0
rezzo
Профиль

IYDKWYGARWTYT

На сайте: 14 лет

561
3,408

Истинно вам говорю: 4 мая 1925 года Земля налетит... на небесную ось!

Ссылка скопирована
10.12.2017 21:57

Ответить Цитировать

5
SlonM
Профиль

На сайте: 10 лет

59
108

современные нейросети можно заточить под конкретную задачу и далеко не самую сложную, до полноценного мышления там как до луны

Ссылка скопирована
10.12.2017 22:15

Ответить Цитировать

6
grenka666
Профиль

На сайте: 13 лет

80
339

Сообщение от Spaceman1
Zykov, скоро и ямы копать будут роботы) человеку уже делать нечего будет на Земле
ямы давно копают экскаваторы

Ссылка скопирована
11.12.2017 00:11

Ответить Цитировать

4
zzz
Профиль

На сайте: 14 лет

2
26

Просмотрел волшебную партию в конце. Радуюсь, что ушёл из шахмат не побеждённый этой совершенной тварью...
За статью спасибо! Одна из лучших за всё время... или это я под впечатлением)

Ссылка скопирована
11.12.2017 00:28

Ответить Цитировать

3
gold_drag
Профиль

На сайте: 6 лет

2
1

Прекрасная статья! Автор, благодарствую. Не забывайте, что работа мозга с сетью из ~14 млрд нейронов совсем другой уровень нежели Alfa Zero... а если он ещё и работает на 100% или близко к этому, то получается такой же перевес, как если бы Stockfish играл в шахматы против Виктора Блума.

Ссылка скопирована
11.12.2017 01:11

Ответить Цитировать

2
Tirlich
Профиль

На сайте: 10 лет

91
1,935

Респект коллегам за очередной качественный материал

Ссылка скопирована
11.12.2017 01:51

Ответить Цитировать

0
ArtyMr
Профиль

6egemott

На сайте: 13 лет

64
10,763

Посмотрел краткий анализ (точнее, впечатления) от С. Шипова (https://www.youtube.com/watch?v=ba4_M7UINfo). Впечатление от всего этого, что у AlphaZero качественно другой подход, ощущение творческой игры, что свойственно именно людям, но никак не неодушевленным расчетным программам. Поймал себя на мысли, что местами страшно от такого проявления суперинтеллекта, однако - когда что-то новое и глобальное не вызывало страх?

Ссылка скопирована
11.12.2017 01:56

Ответить Цитировать

6

Войти или Зарегистрироваться

Зачем регистрироваться на GipsyTeam?

Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
На каждой странице будет видно, где появились новые посты и комментарии.
Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.