Новости
АльфаЗеро изучает новые варианты шахмат

АльфаЗеро изучает новые варианты шахмат

PeterDoggers
| 10 | Шахматные турниры

Компания DeepMind опубликовала новое исследование, на этот раз - совместно с 14-м чемпионом мира по шахматам Владимиром Крамником. Самообучающаяся шахматная программа АльфаЗеро (AlphaZero) использовалась для изучения вариантов шахмат с новыми правилами.

Исследование под названием Assessing Game Balance with AlphaZero: Exploring Alternative Rule Sets in Chess ("Оценка игрового баланса с помощью АльфаЗеро: изучение альтернативных правил шахмат") написано представителями Deepmind Ненадом Томашевым, Ульрихом Паке и Демисом Хассабисом в сотрудничестве с Владимиром Крамником. Российский гроссмейстер  работал с DeepMind целый год со времени публикации его статьи о шахматах без рокировки.

В новой работе (см. в PDF) шахматы без рокировки рассматриваются наряду с восемью другими  вариантами шахмат. АльфаЗеро всего за несколько часов накопил опыт, равнозначный десятилетиям игры людей, и позволил представить, каковы были бы партии людей, обладающих большим мастерством и опытом игры с новыми правилами.

Создание новых игр сложный процесс. Придумать новый интересный для игроков вариант шахмат тоже трудно. Исследователи пишут: "Создание увлекательных и сбалансированных правил игры - нетривиальная задача в связи со сложностью оценки воздействия отдельных изменений на динамику и привлекательность игры".

Генеральный директор Chess.com по шахматам, ММ Дэнни Ренш детально изучил работу благодаря доступу к ней и партиям, полученным задолго до публикации, и подготовил краткий обзор (планируются и другие видео!) узловых моментов исследования, а также собственный рейтинг "10 вариантов шахмат", изучавшихся с помощью АльфаЗеро:

Используя систему обучения с подкреплением АльфаЗеро, ученые хотели показать ее потенциал в качестве "инструмента творческого поиска и разработки новых вариантов шахмат".

Девять вариантов, тестировавшихся АльфаЗеро

Вариант Основное изменение правил Дополнительное изменение правил
Без рокировки Рокировка не разрешена. -
Без рокировки (10) Рокировка не разрешена в течении первых 10 ходов (20 полуходов). -
Медленные пешки Пешки могут ходить только на одно поле. -
Пат=победа Сторона, запатовавшая противника, выигрывает. -
Торпеды Пешки могут делать ход на 1 или 2 поля вперед с любой горизонтали. Взятие на проходе также может происходить на любой горизонтали. -
Полуторпеды Пешки могут ходить на 1 или 2 поля вперед со второй или третьей горизонтали. -
Отступающие пешки Пешки могут ходить назад на одно поле, но белые пешки не могут занимать первую горизонталь, а черные - восьмую. Для правила 50 ходов учитываются только взятия.
Обходящие пешки Пешки могут ходить также на одно поле в сторону. Взятия по-прежнему выполняются вверх по диагонали. Ходы пешек в сторону  не учитываются для правила 50 ходов.
Самовзятие Можно брать свои собственные фигуры. -

Chess.com variants No Castling Torpedo Pawns Sideways
Вы скоро сможете сыграть в некоторые варианты на Chess.com!

АльфаЗеро обучился с нуля каждому варианту и играла много партий сама с собой: 10,000 партий с контролем секунда на ход и еще 1,000 с контролем минута на ход. На основании этих партий в работе дается количественная и качественная оценка вариантам шахмат.

Количественная оценка

Для каждого варианта авторы определили ожидаемый процент ничьих и преимущество выступки, выраженное как ожидаемый процент побед белых. Как и ожидалось, результаты отличались в зависимости от времени на партию: во всех вариантах в игре по минуте на ход было больше ничьих, чем в игре по секунде на ход.

"Это значит, что в этих вариантах шахмат, как и в классических шахматах, начальная позиция теоретически ничейна, но в некоторые из вариантов просто труднее играть, поскольку нужно учитывать больше возможностей, и возникают более содержательные позиции", - пишут исследователи.

Вариант Тренировка По 1 сек. По 1 мин.
Классика 54.10% 51.80% 50.80%
Без рокировки 55.70% 53.30% 51.30%
Без рокировки (10) 52.50% 51.00% 50.40%
Медленные пешки 53.50% 51.60% 50.30%
Пат=победа 54.90% 53.00% 51.10%
Торпеды 57.00% 56.80% 54.00%
Полуторпеды 54.70% 53.60% 50.90%
Отступающие пешки 53.00% 51.10% 50.10%
Обходящие пешки 54.80% 52.80% 50.50%
Самовзятие 54.20% 52.60% 50.80%

В работе также показано, как один и тот же дебют может получать разную оценку в зависимости от варианта шахмат. АльфаЗеро сыграл по 1000 партий каждым вариантом шахмат (кроме медленных пешек), используя начальные позиции голландской защиты, защиты Чигорина, защиты Алехина и королевского гамбита.

В вариантах с дополнительными возможностями по сравнению с классическими шахматами (например, самовзятием) авторы изучали, насколько часто АльфаЗеро их использует. Оказалось, что в каждом варианте шахмат неклассические ходы встречались в большом проценте партий, часто много раз за партию. "Это значит, что новые возможности действительно полезны и влияют на игру", - пишут исследователи.

Также интересной частью работы является усредненная оценка силы фигур в каждом из вариантов, полученная на выборках по 10,000 партий АльфаЗеро:

Вариант p N B R Q
Классика 1 3.05 3.33 5.63 9.5
Без рокировки 1 2.97 3.13 5.02 9.49
Без рокировки (10) 1 3.14 3.40 5.37 9.85
Медленные пешки 1 2.95 3.14 5.36 9.62
Пат=победа 1 2.95 3.13 4.76 8.96
Самовзятие 1 3.10 3.22 5.34 9.42
Отступающие пешки 1 2.65 2.85 4.67 9.39
Полуторпеды 1 2.72 2.95 4.69 8.3
Торпеды 1 2.25 2.46 3.58 7.12
Обходящие пешки 1 1.8 1.98 2.99 5.92

Качественная оценка

Помимо количественного анализа исследователи искали ответы на более субъективные вопросы, оценивая красоту позиций, комбинаций и ходов, возникающих в различных вариантах шахмат. За эту часть работы отвечал Владимир Крамник.

Чтобы оценить, в какие варианты было бы интереснее всего играть людям, 14-й чемпион мира охарактеризовал типичные для них структуры, мотивы и даже стиль игры АльфаЗеро.

Vladimir Kramnik
Владимир Крамник. Фотография Питера Доггерса/Chess.com.

Как и год назад в своей статье, Крамник называет шахматы без рокировки вариантом шахмат с огромным потенциалом, "короли обоих противников оказываются в большей опасности, что увеличивает возможности атаки и контратаки, а равенство, если оно достигается, чаще является динамическим, а не возникшим в результате 'сушки'. Многообразие подходов к обеспечению безопасности короля и значение правильного выбора времени делают игру в дебюте более сложной".

По мнению Крамника, вариант с запретом на рокировку до 10-го хода неотличим от классических шахмат; АльфаЗеро все равно делает рокировку в большинстве партий. То же касается и шахмат, где пат ведет к победе, поскольку меняется оценка лишь некоторых окончаний.

Самый сложный вариант по мнению Крамника - обходящие пешки, где возникают позиции "выглядящие 'чужеродно' для классических шахмат. Пешечная структура становится очень подвижной, невозможно создавать постоянные пешечные слабости".

Примеры

Мы приводим по одной из партий, игранных каждым из девяти вариантов, цитируя   комментарии Крамника. Последние пять партий даются в виде видео, потому что альтернативные ходы пока невозможно сделать в средстве просмотра диаграмм (но мы работаем над его усовершенствованием).

Шахматы без рокировки

"Одно из главных преимуществ шахмат без рокировки - уменьшение значения дебютной подготовки в профессиональных шахматах. Шахматистам придется мыслить творчески с самого начала партии", - пишет Крамник. "Это неизбежно приведет к увеличению количества результативных партий в турнирах, пока не возникнет новая теория. Нововведение может увеличить интерес любителей шахмат к турнирам профессионалов".

Без рокировки (10)

"Главная цель частичного ограничения рокировки - уход от дебютной теории", - пишет Крамник. "Оно ориентировано на профессиональных шахматистов как интересная  возможность. Рисунок игры почти не меняется.  АльфаЗеро стремится разыгрывать более спокойные варианты, где рокировка и в классических шахматах происходит после первых 10 ходов".

Медленные пешки

"Базовые правила и позиции остаются теми же, что и в классических шахматах, но дебютная теория полностью меняется", - пишет Крамник. "Интуиция показывает, что белым труднее использовать преимущество выступки, чем в классических шахматах, получив длительный дебютный перевес и доведя его до победы. В большинстве партий АльфаЗеро после дебюта возникали довольно типичные позиции миттельшпиля".

Пат=победа

Два коня теперь побеждают одинокого короля. 

Крамник: "По партиям АльфаЗеро кажется, что в большинстве позиций миттельшпиля хватает ресурсов для защиты, позволяющих избегать окончаний, ставших проигранными после изменения правил. "Сильный шахматист может понять, как стремиться к выигранным позициям, используя новое правило, или их избегать".

Торпеды

В торпедах пешки становятся очень сильны, пишет Крамник. "Особенно серьезным преимуществом являются проходные пешки, а ценность пешек еще сильнее возрастает в окончании. Увеличиваются все атакующие возможности, что благоприятно для стороны, владеющей инициативой, а значит, захват инициативы становится определяющим. Пешки двигаются очень быстро, поэтому в игре становится меньше стратегии и больше тактики. Игра становится более комбинационной и счетной в сравнении с классическими шахматами".

Полуторпеды

"В полуторпедах больше результативных партий, чем в классических шахматах, но меньше, чем в торпедах", - пишет Крамник. "Это интересный вариант для ценителей особенностей миттельшпиля торпед, не готовых отказаться от существующей теории окончаний".

Отступающие пешки

В шахматах с отступающими пешками возникают более подвижные и гибкие пешечные структуры, интересные для ценителей стратегического маневрирования", - пишет Крамник. "Отступление пешек дает дополнительные возможности в защите, поэтому белым чуть труднее добиться победы. Вариант понравится шахматистам, предпочитающим защищаться и любителям атаки, стремящимся к новым вызовам".

Обходящие пешки

"Это самый странный и “чужеродный” из всех изучавшихся нами вариантов шахмат", - пишет Крамник. "Даже изучив партии АльфаЗеро, я не вполне понимаю закономерности этой игры – мне неясно, к чему должен стремиться каждый из противников. Позиции выглядят совершенно иначе, многие ходы кажутся странными и ошибочными с точки зрения классических шахмат (...) Это совершенно особый вариант шахмат. Зачастую трудно разобраться в позиции, но игра будет интересна для шахматистов, готовых к экспериментам и меньше привязанных к классическим шахматам!

Самовзятие

"Мне очень нравится этот вариант. Осмелюсь даже сказать, что это - улучшенная версия классических шахмат", - пишет Крамник. (...) "Воздействие инновации на дебют относительно невелико, но самовзятия вносят дополнительную красоту в замыслы в середине и окончании партий. (...) Я горячо рекомендую этот вариант любителям шахмат, ценящим, прежде всего, красоту игры".

В 97-страничную работу вошло намного больше партий и интересных и поучительных пояснений Крамника. Ее можно загрузить в формате PDF.

PeterDoggers
Peter Doggers

Peter Doggers joined a chess club a month before turning 15 and still plays for it. He used to be an active tournament player and holds two IM norms. Peter has a Master of Arts degree in Dutch Language & Literature. He briefly worked at New in Chess, then as a Dutch teacher and then in a project for improving safety and security in Amsterdam schools. Between 2007 and 2013 Peter was running ChessVibes, a major source for chess news and videos acquired by Chess.com in October 2013. As our Director News & Events, Peter writes many of our news reports. In the summer of 2022, The Guardian’s Leonard Barden described him as “widely regarded as the world’s best chess journalist.”

Peter's first book The Chess Revolution is out now!

Company Contact and News Accreditation: 

Email: [email protected] FOR SUPPORT PLEASE USE chess.com/support!
Phone: 1 (800) 318-2827
Address: 877 E 1200 S #970397, Orem, UT 84097

Больше от пользователя PeterDoggers
Шахматы-9LX 2024: Каруана побеждает Каспарова и занимает первое место

Шахматы-9LX 2024: Каруана побеждает Каспарова и занимает первое место

Шахматы-9LX 2024: Каспаров выпустил Накамуру

Шахматы-9LX 2024: Каспаров выпустил Накамуру