구글 딥마인드(DeepMind). 출처:DeepMind

체스 컴퓨터(엔진)와 체스 인공지능(A.I.) - 4편

chessinside

업데이트됨: 2020. 9. 6. 오전 3:31 | 6

안녕하세요 체스인사이드입니다

오늘은 체스 컴퓨터와 체스 인공지능을 살펴보는 마지막 시간입니다. 오늘 다룰 주제는 체스 인공지능(Articificial Intelligence, A.I.)입니다. 지난 기사에서 언급한 것처럼 2017년에는 체스계를 깜짝 놀랠 사건이 하나 일어납니다. 바로 구글 딥마인드(DeepMind) 사의 알파제로(AlphaZero)가 나타난 것입니다.

※ 알파고의 정식 명칭은 알파고 제로(AlphaGo Zero)라는 것을 알고 있나요? 알파고와 알파제로는 같은 회사의 같은 원리를 이용해서 만들어진 형제라고 할 수 있습니다.

한국이 2016년 알파고와 이세돌 선수의 대결로 들썩였고 그로부터 1년 후 알파제로(AlphaZero)가 당시 최고의 체스 컴퓨터(엔진) 스톡피시(Stockfish)와 100경기 대결을 벌입니다. 결과는 28승 72무 0패로 알파제로의 압도적인 승리. 스톡피시의 레이팅은 3400으로 인간의 실력을 훨씬 뛰어넘고 있었기 때문에 놀라운 결과였습니다.

알파제로 vs 스톡피시

조금 더 세분화해서 결과를 살펴보면 알파제로는 백으로 25승 25무 0패를 거두었고, 흑으로는 3승 47무 0패를 기록했습니다. 체스라는 경기는 확실히 백이 유리한 게임이라는 것을 다시 한번 보여줍니다. 그중 대표적인 두 경기는 체스인사이드 유튜브 채널에서 확인하실 수 있습니다

그렇다면 알파제로는 어떻게 스톡피시를 상대로 승리할 수 있었을까요? 알파제로는 1초에 80,000개의 포지션을 분석할 수 있다고 합니다. 인간에 비하면 월등히 많은 숫자이지만 1초에 70,000,000개의 포지션을 분석하는 스톡피시에 비하면 비교도 되지 않는 숫자입니다. 어떻게 80,000이 70,000,000을 상대로 승리할 수 있는 것일까요?

열쇠는 효율성에 있습니다. 지난 3편에서 다룬 컴퓨터의 비효율성을 기억하시나요? 사람 체스 기사라면 10초면 판단할 수 있는 포지션을 체스 컴퓨터는 200수를 분석해야만 결과를 도출할 수 있습니다. 왜냐하면 체스 컴퓨터는 그렇게 작동하도록 만들어져 있기 때문입니다. 체스 컴퓨터는 특수한 상황에 점수를 부여하고 수읽기를 통해 그것의 가치를 평가합니다. 이 체계를 우리는 알고리즘이라고 부릅니다. 하지만 알파제로는 전혀 다른 방식으로 체스를 둡니다.

알파제로는 체스 경기의 규칙 외에는 아무것도 배우지 않습니다. 흔히 체스 컴퓨터에 사용되는 어떠한 오프닝 이론도, 엔드게임 데이터베이스도 부여받지 않습니다. 그리고 오로지 기보 분석과 자가 대국(Self-play)를 통해 체스라는 게임을 '학습'합니다. 알파제로의 형제라고 할 수 있는 알파고의 작동 원리를 잘 분석한 글이 있어 링크로 걸어둡니다. http://www.itworld.co.kr/news/98391

요약하자면, 알파고(알파제로)는 딥러닝 신경망(Deep neural network)와 몬테카를로 트리 검색(Monte-Carlo tree search)을 기반으로 강화 학습(reinforcement learing)을 통해 체스 경기를 배웁니다. 쉽게 말하면, 수많은 시행착오를 통해 틀린 부분을 수정하고 더 나은 방향으로 실력을 향상시킨다는 뜻입니다.

인공지능에게 벽돌 깨기 게임을 시킨 영상을 보신 적이 있나요? 처음에는 벽돌을 몇 개 부수 지도 못하고 게임오버가 되지만 금세 하는 방법을 배우고, 나중에는 벽돌 위쪽으로 공을 집어넣어 벽돌을 깨는 '꼼수'까지 찾아냅니다.

알파제로가 체스를 학습하는 방법도 이와 크게 다르지 않습니다. 그런데 뭔가 익숙한 느낌이 들지 않으신가요? 맞습니다. 이것은 사람이 어떤 것(게임, 공부, 운동 등)을 학습하는 방법과 정확하게 일치합니다. 사람은 수많은 시행착오를 통해 실수를 바로잡으며 실력을 향상시킵니다. 그리고 그렇게 쌓인 기술을 우리는 '직관' 또는 '경험'이라는 말로 표현합니다. 인공지능은 인간의 전유물이라고 생각했던 '직관'과 '경험'을 그대로 흉내 내는 것입니다.

하지만 정말 무시무시한 것은 그 학습능력입니다. 알파제로가 24시간 학습하면 이미 그랜드 마스터의 체스 실력을 뛰어넘는다고 합니다. 2017년에 스톡피시와 경기한 알파제로는 3일 학습한 버전이었습니다. 인공지능은 사람과 다르게 지치지도 않고 자신이 배운 것을 잊어먹는 경우가 없습니다. 알파제로가 학습을 거듭하면 그야말로 실수라고는 찾아볼 수 없는 완벽한 체스 기사(사람은 아니지만)가 탄생하는 것입니다.

2016년 알파고와 대국한 이세돌 선수

바둑이 2016년에 등장한 알파고에게 무너진 것은 우연이 아닙니다. 바둑은 체스보다 경우의 수가 많기 때문에 그전까지 아무리 월등한 바둑 프로그램도 최정상급의 바둑 기사를 상대로 승리하지 못했습니다. 하지만 인공지능이 등장한 후로 얘기는 달라졌습니다. 이제는 바둑뿐만 아니라 다른 분야도 인공지능의 도전을 받고 있습니다.

재미있는 사실은 사람은 적응의 동물이라는 것입니다. 체스를 잘 모르는 친구들은 저에게 '체스에서 인간이 컴퓨터에게 졌잖아?'라고 가끔 말합니다. 혹자는 '사람이 컴퓨터에게 정복당했다.'라는 거친 표현을 써가며 관심을 끌기도 합니다. 하지만 저를 비롯해서 체스를 두는 사람들에게는 그것은 별로 관심이 가는 주제가 아닙니다. 그보다는 어떻게 하면 '컴퓨터를 활용해서 내가 더 잘해질 수 있을까?', '누군가 컴퓨터를 악용하는 것을 어떻게 막을 수 있을까?'가 훨씬 더 중요한 주제입니다.

인공지능과 함께 사는 세상. 기대되지만 한편으로 두렵기도 합니다.

Jinsoo Seong

안녕하세요 체스인사이드입니다

현재 체스닷컴에서 한국어 부문 이사로 근무하며 한국 체스 발전을 위해 다양한 일들을 하고 있습니다. 아래 채널들도 함께 운영하고 있습니다!

유튜브(Youtube) : https://www.youtube.com/chessinside
트위치(Twitch): https://www.twitch.tv/chessinside
네이버 블로그(NAVER blog): https://blog.naver.com/chessinside
인스타그램(Instagram): @chessinside

체스 컴퓨터(엔진)와 체스 인공지능(A.I.) - 4편

chessinside’s Blog