2016년 버전 ‘알파고 리’는 이미 능가…국내 프로기사 상대 연전연승

[한돌의 아버지, 이창율 NHN엔터테인먼트 게임AI팀 책임연구원]

“지금은 알파고 제로와 한돌을 단순 비교하기는 어렵다. 하지만 학습을 반복하면 결국은 양쪽 실력이 비슷해지지 않을까 생각한다.”

이창율 NHN엔터테인먼트 게임AI팀 책임연구원이 23일 판교 사옥에서 열린 바둑 AI(인공지능) 간담회에서 ‘한돌(HanDol)’과 ‘알파고 제로(AlphaGo Zero)’와의 격차를 묻는 질문에 이렇게 대답했다. 당장은 ‘한돌’이 ‘알파고 제로’에 미치지 못하겠지만, 인공지능 특성상 학습이 정체되는 구간이 있기 때문에 나중에는 따라잡을 수 있을 것이라는 설명이다.

‘한돌’은 NHN엔터테인먼트가 1999년부터 ‘한게임 바둑’을 통해 쌓아온 방대한 바둑 데이터를 기반으로 자체 개발하고 서비스하는 AI 바둑 프로그램이다. 국내 게임업계 최초의 자체개발 바둑 AI로, NHN엔터테인먼트는 2017년 12월 ‘한게임 바둑’을 통해 일반 사용자와 ‘한돌’ 간의 상시 대국 서비스를 시작했다.

NHN엔터테인먼트는 구글 딥마인드가 개발한 AI ‘알파고 리(AlphaGo Lee)’가 2016년 이세돌 9단을 이긴 것에 자극받아 ‘한돌’을 개발하기 시작했다. 박근한 NHN엔터테인먼트 기술연구센터 센터장은 “알파고의 대국 이후 바둑 AI들의 기술들을 살펴봤는데, 이들의 근본적 기술을 다른 분야에도 활용할 수 있다면 실제 사용자들도 혜택을 느낄 수 있을 것이라고 판단했다”며 “다행히 우리는 한게임바둑이라는 바둑게임을 갖고 있었고, 양질의 기본 데이터를 많이 보유하고 있기 때문에 우리도 바둑AI를 개발할 수 있겠다는 자신감이 생겼다”고 밝혔다.

[박근한 NHN엔터테인먼트 기술연구센터 센터장]

이후 한돌은 ‘한돌 0.1’, ‘한돌 1.0’, ‘한돌 2.0’을 거쳐 ‘한돌 2.1’로 진화했다. 가장 최신 버전인 ‘한돌 2.1’은 무작위/자가대국으로 만든 기보로부터 학습한 정책망 및 ▲더 정확한 가치망을 사용해 ▲롤아웃 없이 ▲MCTS 수읽기 알고리듬을 통해 다음 수를 예측한다. 여기에 자가 대국을 통해 생성한 기보를 이용하여 학습하는 과정을 반복하여 지속적으로 성능을 개선시키고 있다.

NHN엔터테인먼트는 ‘한돌 2.1’이 이미 2016년 이세돌과 겨뤘던 ‘알파고 리’의 수준을 넘어섰다고 밝혔다. ‘알파고 리’의 Elo(선수들의 기량을 수치화한 것)가 3750이라면, ‘한돌2.1’의 Elo는 4000점을 훨씬 넘는다는 주장이다. 일반적으로 바둑기사 9단의 Elo는 3500이다. NHN엔터테인먼트측은 “Elo 격차가 400이 넘으면 이기기 매우 어렵다”고 설명했다.

다만 ‘알파고’의 최신 버전인 ‘알파고 제로’와는 아직 격차가 있을 것으로 예상했다. ‘알파고 제로’는 기보 없이 스스로 바둑을 공부하는 AI다. 이세돌을 이긴 ‘알파고 리’와 100번 붙어 100번 전승한 바둑의 신(神)이다.

한편 NHN엔터테인먼트는 2018년 12월부터 출시 1주년을 기념해 한달 간 총 다섯 명의 최상위 랭킹 바둑 프로기사들과 릴레이 대국을 펼치는 ‘프로기사 TOP5 vs 한돌 빅매치’ 이벤트를 진행 중이다. 이 이벤트에서 ‘한돌’은 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단을 차례로 꺾었다. 23일에는 국내 바둑 랭킹 2위 신진서 9단과 마지막 대국을 진행한다. 신진서 9단은 “한돌의 기량이 강하다는 것은 잘 알고 있고, 많이 힘든 승부가 될 것 같다”며 “열심히 둬서 좋은 모습을 보이고 싶다”는 각오를 밝혔다.

[신진서 9단]
저작권자 © 게임톡 무단전재 및 재배포 금지