엔씨소프트, 자체 개발 ‘비무 AI’로 프로게이머와 맞대결

엔씨소프트가 개발한 인공지능 ‘비무 AI’가 ‘블레이드앤소울’ 글로벌 e스포츠대회 ‘블소 토너먼트 월드 챔피언십’을 통해 화려하게 모습을 드러냈다.

15일 오후 서울 올림픽공원 SK핸드볼경기장에서 열린 ‘블소 토너먼트 2018 월드 챔피언십’ 결선에서는 결승전을 앞두고 특별한 블라인드 매치가 진행됐다. 각국을 대표하는 세 명의 역사 유럽의 니콜라스 파킨슨, 중국의 선 하오란, 한국의 최성진과 의문의 게이머 ‘데스나이트 J([KOR]DES_Knight_J)’의 경기가 펼쳐졌다.

‘데스나이트 J’라는 선수가 누구인지에 대해서는 경기 당일까지도 공개되지 않았다. 블라인드 매치 1경기에서는 유럽의 파킨슨 선수가 2:1로 승리를 거뒀다. 2경기에서는 중국의 에이스 선 하오란이 승리했다. 마지막으로 한국의 최성진이 출전한 3경기에서는 최성진이 2:0으로 패배했다. 마지막 세트를 승리한 ‘데스나이트 J’는 프로게이머 못지않은 실력자라는 평가를 받았다.

경기가 끝난 후, ‘데스나이트 J’의 정체가 밝혀졌다. 그는 인간 게이머가 아니라 엔씨소프트에서 개발 중인 ‘비무 AI’였다. 엔씨소프트는 총 3년 6개월간 진행된 연구개발(R&D)을 통해 이 인공지능 프로그램을 개발했다. ‘비무 AI’는 구글의 알파고 제로와 같이 스스로와 대결하며 성장했고, 올해 7월에 이르러서는 아마추어 고수 이용자들이 손대지 못하는 수준까지 이르렀다. 현재는 약 1주(35만 게임)면 프로게이머 수준까지 성장하도록 개발하는 데 성공했다.

‘비무 AI’와 알파고의 차이는 ‘실시간성’, 즉 상대의 반응에 곧바로 대응할 수 있다는 점이다. 바둑은 플레이어끼리 번갈아가면서 움직이는 ‘턴제 게임’이지만, 비무는 ‘블소’의 실시간 격투 게임이다. 실시간 게임이므로 상황이 바뀌었을 때 0.1초 내로 어떤 스킬을 써야 할지 결정해야 한다. 바둑과 달리 연산 시간이 매우 부족하다.

게임 규칙도 바둑에 비해 복잡하다. 스킬 사용 타이밍과 스킬 취소 등 다양한 게임 규칙에 대응해야 한다. 비무 AI에는 1틱(0.1초)당 225가지(45개 스킬x이동 방향 5가지)의 선택지가 주어진다. 한 게임은 최대 1800틱(약 3분) 진행되므로 총 225의 1800승 만큼의 선택지를 가진다. 엔씨소프트는 바둑(10의 768승)보다 경우의 수가 많다고 설명했다.

‘비무 AI’는 기존 강화학습 AI를 발전시킨 ‘심층 강화학습’ 기반 AI를 사용했다. 심층 강화학습이란 기존 강화학습 기술에 딥러닝을 접목한 형태다. 시합 중 경험하게 되는 다양한 상황을 세밀하게 의사결정에 반영할 수 있어, 스킬 사용이나 움직임 면에서 어떤 규칙도 주지 않고도 다양한 상대 AI에 대응하는 최적의 의사결정 정책을 학습할 수 있다. 덕분에 어떤 고수 프로게이머를 만나도 적절한 의사 결정을 할 수 있는 수준까지 발전할 수 있었다.

엔씨소프트 연구팀은 프로게이머들을 상대할 뿐만 아니라, 보는 재미를 줄 수 있는 AI를 만들고자 했다. 그래서 학습 방법에 변화를 줘 개성을 부여해 3종의 AI를 만들었다. 1번 AI는 공수 균형, 2번 AI는 방어형 플레이를 보여준다. 3번 AI는 공격형 스타일로 만들어졌다.

이날 경기 후 엔씨소프트 이재준 AI센터 센터장은 “세 명의 선수가 각각 다른 AI를 상대했다”며 “마지막 최성진 선수가 상대한 AI는 현재까지 사람을 상대로 한 번도 패한 적이 없다”라고 밝혔다.

저작권자 © 게임톡 무단전재 및 재배포 금지