넥슨 인텔리전스랩스 조용래 연구원, 딥러닝 기반 욕설 탐지기 공유

온라인게임 유저들의 스트레스 중 하나인 게임 내 욕설을 인공지능(AI)으로 잡아내는 솔루션이 소개돼 눈길을 끌었다.

넥슨 인텔리전스랩스 조용래 연구원은 24일 판교에서 열린 넥슨개발자컨퍼런스(NDC 2018)에서 딥러닝 기반의 욕설 탐지기를 개발하며 시도해 본 모델링 기법들을 공유했다.

그는 “욕설은 게임 내에서 가장 큰 불쾌요소”라며 “욕설이 심한 경우 게임에서 이탈하거나, 모욕죄로 고소를 하는 일이 벌어지기도 한다”고 전했다. 이 때문에 게임마다 욕설 탐지와 제재 시스템이 존재한다.

조용래 연구원은 딥러닝으로 욕설을 탐지하는 이유에 대해 금칙어를 기반으로 한 기존 방법에 한계가 있기 때문이라고 전했다. 금칙어 기반의 시스템에서는 금지된 단어를 설정해 놓고, 그 단어를 제재하는 방식이다.

그런데 이 경우 욕설을 우회하기 쉽다는 문제가 있다. 예를 들어 욕설 단어 사이에 숫자를 넣거나, 단어를 변형시키는 경우다. 이 때문에 금칙어를 늘리게 되면 오탐이 잦아진다. 그는 “예를 들어 ‘몇학년’에서 ‘년’을 욕으로 인식하거나, ‘스페이스바’에서 ‘스바’를 욕으로 인식하는 등 한계점이 있다”고 말했다.

근본적인 한계는 비속어와 공격적 표현을 구분할 수 없다는 점이다. 그는 “공격적이지 않은 가벼운 욕설, 또는 비속어는 아니지만 공격적인 표현이 존재하는데, 금칙어 기반에서는 이를 잡지 못한다”고 말했다.

또 대부분의 게임의 경우 유저의 욕설 신고를 받고 운영자가 처리하는 시스템인데, 운영자가 시간을 들여야 하고, 작업자의 스트레스가 발생하는 문제가 생긴다. 조용래 연구원은 “지금까지는 모든 신고를 운영자가 수동으로 식별하는 프로세스였다”며 “지향하는 것은 1차 적으로 욕설을 자동으로 분류한 후, 운영자가 수동 식별하는 프로세스”라고 전했다.

넥슨 인텔리전스랩스는 딥러닝을 활용한 욕설 탐지기를 개발했다. 프로토 타입은 지난해 10월 데모 버전으로 선보였으며, 현재 넥슨이 서비스 중인 게임 ‘서든어택’에 적용해 테스트를 진행했다.

조용래 연구원은 “욕설 탐지기는 채팅 중 욕설 부분만 추출해 보여주고, 제재 확률이 높은 순으로 정렬해서 보여준다”며 “보통 욕설 신고는 무작위로 들어오기에 효율적인 판단이 가능하다”고 말했다. 이 욕설 탐지 솔루션은 아직 ‘서든어택’에 적용된 상태는 아니며, 테스트만 완료한 상태라고 한다.

그는 “기존에는 욕설을 1분에 23건 처리했다면, 솔루션을 쓰면 35건을 처리했다”며 “또 기존에는 41%가 제재 대상이었지만, 솔루션 적용 이후에는 96%가 제재 대상에 포함됐다”고 전했다.

조용래 연구원은 “인공지능은 사람을 대체할 수 있는 스카이넷이 아니다”라며 “100% 정확도를 확보할 수 없으면 인간의 손을 거쳐야 한다”고 말했다. 이어 “인공지능은 아이언맨의 비서 자비스 같은 것”이라며 “자비스를 활용해 절약한 시간만큼 아이언맨은 더 많은 사람들을 구할 수 있다”고 덧붙였다.

저작권자 © 게임톡 무단전재 및 재배포 금지