[인터뷰] 워싱턴대 교수 ‘2017 인공지능 국제컨퍼런스’ 키노트

글로벌 AI(인공지능) 석학 12명이 용산에 모였다. 10년간 다양하게 발전해온 AI의 기술과 트렌드를 점검하는 자리였다.

12일 서울 용산 드래곤시티 호텔에서 열린  ‘2017 인공지능 국제컨퍼런스’는 1500명의 관람객이 몰렸다. 키노트는 톰 미첼(Tom Mitchell) 카네기 멜론대 교수와 노아 스미스(Noa Smith) 워싱턴대 교수가 맡았다.

‘자연어 처리의 새로운 트렌드’를 발표를 통해 자연어처리의 언어모델링 방법론(표현학습)의 트렌드를 소개한 노아 스미스 교수를 현장에서 만나보았다.

■ “다양한 언어 표현 방식에 맞게 머신러닝 준비”

존스홉킨스대 박사 출신인 노아 스미스 교수는 자연어처리 분야 대가로 전 ACL(전산언어학협회) 프로그램 공동 위원장을 역임했다.

그는 “인간은 다양한 언어 표현 방식이 있다. 개인화, 차별화된 입력 프로세스가 있다. 표현학습으로 단어, 문장, 문서의 특징-의미 등의 표현을 머신러닝으로 학습하는 상황에서  적용의 다양한 전제 조건이 있다”고 설명한다.

이어 “언어 데이터를 설명하는 최적 언어모델 선별에 필수적인 선호조건(bias) 등 문서/문장의 의미구조와 모델의 재사용가능 구성요소들 및 풍부한 활용할 필요가 있다”고 소개했다.  

그는 아마존 에코 테스팅을 할 때를 소개했다. “첫 테스트할 때 회의적이었다. 그런데 자연스럽게 컴퓨터와 대화를 할 수 있었다. 딥 러닝 네트워크는 10년간 발전해왔다. 하지만 한국-영어 통번역은 어렵다. 그 어려움이 되레 잠재적인 요소가 된다”고 말했다.

창의성과 관련 AI는 과연 예술가 수준에 오를 수 있을까. 그는 창의성을 극대화하는데 지원하는 정도지 예술가 수준까지 오르기는 어렵다고 진단한다.

“글쓰기의 경우 기계가 문장을 추천할 수 있다. 그리고 인간 방식의 방향을 이끌어줄 수는 있다. 더 흥미를 끌어내도록 창의성을 극대화하는데 지원은 가능하다(그 정도다).”

 ■ “한국어 부부 대화, 한국적인 맥락과 존댓말도 반영”

노아 스미스 교수는 자연어 처리 대가로 방법론으로 기계와 언어 구획, AI 입력 케이스를 연구해왔다.

AI인식처리는 자연학습하고는 완전히 다르다. “기계학습, 딥러닝, 지도학습, 음성, 이미지 학습 등이 있다. 가령 아마존 에코를 영어로 컴퓨터와 대화할 수 있지만 한국어로는 설정을 다시해야 한다. 말하는 방식이 아니라 태도와 온도, 말투와 용어가 다르다. 한국식으로 새 설정해야 빌드해야 한다.”

부부 대화도 한국적인 맥락(남녀 존중)과 존댓말 문제도 반영해야 한다. 그는 “가령 미국에서 간호사에 대하여 입력할 때, 여자 간호사가 대부분이어서 서브로 입력을 해야 한다. 전형적인 데이터 이외의 값도 입력해야 한다”고 설명했다. 

그는 “영어와 영어, 한국어와 한국어 사이와 달리 멀티언어의 경우 유사와 다른점을 조사해보면 재미있는 일이 생길 것이다. 다양한 변수와 놀라운 일들이 생긴다. 명령과 상징, 그리고 뜻이 달라질 수 있기 때문이다”고 덧붙였다.

 

■ “편안함-내밀한 심리 없는 인공지능은 로맨스를 할 수 없다”

연구에서 가장 중요한 과제는 뭘까?

“인간은 다양한 언어표현 방식이 있다. 자연어처리와 명령어 입력 작업시 리액션 등 프로세스가 중요하다. 대화 기반 자연어를 입력해 응답하고 다시 응답해 대화법을 가시화한다. 개인화되고 차별화한 다양한 모습을 입력해야 한다.”

여기에서 편견과 오도된 윤리 등을 필터링해야 한다. 가령 학부에서 ‘흑인’ 항목에서 머싱러닝 데이터에 들어가보니 잘못된 결론이 나왔다.

그는 “학회나 커뮤니티에서 계속적으로 균형을 잡아주어야 한다. 그리고 오류를 줄일 수 있는 방법을 찾아야 한다. 예로 들어 한국어는 영어에는 없는 변형이 많다. 접두사와 접미사가 있고 어미가 있다. 어휘력 값이 다르다. 이에 대한 도전적인 연구도 시도할 만하다”로 말했다.

인공지능은 로맨스를 할 수 있을까? 그는 인간은 편안함, 내밀한 심리가 있어 연애를 한다. AI가 대체할 수 있다고 단언했다. 물론 AI는 객관화해 입력된 매뉴얼로 가능하지만 그것이 인간을 대체할 수 없다고 강조했다.

말을 줄여서 표현하는 어린이들의 행동을 비판해야 할까. 그는 “언어는 변화한다. AI로 학습하고 AI로 할 수 있는 것이 아니다”고 말하며 웃었다.

‘2017 인공지능 국제컨퍼런스’는?

과학기술정보통신부가 주최하고 정보통신기술진흥센터(센터장 이상홍, IITP), 정보통신산업진흥원(원장 윤종록, NIPA), 전자부품연구원(원장, 박청원, KETI), 지능정보산업협회(협회장 김장기, AIIA)가 공동으로 주관했다.

저작권자 © 게임톡 무단전재 및 재배포 금지