• 프린트
  • 메일
  • 스크랩
  • 글자크기
  • 크게
  • 작게

'인간 vs AI' 번역 대결…인공신경망 번역 현주소는?

구글 번역 vs 파파고 vs PNMT 현재 수준 한자리서 비교

황이화 기자 | hih@newsprime.co.kr | 2017.02.21 12:05:24

[프라임경제] 인공지능(AI) 번역이 생활 편의 제공을 넘어 전문가 수준에 도달할까.

'제2의 알파고 대국'으로 세간의 관심이 집중된 인간 번역 vs AI 번역 대결이 21일 오후 2시 세종대학교에서 진행된다.

현 단계에선 인간 번역이 승리할 것이란 관측이 우세한 가운데 이번 대결을 통해 구글 번역기, 네이버 번역기 '파파고', 시스트란 인터내셔널의 'PNMT' 등 상용화된 인공 신경망 번역(Neural Machine Translation·NMT) 서비스들의 현재 수준을 한자리에서 비교할 수 있게 됐다.

NMT는 기존 기계 번역에 생물의 신경망, 특히 인간의 두뇌처럼 만든 통계학적 학습 알고리즘인 '인공 신경망'을 적용한 고도화된 번역 방식이다. 기존 기계 번역이 단어별로 번역해 문장 번역을 완성했다면, NMT 방식은 문장이나 문단 단위로 번역한다는 것이 특징이다.

세종사이버대학교와 국제통번역협회가 공동 주최하는 이번 행사는 전문 번역사와 최신 NMT 기술을 적용한 구글, 네이버, 시스트란 3사의 번역 서비스가 즉석에서 대결을 펼쳐 정확도에 따라 승패를 가른다.

'한글-영어' 번역을 주제 삼아 이날 신문 사설 및 기사 4개가 무작위로 주어지면 영자지 지문 2개는 한글, 한글 신문 2개는 영문으로 30분 동안 각각 번역하는 방식이다.

◆"바둑만큼은…" 인간의 착각, AI 번역은?

약 1년 전, 구글 딥마인드의 AI '알파고'와 이세돌 9단의 대국 결과를 보고 전 세계가 충격에 빠진 바 있다.

'우주 원자 수보다 많은 경우의 수를 가졌다'는 바둑이라 창의적인 인간이 필승할 것으로 예상했던 대결에서 이세돌 9단은 첫 대국부터 패했으며, 가까스로 1승을 챙기는 데 그쳤다. 많은 전문가들의 예견을 뒤엎었던 것이다.

이번에 펼쳐질 번역 대결을 놓고도 대다수 전문가와 업계는 '인간이 반드시 이길 것'이라는 관측을 내놓고 있다.

NMT 방식은 기존 기계 번역 대비 두 배 이상 정확도를 갖춘 것이 사실이지만, 이 기술이 등장한 것이 불과 2년, 실제 시장에 적용된 것은 1년여밖에 되지 않았기 때문에 학습이 덜 됐다는 판단에서다.

업계 관계자는 "현재 NMT 기술은 이제 막 첫발을 뗀 격"이라며 "현 단계에선 인간 편의를 주기 위한 서비스 수준으로 봐야지 전문가 수준이라고 보기는 어렵다"고 말했다.

다만 속도 면에서 인간 번역보다 NMT 번역이 뛰어나다는 견해가 우세하다. 이번 대결에서 주어진 30분이라는 시간은 인간을 배려한 것으로, 더 짧은 시간이 주어진다면 AI 번역 서비스들이 더 좋은 성적을 낼 것이라는 설명이다.

◆구글 번역 vs 파파고 vs PNMT, 승자는?

구글·네이버·시스트란 인터내셔널 등 세 사업자의 서비스가 대결을 펼치는 터라 인간과 AI 대결 결과만큼 각 서비스의 번역 수준에도 관심이 쏠린다.

최근 AI가 전세계 화두로 떠오르는 와중에 NMT 역시 각광받고 있다. 각 사업자는 자사 기술 성과를 홍보하고, 일반에서는 이들이 적용된 서비스들 중 어떤 번역기가 더 정확히 번역하는지 비교하기도 한다.

구글은 지난해 11월 이전부터 서비스돼 오던 구글 번역기에 NMT 기술을 새로 적용한 번역기를 정식 출시하는데 한국어·일본어·중국어·터키어·독일어·프랑스어·스페인어·포르투갈어 등을 포함한다. 세계 1위 포털사업자인 구글은 웹사이트 상에 오픈된 말뭉치를 이용해 학습시켜 데이터 수집 모수가 방대하다.

네이버는 지난해 8월 '네이버 사전' 애플리케이션에 일부 지원되던 통·번역서비스에 자체 NMT 기술을 더해 특화한 '파파고'를 출시했다. 파파고는 한국어·일본어·중국어·영어 등 네 나라의 언어를 지원한다.

네이버는 "파파고에 적용된 한국어-중국어 간 NMT를 기존의 적용 전 통계기반 번역과 비교한 결과, 한국어→중국어는 약 160%, 중국어→한국어는 약 233%까지 번역 정확도가 크게 개선된 것으로 나타났다"고 제언했다.

시스트란 인터내셔널은 2015년 8월부터 NMT 엔진 'PNMT'를 상용화한 바 있다. 시스트란 인터내셔널은 PNMT 개발을 위해 미국 하버드대학교와 연구·개발을 협력했고, 5만 시간이 넘는 언어모델 트레이닝을 실시했다.

업계 관계자는 "NMT에서 데이터 수집이 관건인데, 각사 서비스마다 특정 문장에 따른 데이터 수집량이 다르기 때문에 어떤 문장에서 A사 번역이 더 나았다면, 또 다른 문장에서는 B사 번역이 더 나을 수 있다"고 언급했다.

여기 더해 "그렇다고 해서 A사 번역 수준이 더 낫다, B사 번역 수준이 더 낫다라고 단순히 판단하기 어렵다"고 첨언했다.

  • 이 기사를 공유해보세요  
  •  
  •  
  •    
맨 위로

ⓒ 프라임경제(http://www.newsprime.co.kr) 무단전재 및 재배포금지