• 프린트
  • 메일
  • 스크랩
  • 글자크기
  • 크게
  • 작게

[e종목] 'MS·바이두·네이버' 파트너 플리토, 한국형 '챗GPT' 이끌까

챗봇용 멀티턴 대화 데이터 관련 문의 줄이어…"해외시장 적극 진출"

박기훈 기자 | pkh@newsprime.co.kr | 2023.03.09 17:12:04

플리토 본사 내부 전경 ⓒ 플리토


[프라임경제] 오픈AI의 챗GPT가 사회 여러 분야에 급격한 변화를 가져오면서 국내외에서 생성형 AI(Generative AI)에 대한 대규모 투자가 진행되고 있다. 

특히 국내의 경우, 한국어 맞춤형 AI(인공지능)에 대한 투자·개발이 집중되고 있다. 네이버와 카카오 등 대기업들은 '한국어 잘하는 AI'를 강점으로 내세우고 있으며, 정부 역시 한국형 챗GPT(K-챗GPT) 개발을 발표하고 나섰다. 

이와 같은 행보들이 가속화되자 플리토(300080)가 업계와 투자자들로부터 주목받고 있다. 생성형 AI의 가장 기본이자 핵심인 언어데이터 사업을 영위하고 있다는 점, 글로벌 빅테크들과 협업을 진행했다는 점, 여기에 더해 국립국어원의 병렬 말뭉치 사업을 2년째 수주했다는 점까지 겹치면서 향후 수혜 기대감이 몰린 것으로 풀이된다. 

◆ 플리토, 'AI 필수' 언어데이터 전문 기업

언어데이터 및 전문번역서비스기업인 플리토가 보유한 언어 데이터는 상상을 초월한다. 현재 운영 중인 언어 번역 플랫폼을 통해 1억개 이상의 누적 데이터를 보유하고 있다. 25개 언어를 지원하는 해당 플랫폼은 137개국 1000만명 이상의 사용자가 이용 중인 것으로 파악되고 있다. 

주목할 점은, 플랫폼에서 생산되는 방대한 양의 △텍스트 △음성 △이미지 언어 데이터 저작권은 플리토에 귀속된다는 것이다. 플랫폼을 통해 수집된 말뭉치를 집단지성을 활용한 검수 과정 거쳐 정제한 후 해당 언어 데이터가 필요한 공공기관 또는 글로벌 IT 기업 등에 판매하고 있다. 

특히, 플랫폼을 통해 매일 생성하는 고품질의 학습용 언어데이터는 AI 엔진 고도화에 활용하고 있으며, 효율적인 대량 데이터 관리 노하우를 바탕으로 다양한 조건의 언어 데이터를 성별, 연령대, 지역 등 메타데이터와 함께 제공 중에 있다. 

◆ MS, 네이버, 바이두 등 협업 "해외시장 적극 진출"

특히 지난 1월 플리토는 통합 플랫폼을 통해 구축한 대화 데이터 수가 하루 약 50만 건을 최초 돌파했다고 밝히면서 이목을 집중시켰다. 챗GPT로 인해 챗봇용 언어 데이터 수요가 지속적으로 증가하고 있는 상황 속에 이룬 '쾌거'다.

플리토는 통합언어 플랫폼을 통해 수집한 언어 데이터를 자체 AI엔진 및 시스템을 이용, 고품질의 데이터로 완성한다. 때문에 기업의 상담용 챗봇을 위한 주제별 대화 데이터 생성에 용이하다는 평가다. 데이터 매출 중 40% 이상이 해외에서 발생하고 있는 이유이자, 대화 데이터에 대한 사업 문의가 끊이지 않고 있는 이유다. 

특히 인공지능 챗봇 및 언어 인공지능 개발을 진행 중인 글로벌 유수 IT 기업과의 파트너십을 통해 올해도 해외 매출 비중의 지속적인 성장이 예상되고 있다. 

지난해 12월 글로벌 IT기업과 말뭉치 판매 계약을 체결한 플리토는 앞서 마이크로소프트, 오라클, 네이버, 텐센트, 바이두 등 국내외 빅테크들과 함께 사업을 진행한 바 있다. 

플리토 관계자는 "언어데이터 사업, 특히 챗봇용 멀티턴 대화 데이터에 대한 기업들의 문의가 현재 굉장히 많이 들어오고 있는 상황"이라며 "기존에 협업했던 글로벌 빅테크들과 지속적인 관계를 유지하며 추후 협업 기회를 모색하는 중"이라고 설명했다. 

또한 "올해 국내시장은 물론, 해외시장을 좀 적극적으로 진출할 계획"이라고 덧붙였다. 

웹과 앱에서 구현되 플리토 통합 번역 플랫폼 ⓒ 플리토


◆ "'챗GPT' 적용 방안 다각도 모색 중"

정부가 이달 중 '초거대 AI 산업 정책방향'을 발표한다고 나서면서 귀추가 주목되고 있다. 지난 8일 과학기술정보통신부는 제3차 AI 최고위 전략대화를 통해 관계부처와 함께 새로운 디지털 신질서의 모범이 되기 위해 최선을 다하겠다고 천명하고 나섰다.

이에 앞서 지난달 문화체육관광부(이하 문체부)는 국립국어원과 함께 한국형 챗GPT(K-챗GPT) 개발을 위해 고품질 한국어 말뭉치(코퍼스) 구축을 확대할 것이라고 발표했다.

문체부는 챗GPT로 대표되는 생성형 AI 기술이 가져올 거대한 변화에 필요한 문화적‧제도적‧산업적 기반을 선제적으로 마련하기 위해 세 개 분야의 워킹그룹을 발족했다고 설명했다. △저작권 제도의 개선 △'한국어 잘하는 AI'를 위한 한국어 말뭉치 학습 △콘텐츠 창작과 산업에서의 AI 활용이 그것이다.  

이와 관련해 박보균 문체부 장관은 "고품질 한국어 학습데이터인 모두의 말뭉치 구축을 확대하고, AI 산업 발전과 창작자들의 공정한 권리 보장의 균형을 이룰 수 있는 저작권 제도개선 방안을 선제적으로 마련해 나갈 것"이라고 약속했다. 

플리토는 현재 국립국어원의 병렬 말뭉치 사업을 진행 중이다. 국제한국어교육학회와 함께 보조사업자로 참여하고 있으며, 오는 31일까지 과제를 수행하게 된다. 플리토는 해당 사업을 통해 영어·중국·일본어와 같이 기존 데이터가 많은 외국어 대비 데이터량이 적은 베트남어, 말레이시아어, 캄보디아어와 같은 외국어의 말뭉치를 구축하는 작업을 진행 중에 있다.   

챗GPT는 영어에 강점이 있지만 한국어 데이터는 많이 부족한 상황이다. 플리토는 방대한 양의 한국어 데이터 말뭉치를 보유하고 있는 것은 물론, 이를 통해 빠르게 플랫폼을 구축할 수 있다는 강점을 지니고 있다. 

이에 업계에선 문체부의 'K-챗GPT'에 특화된 기업이라는 평가와 함께 사업이 본 궤도에 들어설 경우 가장 큰 수혜를 받을 수 있을 것으로 내다보고 있다.

플리토 관계자는 이와 관련해 "'K-챗GPT'과 관련해 직접적으로 논의된 사안은 아직까지 없다"면서도 "그동안의 경험과 기술이 어필되지 않을까 생각한다. 이와는 별개로, 현재 회사 내부적으로도 '챗GPT'를 저희 사업·서비스에 적용하기 위해 다각도로 모색 중에 있다"고 언급했다. 


  • 이 기사를 공유해보세요  
  •  
  •  
  •    
맨 위로

ⓒ 프라임경제(http://www.newsprime.co.kr) 무단전재 및 재배포금지