• 프린트
  • 메일
  • 스크랩
  • 글자크기
  • 크게
  • 작게

[스타트업] "음성도 포토샵처럼 고친다" 최순범 오드아이 대표

재녹음 없이 대사·발음·언어 보정

김우람 기자 | kwr@newsprime.co.kr | 2026.06.23 16:28:23
[프라임경제] "사진을 찍은 뒤 포토샵으로 보정하는 일이 자연스럽듯, 음성에도 그런 편집 도구가 필요합니다."

최순범 오드아이 대표. = 김우람 기자


최순범 오드아이 대표는 오드아이의 역할을 '음성의 포토샵'에 비유했다. 이미 녹음된 목소리를 새로 만들기보다, 녹음 이후 발생하는 대사·발음·언어 수정 수요를 자연스럽게 고치는 데 초점을 맞췄다는 설명이다.

녹음이 끝났다고 모든 작업이 끝나는 것은 아니다. 대사가 바뀌거나 발음이 어색하면 다시 녹음실을 잡아야 한다. 배우와 성우 일정을 맞추고, 스튜디오를 빌리고, 후반작업을 다시 거친다.

재녹음은 한때 완성도를 위한 당연한 과정으로 받아들여졌다. 배우 현빈이 드라마 시크릿가든 OST '그 남자'를 5시간 녹음한 뒤에도 결과가 마음에 들지 않아 새벽 시간 다시 녹음실을 찾았다는 일화가 대표적이다. 당시에는 재녹음이 작품에 대한 애정과 책임감을 보여주는 장면이었다.

그러나 콘텐츠 제작량이 늘고 유통 속도가 빨라진 지금, 모든 수정사항을 재녹음으로 해결하는 방식은 제작 현장의 부담이 됐다. 오드아이는 이 지점에 주목한 스타트업이다.

오드아이가 개발한 'Gluent'는 이미 녹음된 목소리의 톤과 억양, 감정을 유지한 채 원하는 문장이나 언어로 음성을 수정하는 솔루션이다. 새 목소리를 만드는 데 초점을 맞추기보다, 녹음된 말을 자연스럽게 고치는 데 무게를 둔다.

직접 본 시연은 설명보다 이해가 빨랐다. 일반 쇼츠 영상을 불러오자 음성이 문장 단위로 나뉘었고, 특정 단어나 문장을 바꾸면 해당 부분의 음성이 다시 생성됐다. "차분한 목소리로 바꿔달라"는 식의 지시도 가능했다. 기자가 보기에는 새 음성을 만드는 서비스라기보다, 이미 녹음된 음성을 고치는 편집 도구에 가까웠다.

실제 적용 사례도 있다. 한 영화에서는 외국어에 능숙한 인물 설정을 살리기 위해 배우의 기존 목소리를 바탕으로 이탈리아어 대사의 자연스러움을 보완했다. 기존 방식이라면 후시녹음이나 별도 언어 코칭, 재녹음 과정이 필요했지만, 오드아이는 원음의 톤을 유지한 채 발화의 어색함을 줄이는 방식으로 장면의 완성도를 높였다.

최 대표는 "고품질 오디오는 대부분 스튜디오 환경에서 만들어진다"며 "녹음실에 들어가기 전 대본과 기획이 완성돼 있어야 하지만, 실제 제작 과정에서는 예상하지 못한 수정이 늘 생긴다"고 설명했다.

영화나 드라마에서는 후시녹음이 대표적이다. 촬영 현장에서 대사가 멀게 들리거나 발음이 분명하지 않을 때, 감정선이 아쉬울 때 다시 녹음하는 과정이다. 오드아이는 이 과정을 모두 없애겠다는 것이 아니라, 꼭 다시 부르지 않아도 되는 부분을 줄이겠다는 입장이다.

배우와 성우의 대사 전달력 문제도 이 기술이 겨냥할 수 있는 영역이다. 촬영 현장에서 감정선은 좋았지만 특정 단어가 분명하게 들리지 않거나, 외국어 대사의 억양이 어색하거나, 빠른 호흡 탓에 일부 문장이 묻히는 경우가 적지 않다. 기존에는 이런 문제를 해결하기 위해 후시녹음이나 재녹음을 진행해야 했지만, Gluent는 원래 배우의 목소리와 감정선을 유지한 채 발음이나 문장 일부를 보완하는 방식으로 활용될 수 있다.

다만 이를 배우의 연기를 대체하는 기술로 보기는 어렵다. 전달력은 발음만으로 결정되지 않는다. 표정, 호흡, 감정선, 장면의 리듬, 상대 배우와의 반응까지 맞물려 만들어진다. 음성 편집 기술이 대사를 더 또렷하게 만들 수는 있지만, 장면 전체의 연기와 연출을 대신할 수는 없다는 의미다.

최 대표는 "성우나 배우가 없다면 저희 기술도 쓸 수 없다"며 "기존 연기와 목소리를 바탕으로 부족한 부분을 보완하는 기술"이라고 말했다.

활용처는 영상 후반작업에만 그치지 않는다. 유튜브나 숏폼 콘텐츠에서도 녹음 후 정보가 바뀌는 일이 잦다. 제품 출시 전 미리 찍어둔 영상에서 사양이나 명칭이 바뀌면 지금은 자막으로 정정하거나 다시 녹음해야 한다. Gluent는 이런 경우 해당 문장만 바꾸는 방식으로 제작 부담을 줄일 수 있다.

오드아이가 겨냥하는 시장은 IP 콘텐츠, 게임, 더빙, 영화 후반작업 등이다. 하나의 캐릭터나 아티스트 IP를 여러 언어와 포맷으로 확장하려면 음성의 일관성을 유지하는 일이 중요하다. 그러나 기존 방식으로는 시청자층이나 언어에 맞춰 음성을 바꾸는 데 시간과 비용이 많이 든다.

최 대표는 "제작사들은 하나의 IP를 여러 형태로 활용하고 싶어 한다"며 "문제는 목소리의 일관성을 유지하면서 콘텐츠 성격에 맞게 수정하기 어렵다는 점"이라고 말했다.

사업 검증도 이어지고 있다. 오드아이는 네이버 D2SF와 탭엔젤파트너스로부터 투자를 유치하며 기술력과 성장 가능성을 인정받았다. 또 한국콘텐츠진흥원 콘텐츠 스타트업 데모데이에서 최우수상을 받는 등 콘텐츠 분야에서도 주목받고 있다.

고객사와 협업 사례도 콘텐츠 업계에 맞닿아 있다. 오드아이는 SM엔터테인먼트(041510), 조수미 등 엔터테인먼트 기업 및 아티스트와 협업하며 레퍼런스를 쌓고 있다. 네이버 D2SF 포트폴리오 소개에도 오드아이가 게임, 엔터테인먼트, 버추얼 크리에이터 분야에서 파트너십을 확보하고 조수미, 박새별 등의 공연·음반 작업에 참여했다고 소개돼 있다.

그 결과 오드아이는 시너지아이비투자가 운영하는 IBK기업은행(024110)의 창업 육성 플랫폼 'IBK창공 마포 13기'에 선정된 바 있다. 

기술이 편리해질수록 불안도 커진다. 특히 목소리는 얼굴만큼이나 개인성이 강한 영역이다. 성우나 배우의 목소리가 동의 없이 쓰이거나, 계약 범위를 넘어 활용될 수 있다는 우려도 있다.

최 대표는 이 문제를 기술 못지않게 중요한 사업 조건으로 보고 있다. 그는 "고객들이 가장 걱정하는 것은 제공한 목소리가 외부로 유출되거나 합의한 범위를 넘어 사용되는 일"이라며 "접근 권한을 세분화하고, 사용 범위를 통제하는 운영 체계를 만들고 있다"고 밝혔다.

오드아이 'Gluent' 시연 화면. ⓒ 오드아이


오드아이는 보이스 워터마크도 준비 중이다. 생성된 음성이 어디에서 어떻게 쓰였는지 추적할 수 있어야 기업 고객이 안심하고 기술을 쓸 수 있다는 판단에서다. 목소리가 하나의 IP가 되는 시대에는 데이터 관리, 폐기, 사용 범위 설정까지 함께 따라가야 한다는 설명이다.

최 대표의 출발점은 음악이었다. 그는 KAIST 문화기술대학원에서 AI 음악·오디오 컴퓨팅을 연구했고, 밴드 활동도 병행했다. 기술자이면서 동시에 오디오 제작 현장을 가까이서 경험한 셈이다.

인터뷰 내내 최 대표가 강조한 것은 '대체'보다 '편집'이었다. 사람이 하던 연기와 목소리를 없애겠다는 것이 아니라, 이미 만들어진 결과물을 더 빠르고 자연스럽게 다듬겠다는 얘기다.

최 대표는 "콘텐츠 제작 속도는 여전히 시청자들이 원하는 속도를 따라가지 못하고 있다"며 "재녹음에 쓰이던 시간과 비용을 줄이면 제작사와 창작자는 더 좋은 IP를 만드는 데 집중할 수 있을 것"이라고 말했다.

오드아이의 기술은 아직 완성된 답이라기보다 제작 현장의 오래된 불편을 겨냥한 도구에 가깝다. 중요한 것은 목소리를 얼마나 그럴듯하게 새로 만드느냐보다, 이미 만들어진 콘텐츠를 얼마나 덜 망가뜨리고 더 빨리 고칠 수 있느냐다. 발음과 언어 수정은 물론, 배우와 성우의 대사가 관객에게 더 선명하게 전달되도록 보완하는 영역까지 포함된다. 그 지점에서 오드아이는 '생성'보다 '편집'이라는 현실적인 시장을 보고 있었다.


  • 이 기사를 공유해보세요  
  •  
  •    
맨 위로

ⓒ 프라임경제(http://www.newsprime.co.kr) 무단전재 및 재배포금지




 

많이 본 뉴스