[프라임경제] 덱스터스튜디오(206560, 이하 덱스터)가 컴퓨터 애니메이션 분야 최장수 국제 학회에서 수상하며 세계적 기술력을 선보였다.
콘텐츠 전문기업 덱스터는 스위스 제네바에서 열린 'CASAXR 26'에서 AI 기반 3D 모션 검색 기술을 주제로 논문을 발표했다고 16일 밝혔다.
덱스터의 논문은 평단의 호평을 받으며 '최우수 응용기술상'을 수상했고, 200년 전통의 글로벌 학술 출판사 '와일리(Wiley)'가 발간하는 학술지 CAVW(Computer Animation and Virtual Worlds)에 게재될 예정이다.
CASAXR(구 CASA)은 국제컴퓨터그래픽스학회(CGS)의 주도로 1988년 세계 최초의 컴퓨터 애니메이션 분야 학회로 창립된 이래, 올해로 39회째를 맞이하는 동안 가상 인간 및 컴퓨터 애니메이션 분야를 대표해온 세계에서 가장 긴 역사와 권위를 자랑하는 국제 포럼이다.
확장현실(XR)의 급격한 성장에 발맞춰 올해부터 기존 명칭에 'XR'을 더한 'CASAXR'로 명칭을 변경하고, 미래형 AI 및 이머시브 테크 학회로 변모해 학계와 테크 기업들의 이목을 집중시켰다.
덱스터는 '비디오 기반 학습이 필요 없는 3D 모션 검색 기술(VMR: Training-Free 3D Motion Retrieval from Video)'이라는 주제의 논문을 발표했다.
모션 캡처 데이터베이스에서 원하는 3D 동작을 찾고 싶은 경우 텍스트의 조합으로 검색하는 대신, 샘플 동영상만 입력하면 AI가 동역학적 특징을 분석해 가장 유사한 3D 모션 데이터를 찾아내는 기술을 개발한 것이 주요 내용이다.
동작을 주관적 표현으로 설명해야 하는 기존 AI 모델의 방식을 벗어나 동작이 담긴 동영상 하나만으로 직관적인 탐색이 가능하게 했다.
해당 기술은 학계 표준 데이터셋을 활용한 성능 평가에서 99.66%의 정확도를 기록해, 가상인간 분야의 세계 표준을 정립한 저명 기관인 '독일 막스플랑크 지능시스템 연구소'에서 개발한 텍스트 기반 AI 모델의 정확도(77.48%)를 상회하는 성능을 선보였다.
유튜브 직캠 영상, 2D 애니메이션, AI 생성 영상 등 비주얼 도메인이 완전히 다른 영상을 입력해도, 다른 요소는 배제하고 오직 동작의 본질만을 판독해 유사도 0.899 이상의 정밀한 검색 결과를 도출한다.
데이터베이스에 일치하는 모션이 없는 새로운 동작을 넣어도 평균 0.927의 높은 유사도로 가장 가까운 대체 동작을 찾아준다. 미세한 변형만 거쳐 즉시 프로젝트에 활용할 수 있는 정도의 유사 3D 모션이 탐색되므로 제작 효율을 극대화할 수 있다.
복잡한 단일 AI 모델을 통째로 학습시켜 구축하는 대신, 이미 검증된 고성능 모듈들을 유기적으로 결합한 '모듈형 파이프라인(Modular Pipeline)' 구조를 채택한 것도 특징이다.
타깃 인물 분리, 동작 3D 복원, 모션 검색 등으로 각 모듈이 분리돼 있으며, 특정 모듈만 독립적으로 교체가 가능하다. 수시로 업데이트 되는 신규 오픈소스 모델 등을 별도 시스템 개발 없이 바로 적용할 수 있고, 최신 모델로 업그레이드를 하더라도 데이터 재학습 비용이 들지 않는 '트레이닝 프리(Training-Free)' AI 모델이다.
이번 기술 개발로 영화, 게임, 가상현실(VR) 등 디지털 콘텐츠 제작 시 구축된 방대한 양의 3D 모션 데이터들을 즉시 찾아 반복 활용할 수 있게 돼 기존 데이터베이스 자산의 가치를 극대화할 수 있게 됐다.
물리적 정확성이 확보된 모션 데이터를 바로 활용할 수 있어, 신규 모션 캡처 또는 오류 발생 빈도가 높은 AI 생성 모션을 후작업을 거쳐 활용하는 것 대비 높은 작업 효율성이 확보된다.
이번 논문을 발표한 덱스터 R&D연구소 임재호 부소장은 "최신 오픈소스를 활용해 수시 업데이트가 가능한 모듈형 파이프라인을 구축하면서도, 독보적인 작업 성능을 동시에 확보한 기술 사례"라며 "선도적인 AI 기술 개발이 제작 파이프라인의 효율성을 높이는 것은 물론, 덱스터가 보유한 양질의 데이터베이스의 활용도 또한 제고하고 있다"고 말했다.