엔비디아, AI 아바타 혁신 선언…‘오디오투페이스’ 전격 오픈소스 공개
- 음성을 기반으로 사실적인 얼굴 애니메이션 구현, 게임·미디어 업계 파급력 기대
- RTX 키트·플러그인·훈련 프레임워크까지 전면 개방, 개발자 맞춤형 활용 가능
- 글로벌 게임사·소프트웨어 업체 도입 확대, 차세대 그래픽 파이프라인 혁신 가속
엔비디아가 인공지능(AI) 기반 얼굴 애니메이션 기술 ‘오디오투페이스(Audio2Face)’를 오픈소스로 공개하며 아바타 시장 혁신에 나섰다. 오디오투페이스는 음성의 음소, 억양, 감정 등을 분석해 이를 캐릭터 얼굴 움직임으로 변환하는 기술로, 정밀한 립싱크와 사실적인 감정 표현을 가능하게 한다. 이를 통해 사전 제작 애니메이션은 물론 실시간 게임 속 캐릭터의 몰입감까지 크게 높일 수 있다는 평가다.
엔비디아는 이번에 △오디오투페이스 SDK △언리얼엔진5·오토데스크 마야용 플러그인 △훈련 프레임워크를 포함한 개발자 지원 패키지를 전면 개방했다. 또한 립싱크 회귀 모델(v2.2), 확산 모델(v3.0), 오디오 감정 추론 모델(오디오투이모션) 등도 함께 제공해 다양한 맞춤형 활용을 지원한다. 개발자들은 오픈소스를 바탕으로 자체 데이터와 결합해 모델을 세밀하게 조정할 수 있다.

이미 다수의 글로벌 게임사와 소프트웨어 업체가 이 기술을 적용 중이다. 코드마스터즈, 넷이즈, 리얼루전, 스트림랩스 등은 오디오투페이스를 자사 파이프라인에 도입해 개발 효율성과 캐릭터 사실감을 크게 개선했다. 특히 게임 ‘체르노빌라이트2’ 제작진은 해당 기술을 활용해 수많은 작업 시간을 절약하면서도 몰입감 있는 캐릭터 연기를 구현했다고 밝혔다.
엔비디아는 동시에 RTX 키트 최신 업데이트도 내놓았다. 뉴럴 텍스처 압축 SDK는 메모리 사용량을 줄이면서도 고품질 텍스처 구현을 지원하고, 글로벌 일루미네이션 SDK는 레이 트레이싱 기반 간접 조명을 개선해 그래픽 성능과 효율을 높인다. 또한 vGPU 기술을 통한 게임 개발 환경 확장도 적극 추진하고 있다. 액티비전은 vGPU 도입을 통해 100대 서버를 6대로 줄여 서버 공간 82%, 전력 사용량 72% 절감 효과를 얻었다.
업계는 엔비디아의 이번 조치가 단순히 게임을 넘어 미디어, 엔터테인먼트, 고객 서비스 등 다양한 분야에서 차세대 인터랙티브 콘텐츠 제작을 가속화할 것으로 전망하고 있다. 특히 AI 아바타 기술이 메타버스, 가상 아이돌, 고객 상담 서비스 등으로 확장되면서 새로운 디지털 경험을 창출할 핵심 인프라로 자리매김할 가능성이 크다.
더 좋은 미래를 위한 콘텐츠 플랫폼 – <굿퓨처데일리>

