2024. 10. 21. 18:35ㆍIT 및 테크
TANGO AI로 만나는 새로운 차원의 제스처 동영상
TANGO AI: 음성과 동작을 하나로 연결하는 차세대 기술
오늘날 인공지능(AI)은 영화, 게임, 그리고 가상현실(VR)과 같은 다양한 콘텐츠에서 핵심적인 역할을 하고 있습니다.
그중에서도 이번에 공개된 TANGO AI는 음성과 제스처를 실시간으로 동기화하여 현실감 있는 비디오를 생성하는 혁신적인 기술로 주목받고 있습니다.
TANGO AI는 도쿄대학교와 사이버에이전트 AI 연구소에서 공동 개발한 프로젝트로, 계층적 오디오-모션 임베딩 및 확산 보간(Diffusion Interpolation) 기술을 사용해 음성에 맞춘 자연스러운 제스처 동영상을 생성합니다.

TANGO ( 출처 : 깃허브 - https://pantomatrix.github.io/TANGO/ )
TANGO AI의 주요 기능
🔽 음성에 따른 제스처 생성 : TANGO AI는 음성과 정확하게 일치하는 제스처를 생성하여, 가상 아바타나 애니메이션 캐릭터에 더 큰 현실감을 부여합니다.
🔽 계층적 임베딩 기술 : 오디오와 모션 데이터를 계층적으로 임베딩하여, 복잡한 음성-제스처 관계를 포착합니다. 이를 통해 더 정확하고 자연스러운 동작을 만들어냅니다.
🔽 확산 보간(Diffusion Interpolation) : 제스처 간 전환을 부드럽게 처리하여 시각적 결함을 최소화하고, 유동적이고 자연스러운 동작을 제공합니다.
TANGO 소개 영상 ( 출처 : 유튜브 )
TANGO AI의 실용적인 활용처
🔽 애니메이션 : TANGO AI는 영화와 게임 캐릭터의 대화 장면에서 음성과 제스처를 동기화하여 더 사실적인 캐릭터 애니메이션을 제공합니다.
🔽 가상현실(VR) : VR 환경에서 사용자와 아바타 간 상호작용을 개선해 현실감을 극대화합니다.
🔽 교육 콘텐츠 : 교육 비디오에 자연스러운 제스처를 추가해 시청자에게 더 몰입감 있는 학습 경험을 제공합니다.
이외에도 TANGO AI는 향후 댄스나 스포츠와 같은 분야로도 확장될 예정입니다.
TANGO AI 직접 체험해보기
TANGO AI는 Hugging Face와 같은 플랫폼을 통해 제공되며, 현재 사용자들은 직접 AI의 제스처 생성 기능을 체험할 수 있습니다.
TANGO AI의 연구 논문도 arXiv에서 공개되어 있어, 이 프로젝트의 기술적 성과와 방법론이 궁금하다면 직접 확인할 수 있습니다.
TANGO AI의 기술적인 세부 사항과 더 많은 정보를 원하신다면, TANGO AI 공식 웹사이트를 확인해 보세요!
TANGO AI 공식 웹사이트 : https://pantomatrix.github.io/TANGO/
TANGO 허깅페이스 : https://huggingface.co/spaces/H-Liu1997/TANGO
'IT 및 테크' 카테고리의 다른 글
AI 아바타 시대의 시작! HeyGen Instant Avatar로 나만의 디지털 트윈 만들기 (3) | 2024.10.26 |
---|---|
Hailuo AI: 정적인 이미지를 생동감 넘치는 영상으로 바꾸는 AI 기술의 진화 (4) | 2024.10.23 |
F5-TTS: 차세대 음성 합성 모델의 등장, 제로샷 음성 복제와 감정 합성의 혁신 (3) | 2024.10.19 |
Kling AI, 립싱크 기능으로 AI 영상 콘텐츠 제작의 새 시대를 열다. (5) | 2024.10.19 |
동영상 생성 AI: Pyramid Flow, 오픈 소스로 공개, 누구나 활용 가능한 새로운 가능성 (4) | 2024.10.18 |