다국어 음성생성(TTS) ai , Fish Speech 의 등장

2024. 11. 11. 17:56IT 및 테크

728x90
반응형

다국어 음성생성(TTS) ai , Fish Speech 의 등장

 

최근에 다양한 언어를 지원하는 Fish Speech라는 혁신적인 TTS(Text-to-Speech) 모델이 등장했습니다.

 

Fish Speech Fish Audio에서 개발한 오픈 소스 다국어 TTS 모델로, 한국어를 포함한 총 8개 언어를 지원합니다. 

 

 70만 시간의 음성 데이터를 활용해 훈련된 이 모델은, 특히 한국어 사용자들에게도 자연스럽고 정확한 음성 출력을 제공하며, 오픈소스로 공개되었기 때문에 무료로 사용가능합니다.

 

 

출처 : 깃허브 - https://github.com/fishaudio/fish-speech



 

 

Fish Speech의 주요 특징

 

고품질 음성 출력: 심층 신경망 기반으로 정확하고 자연스러운 음성 생성

 

빠른 음성 생성 속도: 5~10 초 정도의 음성 샘플로 실시간 음성 합성 및 클로닝(음성복제) 가능

 

지원 언어: 한국어, 영어, 중국어, 독일어, 일본어, 프랑스어, 스페인어, 아랍어

 

오픈 소스 라이선스: 단, 현재 상업적 이용은 제한

 

 

 

 

 

 

 

샘플음성을 바탕으로 생성한 AI 음성 예시영상

출처 : X - https://x.com/cocktailpeanut/status/1853512204118540625



 

한국어를 지원한다는 점과 함께 오픈소스로 공개되어서 제한없이 무료로 사용할 수는 있긴 하지만

 

현재 상업적 사용이 불가능해서 개인적인 테스트 용으로 밖에 쓰지 못한다는 점은 많이 아쉬운 부분입니다.

 

또한 이런 음성 복제 ai 기술이 발달해 감에 따라서 보이스 피싱 종류의 사기는 더더욱 신경쓰셔야 하겠습니다.

 

 

깃허브 홈페이지 : https://github.com/fishaudio/fish-speech

 

728x90
반응형