
3Shape와 ElevenLabs, 대화형 AI 협업 발표
- 카테고리
- 리소스
- 날짜
영국 런던 – ElevenLabs, 세계적인 AI 음성 소프트웨어 선도 기업 ElevenLabs가 오늘 새로운 다국어 음성 생성 모델을 출시했습니다. 이 모델은 30개 언어로 '감정이 풍부한' AI 오디오를 생성할 수 있습니다.
이번 개발은 전적으로 자체 연구를 기반으로 하며, 개발자들이 유럽, 아시아, 중동 등 국제 시장을 위한 현지화된 오디오 콘텐츠를 제작할 수 있도록 지원합니다. ElevenLabs는 지난 18개월 동안 인간 언어의 특징을 분석하고, 맥락 이해와 감정 표현을 위한 새로운 메커니즘을 개발했으며, 독창적인 새로운 목소리도 합성해냈습니다.
Eleven Multilingual v2를 통해 새로운 모델은 ElevenLabs의 텍스트 음성 변환 플랫폼에 텍스트를 입력하면 거의 30개 언어를 자동으로 인식하고, 지금까지 경험하지 못한 수준의 자연스러운 음성을 생성할 수 있습니다.
합성 음성이든 복제된 음성이든, 화자의 고유한 목소리 특징과 원래의 억양까지 모든 언어에서 그대로 유지됩니다. 즉, 하나의 목소리로 30개 언어의 콘텐츠를 모두 생생하게 전달할 수 있습니다.
이번 출시는 플랫폼 내 모든 크리에이터를 위한 프로페셔널 음성 복제 기능 공개에 이은 것입니다. 추가된 보안 기능과 함께 제공되는 이번 업데이트로 사용자는 자신의 목소리를 완벽하게 복제한 디지털 버전을 만들 수 있으며, 이는
원본과 거의 구분이 불가능합니다. 오늘 출시된 모델을 통해 사용자의 목소리가 다국어 모델에서 지원하는 거의 30개 언어로 말할 수 있게 되었습니다.
지원 언어는 다음과 같습니다: 한국어, 네덜란드어, 터키어, 스웨덴어, 인도네시아어, 베트남어, 필리핀어, 우크라이나어, 그리스어, 체코어, 핀란드어, 루마니아어, 덴마크어, 불가리아어, 말레이어, 헝가리어, 노르웨이어, 슬로바키아어, 크로아티아어, 아랍어(표준), 타밀어가 포함됩니다. 이 언어들은 기존에 지원되던 영어, 폴란드어, 독일어, 스페인어, 프랑스어, 이탈리아어, 힌디어, 포르투갈어와 함께 제공됩니다.
새로운 기능 출시와 플랫폼의 지속적인 개선에 따라 ElevenLabs는 오늘 공식적으로 베타 단계를 종료했다고 밝혔습니다. 이번 전환은 전 세계 100만 명이 넘는 사용자에게 신뢰할 수 있고 혁신적인 도구를 제공하겠다는 ElevenLabs의 의지를 보여주는 중요한 순간입니다.
앞으로 ElevenLabs는 사용자가 자신의 목소리를 플랫폼에서 공유하고, 새로운 오디오 데이터 개발에 참여해 보상을 받을 수 있는 시스템을 도입할 계획입니다. 이를 통해 사람과 AI의 협업을 더욱 촉진할 예정입니다.
ElevenLabs의 CEO이자 공동 창업자인 Mati Staniszewski는 다음과 같이 말했습니다:
“ElevenLabs는 모든 콘텐츠를 어떤 언어, 어떤 목소리로든 모두가 쉽게 접근할 수 있도록 하겠다는 꿈으로 시작했습니다. Eleven Multilingual v2 출시로 이 꿈에 한 걸음 더 다가섰으며, 이제 모든 방언에서 인간 수준의 AI 음성을 제공할 수 있게 되었습니다.
우리의 음성 합성 도구는 모든 크리에이터에게 고품질 음성 합성 옵션을 제공하며, 이제 거의 30개 언어의 다국어 활용까지 확장되었습니다. 앞으로도 AI의 힘으로 더 많은 언어와 목소리를 지원해 콘텐츠의 언어 장벽을 완전히 없애고자 합니다. ElevenLabs는 이러한 접근성의 도약이 궁극적으로 더 많은 창의성, 혁신, 다양성으로 이어질 것이라 믿습니다.”
ElevenLabs는 여러 언어로 고품질 오디오 콘텐츠를 제작하는 데 필요한 비용과 리소스를 크게 줄여줍니다. 기업과 크리에이터는 문화와 언어의 경계를 넘어 더 창의적이고 쉽게 접근할 수 있는 콘텐츠를 제작할 수 있습니다.
독립 게임 개발자와 퍼블리셔에게 다국어 음성 생성 도구는 국제 유저를 위한 게임 경험과 오디오 콘텐츠를 번역하고, 플레이어와 청취자에게 각자의 언어로 소통할 수 있는 새로운 기회를 제공합니다. 음성 품질이나 정확성을 희생하지 않아도 됩니다.
이와 마찬가지로 교육 기관 도 이제 학습자에게 목표 언어로 정확한 오디오 콘텐츠를 즉시 제공해 언어 이해력과 발음 향상, 다양한 수업 방식과 국제 학생들의 학습 요구에 맞출 수 있습니다.
모든 크리에이터는 ElevenLabs의 도구를 활용해 접근성 이 필요한 시각장애인이나 추가 학습 지원이 필요한 사람들에게 여러 언어로 음성 콘텐츠를 제공함으로써, 시각 자료를 더욱 풍부하게 만들 수 있습니다.
2023년 1월에 처음 공개된 AI 음성 도구 모음은, 미리 준비된 합성 음성이나 자신의 목소리를 복제해 모든 텍스트를 음성으로 변환할 수 있게 해줍니다. 이번 다국어 음성 합성 도구는 ElevenLabs가 모든 콘텐츠를 어떤 언어, 어떤 목소리로든 모두가 쉽게 접근할 수 있도록 하겠다는 미션의 또 다른 진전입니다.
이 기술은 이미 다양한 창작 업계와 분야에서 활용되고 있습니다. 독립 작가는 오디오북을 제작하고, 게임의 보조 캐릭터에 목소리를 입히며, 시각장애인이 온라인 텍스트 콘텐츠를 쉽게 접할 수 있도록 돕고, 세계 최초의 AI 라디오 방송국 운영에도 쓰이고 있습니다. ElevenLabs는 AI 비디오 생성기 D-ID, Storytel, 세계 최대 오디오북 퍼블리셔 중 하나, 오픈 액세스 비디오 플랫폼 ScienceCast, 과학 논문을 집계해 영상으로 만들어주는 도구, arXiv에 공개된 논문 기반, 글로벌 콘텐츠 제작 플랫폼 TheSoul Publishing, 그리고 혁신적인 게임 개발사 Embark Studios 및 Paradox Interactive 그리고 미디어 플랫폼 MNTN 등 다양한 선도 기업과도 협력하고 있습니다.

.webp&w=3840&q=80)


