Della Larsen records her voice to create memories for her family
Keeping family connections alive across generations
영국 런던 - 음성 AI 소프트웨어 분야의 세계적인 리더인 ElevenLabs는 오늘 '정서적으로 풍부한' AI 오디오를 정확하게 생성할 수 있는 30개 언어로 된 새로운 다국어 음성 생성 모델을 출시했다.
전적으로 자체 조사를 기반으로 하는 이 도약을 통해 크리에이터는 유럽, 아시아 및 중동 전역의 국제 시장을 겨냥하여 현지화된 오디오 콘텐츠를 제작할 수 있다. ElevenLabs는 지난 18개월 동안 인간의 말 지표를 분석하고, 말의 생성에서 문맥을 이해하고 감정을 전달하기 위한 새로운 메커니즘을 구축하고, 새롭고 독특한 목소리를 합성했다.
Eleven Multilingual v2를 사용하면 텍스트가 ElevenLabs 텍스트 음성 변환 플랫폼에 입력될 때 새로운 모델은 거의 30개의 문자 언어를 자동으로 식별하고 전례 없는 수준의 진정성으로 그 언어에서 음성을 생성할 수 있다.
동시에 합성 음성 또는 복제된 음성 중 어느 것을 사용하든 화자의 고유한 음성 특성은 원래 억양을 포함하여 모든 언어에 걸쳐 유지된다. 즉, 동일한 음성을 사용하여 30개 언어로 콘텐츠에 생명을 불어넣을 수 있다.
이 배포는 플랫폼의 모든 크리에이터에게 Professional Voice Cloning 공개에 이어 진행된다. 추가적인 안전 및 보안 기능과 함께 출시된 이 제품 업데이트를 통해 사용자는 원본과 거의 구별할 수 없는 완벽한 자신의 음성 디지털
복사본을 만들 수 있다. 오늘 릴리스는 거의 30개 언어로 다국어 모델이 제공하는 목소리를 낼 수 있음을 의미한다.
지원되는 언어에는 한국어, 네덜란드어, 터키어, 스웨덴어, 인도네시아어, 베트남어, 필리핀어, 우크라이나어, 그리스어, 체코어, 마무리, 루마니아어, 덴마크어, 불가리아어, 말레이어, 헝가리어, 노르웨이어, 슬로바키아어, 크로아티아어, 클래식 아랍어 및 타밀어가 포함된다. 영어, 폴란드어, 독일어, 스페인어, 프랑스어, 이탈리아어, 힌디어 및 포르투갈어를 포함하여 이전에 사용 가능한 언어에 합류했다.
최근 기능 출시와 플랫폼의 지속적인 개선에 이어, ElevenLabs는 오늘 플랫폼이 공식적으로 베타 버전으로 출시됨을 확인했다. 이러한 전환은 100만 명 이상의 글로벌 사용자에게 신뢰할 수 있는 최첨단 도구를 제공하기 위한 회사의 헌신에 있어 중추적인 순간을 기념한다.
앞으로 ElevenLabs는 사용자가 플랫폼에서 목소리를 공유하고 새로운 오디오 개발의 이점을 누릴 수 있는 메커니즘을 도입하여 인간-AI 협업을 위한 기회를 육성할 계획이다.
ElevenLabs의 CEO 겸 공동 설립자 인 Mati Staniszewski는 다음과 같이 말한다.
“ElevenLabs는 모든 언어와 음성으로 모든 콘텐츠에 누구나 액세스할 수 있도록 하는 꿈으로 시작되었습니다. Eleven Multilingual v2 출시를 통해 우리는 이 꿈을 현실화하고 모든 방언에서 인간 품질의 AI 음성을 사용할 수 있도록 하는 데 한 걸음 더 다가갔습니다.
“TTS(Text-to-Speech) 생성 도구는 게임의 장을 평준화하고 모든 크리에이터에게 최고 품질의 음성 오디오 기능을 제공하는 데 도움이 됩니다. 이러한 이점은 이제 거의 30개 언어로 된 다국어 응용 프로그램으로 확장됩니다. 우리는 AI의 도움으로 더 많은 언어와 목소리를 다루고 콘텐츠에 대한 언어적 장벽을 제거하기를 바랍니다. ElevenLabs는 이러한 접근성의 도약이 궁극적으로 더 큰 창의성, 혁신 및 다양성을 촉진할 것이라고 믿습니다.”
여러 언어로 고품질 오디오 콘텐츠를 만드는 데 필요한 비용과 자원을 줄임으로써 ElevenLabs는 기업과 크리에이터가 문화와 언어에 걸쳐 공감할 수 있는 더 많은 상상력과 접근성을 갖춘 콘텐츠를 제작할 수 있도록 지원한다.
독립 게임 개발자와 퍼블리셔에게 다국어 음성 생성 도구는 국제 관객을 위해 게임 경험과 오디오 콘텐츠를 번역할 수 있는 새로운 기회를 제공하며, 음성 오디오의 품질이나 정확성을 손상시키지 않고 자신의 언어로 플레이어 및 청취자와 연결한다.
마찬가지로, 교육 기관은 이제 학습자에게 목표 언어로 정확한 오디오 콘텐츠를 즉시 제공하고, 언어 이해와 발음 기술을 강화하며, 유학생을 위한 다양한 교육 스타일과 학습 요구를 충족시킬 수 있는 수단을 갖추게 되었다.
모든 유형의 크리에이터는 ElevenLabs의 도구를 사용하여 여러 언어로 제공되는 음성으로 시각적 콘텐츠를 보완하여 시각 장애가 있거나 추가 학습이 필요한 사람들의 콘텐츠 접근성을 향상시킬 수 있다.
2023년 1월에 공개된 초기 AI 음성 도구 제품군에는 미리 설계된 합성 음성 선택을 통해 모든 텍스트를 음성으로 변환하는 기능과 자신의 목소리의 복제본을 만드는 기능이 포함되었다. 다국어 음성 합성 도구는 모든 언어와 음성으로 모든 콘텐츠에 누구나 액세스할 수 있도록 하는 ElevenLabs의 사명에 대한 또 다른 진보이다.
이 기술은 이미 인디 작가가 오디오 북을 만들 수 있게 하고, 비디오 게임에서 보조 캐릭터를 음성으로 표시하고, 시각 장애인이 온라인 서면 콘텐츠에 액세스할 수 있도록 지원하고, 세계 최초의 AI 라디오 채널에 전원을 공급하는 것을 포함하여 여러 창의적인 분야 및 부문에 걸쳐 채택되었다. ElevenLabs는 또한 AI 비디오 생성기 D-ID, 세계 최대 오디오북 출판사 중 하나인 Storytel, arXiv에 게시된 과학 연구 논문을 응축하는 오픈 액세스 과학 비디오 플랫폼 ScienceCast , , 선도적인 글로벌 콘텐츠 제작자 플랫폼 TheSoul Publishing, Embark Studios 및 Paradox Interactive, 와 같은 놀라운 게임 개발자, 미디어 플랫폼 MNTN을 포함한 다양한 선도적 콘텐츠 제작자 및 스튜디오와 파트너십을 맺었다.
Keeping family connections alive across generations
Proving the power of speaking to viewers in their own language