본문 바로가기

베타 종료, 30개 언어 지원하는 기초 AI 음성 모델 Eleven Multilingual v2 출시

  • 음성 AI 플랫폼 ElevenLabs 는 30개 언어에 걸친 다국어 기능을 지원하는 새로운 기본 딥 러닝 모델인 Eleven Multilingual v2를 출시하여 콘텐츠의 언어적 장벽을 제거하기 위한 노력에 있어 급진적인 도약을 시도한다.
  • 이 도약을 통해 전 세계 미디어 회사, 게임 개발자, 퍼블리셔 및 독립 크리에이터는 콘텐츠의 접근성을 크게 향상시킬 수 있다.
  • 지난 1월 플랫폼이 출시된 이후 많은 새로운 기능 릴리스와 개선 사항을 통해 이러한 새로운 기능은 회사의 공식적인 베타 단계 종료를 나타낸다
  • ElevenLabs의 사명은 모든 언어와 목소리로 모든 콘텐츠에 누구나 접근할 수 있도록 하는 것

영국 런던 - 음성 AI 소프트웨어 분야의 글로벌 리더인 ElevenLabs는 오늘 가 '감정이 풍부한' AI 오디오를 30개 언어로 정확하게 생성할 수 있는 새로운 다국어 음성 생성 모델을 출시했습니다.

전적으로 자체 연구를 기반으로 한 이번 도약으로 크리에이터들은 유럽, 아시아, 중동 등 국제 시장을 겨냥해 현지화된 오디오 콘텐츠를 제작할 수 있습니다. ElevenLabs는 지난 18개월 동안 인간의 말 특성을 분석하고, 음성 생성에서 문맥을 이해하고 감정을 전달하는 새로운 메커니즘을 구축했으며, 새롭고 독특한 목소리도 합성했습니다.

Eleven Multilingual v2를 사용하면 텍스트가 ElevenLabs 텍스트 음성 변환 플랫폼에 입력될 때새로운 모델은 거의 30개의 문자 언어를 자동으로 식별하고 전례 없는 수준의 진정성으로 그 언어에서 음성을 생성할 수 있다.

동시에 합성 음성 또는 복제된 음성 중 어느 것을 사용하든 화자의 고유한 음성 특성은 원래 억양을 포함하여 모든 언어에 걸쳐 유지된다. 즉, 동일한 음성을 사용하여 30개 언어로 콘텐츠에 생명을 불어넣을 수 있다.

배포는 플랫폼의 모든 크리에이터에게 프로페셔널 음성 복제 공개에 이어 제공됩니다. 추가적인 안전 및 보안 기능과 함께 출시된 이번 제품 업데이트로 사용자는 원본과 거의 구별할 수 없는 완벽한 자신의 음성 디지털

복사본을 만들 수 있다. 오늘 릴리스는 거의 30개 언어로 다국어 모델이 제공하는 목소리를 낼 수 있음을 의미한다.

지원되는 언어에는 한국어, 네덜란드어, 터키어, 스웨덴어, 인도네시아어, 베트남어, 필리핀어, 우크라이나어, 그리스어, 체코어, 마무리, 루마니아어, 덴마크어, 불가리아어, 말레이어, 헝가리어, 노르웨이어, 슬로바키아어, 크로아티아어, 클래식 아랍어 및 타밀어가 포함된다. 영어, 폴란드어, 독일어, 스페인어, 프랑스어, 이탈리아어, 힌디어 및 포르투갈어를 포함하여 이전에 사용 가능한 언어에 합류했다.

최근 기능 출시와 플랫폼의 지속적인 개선에 이어, ElevenLabs는 오늘 공식적으로 플랫폼이 베타를 종료했음을 발표했습니다. 이번 전환은 100만 명이 넘는 글로벌 사용자에게 신뢰할 수 있는 최첨단 도구를 제공하겠다는 ElevenLabs의 약속을 보여주는 중요한 순간입니다.

앞으로 ElevenLabs는 사용자가 플랫폼에서 목소리를 공유하고 새로운 오디오 개발의 이점을 누릴 수 있도록 하는 메커니즘을 도입해, 인간과 AI의 협업 기회를 확대할 계획입니다.

ElevenLabs의 CEO이자 공동 설립자인 Mati Staniszewski는 다음과 같이 말했습니다.

“ElevenLabs 모든 언어와 음성으로 모든 콘텐츠에 누구나 액세스할 있도록 하는 꿈으로 시작되었습니다. Eleven Multilingual v2 출시를 통해 우리는 꿈을 현실화하고 모든 방언에서 인간 품질의 AI 음성을 사용할 있도록 하는 걸음 다가갔습니다.

“TTS(텍스트 음성 변환) 생성 도구는 게임의 장을 평준화하고 모든 크리에이터에게 최고 품질의 음성 오디오 기능을 제공하는 도움이 됩니다. 이러한 이점은 이제 거의 30 언어로 다국어 응용 프로그램으로 확장됩니다. 우리는 AI 도움으로 많은 언어와 목소리를 다루고 콘텐츠에 대한 언어적 장벽을 제거하기를 바랍니다. ElevenLabs 이러한 접근성의 도약이 궁극적으로 창의성, 혁신 다양성을 촉진할 것이라고 믿습니다.”

여러 언어로 고품질 오디오 콘텐츠를 만드는 데 필요한 비용과 자원을 줄임으로써 ElevenLabs는 기업과 크리에이터가 문화와 언어를 넘어 공감할 수 있는 더 창의적이고 접근성 높은 콘텐츠를 제작할 수 있도록 지원합니다.

독립 게임 개발자와 퍼블리셔에게 다국어 음성 생성 도구는 국제 관객을 위해 게임 경험과 오디오 콘텐츠를 번역할 수 있는 새로운 기회를 제공하며, 음성 오디오의 품질이나 정확성을 손상시키지 않고 자신의 언어로 플레이어 및 청취자와 연결한다.

마찬가지로, 교육 기관은 이제 학습자에게 목표 언어로 정확한 오디오 콘텐츠를 즉시 제공하고, 언어 이해와 발음 기술을 강화하며, 유학생을 위한 다양한 교육 스타일과 학습 요구를 충족시킬 수 있는 수단을 갖추게 되었다.

모든 유형의 크리에이터는 ElevenLabs의 도구를 활용해 여러 언어로 제공되는 음성으로 시각적 콘텐츠를 보완하고, 시각 장애가 있거나 추가 학습이 필요한 사람들도 콘텐츠를 접근성을 향상시킬 수 있다.

2023년 1월에 공개된 초기 AI 음성 도구 제품군에는 미리 설계된 합성 음성 선택을 통해 모든 텍스트를 음성으로 변환하는 기능과 자신의 목소리를 복제하는 기능이 포함되어 있었습니다. 다국어 음성 합성 도구는 모든 언어와 목소리로 모든 콘텐츠에 누구나 접근할 수 있도록 하겠다는 ElevenLabs의 사명을 한 단계 더 발전시킨 것입니다.

이 기술은 이미 인디 작가가 오디오북을 제작하고, 비디오 게임에서 보조 캐릭터에 음성을 입히고, 시각 장애인이 온라인 서면 콘텐츠를 이용할 수 있도록 지원하며, 세계 최초의 AI 라디오 채널에 동력을 제공하는 등 다양한 창의적 분야와 산업에서 활용되고 있습니다. ElevenLabs는 또한 AI 비디오 생성기 D-ID, 세계 최대 오디오북 출판사 중 하나인 Storytel, arXiv에 게재된 과학 논문을 요약하는 오픈 액세스 과학 비디오 플랫폼 ScienceCast, , 선도적인 글로벌 콘텐츠 제작자 플랫폼 TheSoul Publishing, Embark Studios Paradox Interactive, 와 같은 놀라운 게임 개발자, 미디어 플랫폼 MNTN을 포함한 다양한 선도적 콘텐츠 제작자 및 스튜디오와 파트너십을 맺었다.

ElevenLabs 팀의 다른 글 보기

최고 품질의 AI 오디오로 창작하세요