본문 바로가기

ElevenLabs, 베타 종료 및 Eleven Multilingual v2 출시 - 약 30개 언어를 지원하는 혁신적인 AI 음성 모델

이번 발전으로 전 세계 미디어 기업, 게임 개발자, 퍼블리셔, 그리고 독립 창작자들이 콘텐츠 접근성을 획기적으로 높일 수 있게 됩니다.

II Multilingual V2 with instructions to transform your voice into another character and control its emotion and delivery.
  • 음성 AI 플랫폼 ElevenLabs이 새로운 기반 딥러닝 모델 출시로 콘텐츠의 언어 장벽을 없애기 위한 혁신적인 도약을 이뤘습니다. 이 모델은 28개 언어 - Eleven 다국어 v2
  • 이번 발전으로 전 세계 미디어 기업, 게임 개발자, 퍼블리셔, 그리고 독립 창작자들이 콘텐츠 접근성을 획기적으로 높일 수 있습니다
  • 이러한 새로운 기능들은 1월 플랫폼 출시 이후 다양한 기능 추가와 개선에 이어 나온 것으로, 이번에 공식적으로 베타 단계가 종료되었음을 의미합니다
  • ElevenLabs의 미션은 모든 콘텐츠를 어떤 언어, 어떤 목소리로도 모두가 접근할 수 있게 만드는 것입니다

ElevenLabs, 음성 AI 소프트웨어 분야의 세계 선두주자인 ElevenLabs가 오늘 새로운 다국어 음성 생성 모델을 출시했습니다 약 30개 언어에서 ‘감정이 풍부한’ AI 오디오를 정확하게 생성할 수 있습니다.

이번 발전은 전적으로 자체 연구를 기반으로 하며, 창작자들이 유럽, 아시아, 중동 등 국제 시장을 위한 현지화 오디오 콘텐츠를 제작할 수 있도록 지원합니다. ElevenLabs는 지난 18개월 동안 인간 음성의 특징을 분석하고, 맥락을 이해하고 감정을 전달하는 새로운 메커니즘을 구축했으며, 새로운 독창적인 목소리를 합성해왔습니다.

Eleven Multilingual v2를 통해 ElevenLabs 텍스트 음성 변환 플랫폼에 텍스트를 입력하면, 새로운 모델이 약 30개 언어를 자동으로 인식하고, 그 언어로 매우 자연스러운 음성을 생성할 수 있습니다.

동시에, 합성 음성이든 복제 음성이든 상관없이 화자의 고유한 목소리 특징과 원래의 억양까지 모든 언어에서 그대로 유지됩니다. 즉, 동일한 목소리로 28개 언어의 콘텐츠를 생생하게 전달할 수 있습니다.

이번 롤아웃은 프로페셔널 음성 복제 기능이 모든 창작자에게 공개된 데 이어 진행되었습니다. 이 제품 업데이트는 추가된 안전 및 보안 기능과 함께 제공되며, 사용자가 자신의 목소리를 원본과 거의 구분할 수 없을 정도로 완벽하게 디지털 복제할 수 있게 해줍니다. 오늘 출시된 모델을 통해 이제 여러분의 목소리가 다국어 모델이 지원하는 거의 30개 언어로 말할 수 있게 됩니다.

지원 언어는 다음과 같습니다; 중국어, 한국어, 네덜란드어, 터키어, 스웨덴어, 인도네시아어, 필리핀어, 일본어, 우크라이나어, 그리스어, 체코어, 핀란드어, 루마니아어, 덴마크어, 불가리아어, 말레이어, 슬로바키아어, 크로아티아어, 고전 아랍어타밀어.

이 언어들은 기존에 지원되던 언어들과 함께 제공됩니다 예를 들어 영어, 폴란드어, 독일어, 스페인어, 프랑스어, 이탈리아어, 힌디어 그리고 포르투갈어.

최근 기능 출시와 지속적인 플랫폼 개선에 따라, ElevenLabs는 오늘 공식적으로 베타 단계를 종료한다고 발표했습니다. 이번 전환은 100만 명 이상의 글로벌 사용자를 위한 신뢰할 수 있고 혁신적인 도구 제공에 대한 회사의 의지를 보여주는 중요한 순간입니다.

앞으로 ElevenLabs는 사용자가 플랫폼에서 목소리를 공유하고 새로운 오디오 개발에 참여할 수 있는 기능을 도입할 예정이며, 이를 통해 인간과 AI의 협업 기회를 확대할 계획입니다.

ElevenLabs의 CEO이자 공동 창립자인 Mati Staniszewski는 다음과 같이 말합니다:

ElevenLabs는 모든 콘텐츠를 어떤 언어, 어떤 목소리로도 모두가 접근할 수 있게 하겠다는 꿈으로 시작했습니다. Eleven Multilingual v2 출시로 이 꿈에 한 걸음 더 다가섰으며, 사람 수준의 AI 음성을 모든 방언에서 사용할 수 있게 되었습니다.

“저희 텍스트 음성 변환 생성 도구는 모든 창작자에게 최고의 음성 오디오 기능을 제공하여 기회의 장을 넓혀줍니다. 이제 그 혜택이 거의 30개 언어의 다국어 활용까지 확장되었습니다. 앞으로도 AI의 도움으로 더 많은 언어와 목소리를 지원하여 콘텐츠의 언어 장벽을 완전히 없애고자 합니다. ElevenLabs는 이러한 접근성의 도약이 궁극적으로 더 큰 창의성과 혁신, 다양성을 이끌 것이라 믿습니다.

여러 언어로 고품질 오디오 콘텐츠를 제작하는 데 필요한 비용과 자원을 줄임으로써, ElevenLabs는 기업과 창작자들이 문화와 언어를 넘어 공감할 수 있는 더 창의적이고 접근성 높은 콘텐츠를 만들 수 있도록 지원합니다.

독립 게임 개발자 및 퍼블리셔에게는, 다국어 음성 생성 도구가 게임 경험과 오디오 콘텐츠를 국제 청중에게 번역할 수 있는 새로운 기회를 제공하며, 플레이어와 청취자에게 각자의 언어로 고품질 음성을 전달할 수 있습니다.

마찬가지로, 교육 기관도 이제 학습자에게 목표 언어의 정확한 오디오 콘텐츠를 즉시 제공할 수 있어, 언어 이해력과 발음 능력을 높이고, 다양한 교수법과 국제 학생들의 학습 요구에 맞출 수 있습니다.

모든 유형의 창작자는 ElevenLabs의 도구를 활용해 콘텐츠 접근성을 시각 장애인이나 추가 학습 지원이 필요한 분들에게 여러 언어로 음성을 제공함으로써 시각적 콘텐츠를 보완할 수 있습니다.

2023년 1월 공개된 초기 AI 음성 도구에는 미리 설계된 합성 음성으로 텍스트를 음성으로 변환하는 기능과 자신의 목소리를 복제하는 기능이 포함되어 있었습니다. 다국어 음성 합성 도구는 모든 콘텐츠를 어떤 언어, 어떤 목소리로도 모두가 접근할 수 있게 하겠다는 ElevenLabs의 미션을 한 단계 더 진전시킨 것입니다.

이 기술은 이미 다양한 창작 분야와 산업에서 활용되고 있습니다. 예를 들어, 인디 작가의 오디오북 제작, 비디오 게임 내 보조 캐릭터 음성, 시각 장애인의 온라인 텍스트 접근 지원, 세계 최초의 AI 라디오 채널 운영 등이 있습니다. ElevenLabs는 AI 비디오 생성기 D-ID, 세계 최대 오디오북 퍼블리셔 중 하나인 Storytel, 오픈 액세스 과학 비디오 플랫폼 ScienceCast 의 논문 영상 생성 도구(논문 출처: arXiv, 글로벌 대표 콘텐츠 크리에이터 플랫폼 TheSoul Publishing, 혁신적인 게임 개발사 Embark Studios Paradox Interactive, 그리고 미디어 플랫폼 MNTN.

문의하기
press@elevenlabs.io

ElevenLabs 팀의 다른 글 보기

최고 품질의 AI 오디오로 창작하세요