본문 바로가기

ElevenLabs, 베타 단계 종료 및 30개 언어 지원 AI 대화 모델 Eleven Multilingual v2 출시

  • AI 음성 플랫폼 ElevenLabs이 새로운 딥러닝 모델 출시로 다양한 콘텐츠의 언어 장벽을 혁신적으로 허물고, 30개 언어의 다국어 기능을 제공합니다: Eleven 다국어 v2.
  • 이번 혁신을 통해 전 세계 미디어, 게임 개발자, 출판사, 독립 크리에이터들이 콘텐츠 접근성을 획기적으로 높일 수 있습니다.
  • 이번 새로운 기능들은 1월 플랫폼 출시 이후 지속적으로 선보인 다양한 기능과 개선에 이어, 공식적으로 회사의 베타 단계 종료를 알리는 중요한 이정표입니다.
  • ElevenLabs의 목표는 모든 콘텐츠를 어떤 언어, 어떤 목소리로도 모두가 쉽게 접근할 수 있도록 하는 것입니다.

런던, 영국 - ElevenLabs, AI 음성 소프트웨어 분야의 글로벌 리더가 오늘 30개 언어를 지원하는 새로운 다국어 음성 생성 모델 을(를) 출시했습니다. 이 모델은 AI로 '감정이 풍부한' 오디오를 정확하게 생성할 수 있습니다.

이번 혁신은 전적으로 자체 연구를 기반으로 하며, 크리에이터들이 유럽, 아시아, 중동 등 글로벌 시장을 위한 현지화 오디오 콘텐츠를 제작할 수 있도록 지원합니다. ElevenLabs는 지난 18개월간 인간 음성의 특징을 분석해, 맥락을 이해하고 감정을 전달하는 새로운 메커니즘을 개발했으며, 이를 통해 새롭고 독특한 목소리도 합성할 수 있게 되었습니다.

Eleven Multilingual v2를 통해 ElevenLabs의 텍스트 음성 변환 플랫폼에 텍스트를 입력하면, 새로운 모델이 약 30개 언어를 자동으로 인식하고, 지금까지 경험하지 못한 수준의 자연스러운 음성을 생성할 수 있습니다.

또한, 합성 음성이든 음성 복제든 상관없이, 화자의 고유한 목소리 특징과 원래의 억양이 모든 언어에서 그대로 유지됩니다. 즉, 동일한 목소리로 30개 언어의 콘텐츠를 모두 생생하게 전달할 수 있습니다.

이번 출시는 프로페셔널 음성 복제(Professional Voice Cloning) 공개 이후 이어지는 업데이트입니다. 이 제품 업데이트는 추가 보안 기능과 함께 출시되어, 사용자가 자신의 목소리를 완벽하게 복제한 디지털 음성을 만들 수 있게 했습니다. 실제 목소리와 거의 구분이 불가능할 정도입니다. 오늘 출시된 모델로 이제 우리의 목소리가 약 30개 언어로도 자연스럽게 말할 수 있게 되었습니다.

지원 언어에는 한국어, 네덜란드어, 터키어, 스웨덴어, 인도네시아어, 베트남어, 필리핀어, 우크라이나어, 그리스어, 체코어, 핀란드어, 루마니아어, 덴마크어, 불가리아어, 말레이어, 헝가리어, 노르웨이어, 슬로바키아어, 크로아티아어, 아랍어, 타밀어 등이 포함됩니다. 기존에 지원하던 영어, 폴란드어, 독일어, 스페인어, 프랑스어, 이탈리아어, 힌디어, 포르투갈어도 계속 이용할 수 있습니다.

최근 다양한 기능 출시와 플랫폼의 지속적인 개선에 따라, ElevenLabs는 오늘 공식적으로 베타 단계를 종료한다고 발표했습니다. 이번 전환은 전 세계 100만 명이 넘는 사용자에게 신뢰할 수 있고 혁신적인 도구를 제공하겠다는 ElevenLabs의 의지를 보여주는 중요한 순간입니다.

앞으로 ElevenLabs는 사용자가 플랫폼에서 목소리를 공유하고, 새로운 오디오 파일 개발로부터 혜택을 받을 수 있는 기능을 도입할 계획입니다. 이를 통해 사람과 AI 간의 협업 기회가 더욱 확대될 것입니다.

Mati Staniszewski, ElevenLabs CEO 겸 공동 창업자는 다음과 같이 말했습니다:

"ElevenLabs는 모든 콘텐츠를 어떤 언어, 어떤 목소리로도 모두가 쉽게 접근할 수 있도록 하겠다는 꿈에서 시작됐습니다. Eleven Multilingual v2 출시로 그 꿈에 한 걸음 더 다가섰고, AI로 생성된 인간 수준의 목소리가 모든 방언에서 사용될 수 있게 되었습니다."

"저희 텍스트 음성 변환 도구는 기회의 평등에 기여하며, 모든 크리에이터에게 고품질 음성 오디오 기능을 제공합니다. 이제 그 혜택이 30개 가까운 언어의 다국어 애플리케이션으로 확장됩니다. 앞으로도 AI의 도움으로 더 많은 언어와 목소리를 지원해 콘텐츠의 언어 장벽을 없애고자 합니다. ElevenLabs는 이러한 접근성 혁신이 궁극적으로 더 큰 창의성, 혁신, 다양성을 이끌 것이라 믿습니다."

여러 언어로 고품질 오디오 콘텐츠를 제작하는 데 드는 비용과 자원을 줄여, ElevenLabs는 기업과 크리에이터가 모든 문화와 언어에서 더 창의적이고 접근성 높은 콘텐츠를 만들 수 있도록 지원합니다.

특히 인디 게임 개발자 및 퍼블리셔의 경우, 다국어 음성 생성 도구를 통해 게임 경험과 오디오 콘텐츠를 다양한 국가의 이용자에게 현지 언어로 제공할 수 있어, 음성 품질이나 정확성을 해치지 않으면서 전 세계 게이머와 청취자와 소통할 수 있습니다.

또한 교육 기관 에서도 학생들에게 원하는 언어로 정확한 오디오 콘텐츠를 즉시 제공할 수 있어, 다양한 언어의 듣기 및 발음 능력 향상은 물론, 각기 다른 교수법과 전 세계 학생들의 학습 요구를 충족할 수 있습니다.

모든 크리에이터는 ElevenLabs의 도구를 활용해 접근성 을 높일 수 있습니다. 시각 장애인이나 추가 학습 지원이 필요한 분들도 다양한 언어의 오디오로 시각 콘텐츠를 보완해 이용할 수 있습니다.

2023년 1월에 선보인 초기 AI 음성 도구 세트는, 미리 준비된 합성 음성 선택과 사용자의 목소리 복제 기능을 통해 어떤 텍스트든 음성으로 변환할 수 있었습니다. 다국어 음성 합성 도구는 ElevenLabs가 모든 콘텐츠를 어떤 언어, 어떤 목소리로도 모두가 쉽게 접근할 수 있도록 하겠다는 목표에 한 걸음 더 다가선 결과입니다.

이 기술은 이미 다양한 산업과 창작 분야에서 활용되고 있습니다. 독립 작가들은 오디오북을 제작하고, 게임에서는 조연 캐릭터에 목소리를 입히며, 시각 장애인들이 온라인 텍스트 콘텐츠에 접근할 수 있도록 돕고, 세계 최초의 AI 라디오 채널도 탄생했습니다. ElevenLabs는 AI 영상 생성 플랫폼 D-ID, 세계 최대 오디오북 퍼블리셔 중 하나인 Storytel, 오픈 액세스 과학 영상 플랫폼 ScienceCast, 이 플랫폼의 영상 생성 도구는 arXiv, 세계적인 콘텐츠 제작 플랫폼 TheSoul Publishing, 그리고 놀라운 게임을 만든 개발사 Embark Studios Paradox Interactive, 그리고 미디어 플랫폼 MNTN 등과 협력하고 있습니다.

ElevenLabs 팀의 다른 글 보기

최고 품질의 AI 오디오로 창작하세요