
ElevenLabs, 영국과 미국에서 사업 확장
- 카테고리
- 회사
- 날짜
크리에이터와 퍼블리셔가 장문의 콘텐츠를 직접 내레이션할 수 있도록 설계된 베타 플랫폼을 공개합니다
2023-01-23, 영국 런던 |AI 음성 기술 스타트업 ElevenLabs는 장기적으로 음성 오디오를 즉시 여러 언어로 변환하는 것을 목표로, 실제와 같은 음성 합성 도구를 개발하고 있습니다. 오늘, Credo Ventures가 주도하고 Concept Ventures 및 기타 개인 투자자가 참여한 프리시드 라운드에서 200만 달러를 유치한 후 베타 플랫폼 출시를 발표했습니다.
이 플랫폼을 통해 크리에이터와 퍼블리셔는 장문의 콘텐츠를 직접 내레이션하고 오디오 포맷으로 확장할 수 있습니다. 자체 개발한 딥러닝 기반 음성 합성 모델이 적용되어, 실제 사람의 억양과 감정을 자연스럽게 구현하며, 상황에 따라 전달 방식을 조정할 수 있습니다. ElevenLabs는 음성 복제와 합성 음성 디자인을 위한 다양한 도구도 제공하여, 사용자에게 새로운 창작 기회를 제공합니다. 현재 일부 퍼블리셔와 함께 보이스오버 편집 전용 워크스테이션을 개발 중이며, 2월 초 플랫폼에 추가될 예정입니다. ElevenLabs는 뉴스와 오디오북에 적합한 품질을 제공하는 최초의 AI 내레이터가 되는 것을 목표로 하고 있습니다.
기술의 도약은 혁신에서 시작된다고 믿기에, ElevenLabs는 스스로를 연구 중심 기업으로 생각합니다. 지금까지의 연구는 주로 새로운 텍스트 음성 변환(TTS) 모델 개발에 집중되어 왔으며, 이 모델은 높은 압축률과 맥락 이해를 바탕으로 사람의 음성을 매우 사실적으로 구현합니다. 또한, ElevenLabs는 5초 정도의 짧은 샘플만으로도 별도의 학습(파인튜닝) 없이 높은 유사도의 결과를 내는 새로운 음성 복제 모델도 개발했습니다. 개발자는 API를 통해 이 모든 기능을 사용할 수 있습니다.
이 연구는 현재 플랫폼의 다양한 기능을 가능하게 할 뿐만 아니라, 음성 오디오를 즉시 여러 언어로 변환하는 ElevenLabs의 궁극적인 목표 실현에도 기여하고 있습니다. 올해 말 출시 예정인 AI 더빙 도구를 통해 사용자는 오디오나 비디오를 원본 화자의 목소리를 유지한 채 자동으로 다른 언어로 변환할 수 있습니다. ElevenLabs는 우선 교육 분야 고객을 유치하는 것을 목표로 하며, 장기적으로는 스트리밍, 오디오북, 게임, 영화, 실시간 대화 등 다양한 분야에서 주문형 다국어 오디오 지원을 현실로 만들고자 합니다.
ElevenLabs의 음성 합성과 더빙 도구는 서로 보완적이면서도 시기적절하게 등장했습니다. 두 기능 모두 오디오와 비디오를 더 넓은 청중에게 전달할 수 있게 하며, 오디오 시장이 급성장하는 시점에 출시되었습니다. 유튜브 크리에이터, 퍼블리셔, 개발자 등 초기 테스터 그룹은 이미 매일 플랫폼을 활용해 영상, 스토리, 캐릭터에 목소리를 입히고 있습니다. ElevenLabs는 생성형 음성 기술의 활용 분야가 앞으로 더욱 확대될 것으로 기대합니다. 뉴스 퍼블리셔들은 오디오 콘텐츠 확장이 구독자 참여와 유지에 효과적이라는 점을 이미 확인했습니다. 하지만 성우를 고용하거나 기자가 직접 기사를 읽는 데는 많은 비용이 듭니다. 책, 뉴스레터 저자나 게임 개발자도 비슷한 고민을 겪고 있습니다. 기존 텍스트 음성 변환 소프트웨어를 사용하면 비용은 줄일 수 있지만, 품질에서 타협해야 했습니다. ElevenLabs는 이제 더 이상 품질을 포기할 필요가 없다고 강조하며, 크리에이터와 퍼블리셔에게 가장 진보적이고 다양한 AI 스토리텔링 도구를 제공할 준비를 하고 있습니다.
“이번에 출시하는 플랫폼은 텍스트를 최고 품질의 음성 오디오로 바꿔주는 데 초점을 맞췄습니다. 목소리를 직접 낼 수 없었던 모든 저자, 크리에이터, 개발자에게 목소리를 선사해, 사람들이 좋아하는 책이나 뉴스레터를 오디오로 즐길 수 있도록 하고 싶어요.” - 공동 창업자 마티 스타니셰프스키의 말입니다. “우리의 궁극적인 목표는 사람들이 어떤 언어를 사용하든, 자신에게 의미 있고 흥미로운 모든 콘텐츠를 자유롭게 즐길 수 있도록 하는 것입니다.” - 공동 창업자 피오트르 답코프스키가 덧붙였습니다.
Credo Ventures에서는 CEE 지역의 스마트하고 야심찬 창업자들과 함께 일하고자 합니다. 첫 만남에서 마티와 피오트르의 열정과 의지를 느꼈습니다. 몇 달 만에 이들은 OpenAI급 음성 기술 연구 허브로 성장하며, 인공지능 오디오 분야의 가장 큰 도전 과제를 극복하고 있습니다. ElevenLabs의 합성 음성은 이미 실제와 구분이 어려울 정도로 자연스러우며, 이 혁신은 전례 없는 품질과 정밀도로 콘텐츠 제작의 장벽을 크게 낮췄습니다. 곧 크리에이터들은 다국어로 오디오를 제공하며 청중을 획기적으로 확장할 수 있을 것입니다.– Credo Ventures의 제너럴 파트너 마치에크 그누텍의 말입니다.
엔터테인먼트와 비즈니스 전반에서 오디오는 흔히 사용되지만, 최근 연구 발전에서는 상대적으로 소외되어 왔습니다. 생성형 AI의 황금기에 마티와 피오트르를 지원하게 되어 매우 기쁩니다. ElevenLabs가 이 기술을 대중에게, 한 번에 한 목소리씩 전할 수 있는 팀이라고 믿습니다. - Concept Ventures의 프린시펄 올리버 킥스의 말입니다.
ElevenLabs 소개:
ElevenLabs는 크리에이터와 퍼블리셔를 위한 AI 음성 합성 소프트웨어를 개발하는 연구 기업입니다. ElevenLabs의 도구는 실제와 같은 음성을 구현하며, 맥락이나 사용자 지시에 따라 억양과 감정을 조정할 수 있습니다. 이 플랫폼은 뉴스, 뉴스레터, 책, 비디오 등 다양한 콘텐츠에 목소리를 입힐 수 있는 품질과 다양성을 제공하는 것을 목표로 합니다. 주요 기능으로는 텍스트 기반 음성 생성, 음성 복제, 보이스 디자인, 그리고 곧 추가될 내레이션 편집을 위한 프로젝트 워크플로우가 있습니다. ElevenLabs는 전 구글 머신러닝 엔지니어 피오트르와 전 팔란티어 전략가 마티가 2022년에 설립했습니다. 장기적으로는 모든 언어와 목소리로 음성 콘텐츠를 누구나 쉽게 이용할 수 있도록 하는 것이 목표입니다.
벤처 캐피털 제공: Credo Ventures 및 Concept Ventures. 개인 투자자로는 Peter Czaban, Tytus Cytowski, Talfan Evans, Dr Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst, Harry Songhurst가 있습니다.
문의하기
press@elevenlabs.io
