
ElevenLabs, 새로운 생성형 음성 AI 제품 출시 및 Nat Friedman, Daniel Gross, Andreessen Horowitz가 주도한 1,900만 달러 시리즈 A 투자 유치 발표
- 카테고리
- 회사
- 날짜
1월 22일 / 글로벌 - ElevenLabs는 음성 기술 연구 기업으로, 8천만 달러 시리즈 B 투자를 Andreessen Horowitz, Nat Friedman, Daniel Gross가 공동 주도하고 Sequoia Capital, SV Angel, Smash Capital, BroadLight Capital 및 Credo Ventures가 참여하여, 음성 AI 연구 및 제품 개발 분야에서 글로벌 리더로서의 입지를 확고히 했습니다.
공개 출시 이후 ElevenLabs는 자연스러운 음성 합성 분야를 선도하며, 사용자가 AI 음성을 다양한 언어와 억양으로 생성 및 디자인할 수 있도록 지원하고, 폭넓은 감정과 억양 표현이 가능합니다. 출시 이후 ElevenLabs 사용자는 100년 이상의 오디오를 생성했으며, 회사는 5명에서 40명 직원으로 성장했습니다. 현재 ElevenLabs 기술은 포춘 500 기업의 41%에서 사용되고 있습니다.
ElevenLabs의 기술은 다양한 산업 분야에서 채택되고 있습니다. 크리에이터가 보이스오버와 AI 더빙으로 시청자 경험을 향상시키고, 교육 접근성을 넓혔으며, 오디오북 출판, 엔터테인먼트, 개인 활용 등에서 혁신적인 솔루션을 제공하고 있습니다. 이번 투자는 제품 고도화와 함께 AI 기술의 안전한 도입을 위해 사용될 예정입니다.
오늘 시리즈 B 발표와 함께, ElevenLabs는 앞으로 몇 주 내에 출시될 여러 새로운 제품 개발 소식도 공개합니다:
2023년 한 해 동안 ElevenLabs는 출판, 게임, 미디어, 대화형 분야 등 다양한 산업에서 입지를 넓혔으며, 주요 미디어 기업들과 B2B 파트너십도 맺었습니다. 대표 파트너는 다음과 같습니다:
이러한 최신 제품 출시와 파트너십은 ElevenLabs가 자체 연구를 바탕으로 다양한 도구를 지속적으로 확장해온 결과입니다. 그동안 출시된 기능은 다음과 같습니다: 음성 합성을 통한 자연스러운 텍스트 음성 변환과, 지연 시간을 최소화한 터보 모델; 보이스 디자인 및 음성 복제를 통한 맞춤형 음성 생성; 음성 변환으로 한 음성을 다른 음성으로 변환. 또한 업계 최고 수준의 AI 더빙 도구를 출시해 오디오와 비디오를 29개 언어로 자동 번역하면서 원래 화자의 목소리와 감정까지 보존할 수 있습니다. 곧 터보 및 음성 변환 모델(현재는 영어만 지원)을 더 많은 언어로 확장할 예정입니다.
이러한 기능을 뒷받침하는 연구를 바탕으로 ElevenLabs는 더욱 복잡한 워크플로우를 위한 고급 도구 개발에도 힘쓰고 있습니다. 예를 들어 스튜디오는 출판용, 더빙 스튜디오는 비디오 현지화용으로 개발되었습니다.스튜디오는 출판사를 위한 장문 콘텐츠의 편집, 구조화, 탐색, 생성 과정을 간소화하고, 더빙 스튜디오는 대본, 번역, 시퀀스 타이밍을 직접 제어해 전 세계 시청자에게 맞는 콘텐츠 준비를 돕습니다.
또한 ElevenLabs는 커뮤니티 중심 제품인 보이스 라이브러리도 개발했습니다. 이는 AI로 생성된 음성을 공유하는 공간입니다. 기존에는 보이스 디자인 도구로 만든 인공 음성만 공유할 수 있었지만, 이제는 프로페셔널 음성 복제로 만든 본인 인증 음성도 보이스 라이브러리 마켓플레이스를 통해 공유하고, 다른 사용자가 사용할 때 수익을 얻을 수 있습니다. 마켓플레이스의 안전성과 신뢰성을 위해 ElevenLabs는 프로페셔널 음성 복제 기술로 고품질 음성 복제본을 만듭니다. 음성 공유 전, 사용자는 정해진 시간 내에 텍스트 프롬프트를 읽어 훈련 샘플과 일치하는지 확인하는 보이스 캡차 인증을 통과해야 합니다. 이 과정과 ElevenLabs 팀의 모니터링 및 수동 승인 절차를 통해, 진짜 사용자 인증 음성만 공유 및 수익화되어 더욱 안전하고 신뢰할 수 있는 환경이 조성됩니다.
ElevenLabs의 핵심 우선순위는 AI의 안전하고 책임감 있는 개발이며, 모든 AI 생성 콘텐츠가 명확히 식별될 수 있도록 탐지 기능을 강화하는 데 중점을 두고 있습니다. 회사는 지난해 AI 음성 분류기를 출시했습니다. 이 도구는 오디오 샘플에 ElevenLabs가 생성한 콘텐츠가 포함되어 있는지 확인할 수 있습니다. 올해는 분류기의 기능을 더 많은 음성 AI 모델로 확장하고, 다양한 배포 플랫폼과 협력해 적용 범위를 넓힐 예정입니다. ElevenLabs는 공공 영역의 안전성을 높이기 위한 추가 보호장치도 적극 개발 중입니다.
이번 시리즈 B 투자를 통해 ElevenLabs는 음성 AI 연구 및 제품 개발 분야에서 글로벌 리더로서의 입지를 더욱 확고히 할 계획입니다. 투자금은 연구 고도화, 인프라 확장, 특정 산업 맞춤 신제품 개발, AI 기술의 책임감 있고 윤리적인 개발을 위한 안전성 강화에 사용될 예정입니다.
ElevenLabs CTO Piotr Dąbkowski의 말:
“우리 팀의 헌신은 이미 음성 AI 분야에 큰 변화를 가져왔습니다. 이번 투자를 통해 더 큰 도전에 나서고, 연구와 제품 개발에서 경쟁력을 유지하는 데 집중할 수 있게 되었습니다.”
Mati Staniszewski의 마무리:
“우리의 목표는 변함없습니다. 언어와 소통의 장벽을 허물어 콘텐츠와의 상호작용 방식을 혁신하는 것입니다. 우리는 첨단 기술을 개발해 언어와 목소리를 넘어 모든 사람이 중요한 정보와 이야기에 쉽게 접근할 수 있도록 하고 있습니다. 지금까지의 성과는 헌신적인 팀과 투자자 덕분이며, 아직 여정의 시작이지만, 함께 접근성과 소통의 미래를 만들어가고 있습니다.”