ElevenLabs raises $500M Series D at $11B valuation
Transforming how we interact with technology
El modelo de Texto a Voz más expresivo
Nos alegra presentar Eleven v3 (alpha): el modelo de Texto a Voz más expresivo.
Eleven v3 ya no está en alfa y está disponible para todos.
más de 70 idiomas requiere más prompt engineering que los modelos anteriores, pero los resultados son impresionantes.
Si trabajas en vídeos, audiolibros o herramientas de contenido, esto te permite alcanzar un nuevo nivel de expresividad. Para casos de uso en tiempo real o conversaciones, te recomendamos seguir usando v2.5 Turbo o Flash por ahora. Estamos desarrollando una versión en tiempo real de v3.
Si trabajas en vídeos, audiolibros o herramientas de creación de contenido, esto te permite alcanzar un nuevo nivel de expresividad. Para casos de uso en tiempo real o conversaciones, te recomendamos seguir usando v2.5 Turbo o Flash por ahora. Estamos desarrollando una versión en tiempo real de v3.API.
Por qué hemos creado v3expresividad. Emociones más marcadas, interrupciones naturales y diálogos creíbles eran difíciles de conseguir.
Desde el lanzamiento de Multilingual v2, hemos visto cómo la voz IA se utiliza en cine profesional, desarrollo de videojuegos, educación y accesibilidad. Pero la limitación no era la calidad del sonido, sino la
| Feature | What it unlocks |
|---|---|
| Audio tags | Inline control of tone, emotion, and non-verbal reactions |
| Dialogue mode | Multi-speaker conversations with natural pacing and interruptions |
| 70+ languages | Full coverage of high-demand global languages |
| Deeper text understanding | Better stress, cadence, and expressivity from text input |
Cómo usar las etiquetas de audioguía de prompting para v3 en la documentación.
Las etiquetas de audio se incluyen directamente en tu guion y se escriben entre corchetes en minúscula. Puedes ver más sobre las etiquetas de audio en nuestra
Los clones de voz profesionales (PVC) aún no están totalmente optimizados para Eleven v3, por lo que la calidad puede ser inferior a la de modelos anteriores. Durante esta fase de prueba, lo mejor es usar un Instant Voice Clone (IVC) o una voz diseñada si necesitas las funciones de v3. La optimización de PVC para v3 llegará pronto.
| 1 | “[happily][shouts] We did it! [laughs].” |
Cómo crear diálogos con varios hablantesruta de API de Texto a Diálogo. Solo tienes que enviar un array estructurado de objetos JSON —cada uno representa el turno de un hablante— y el modelo genera un archivo de audio cohesivo y con solapamientos:
| 1 | [ |
| 2 | {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."}, |
| 3 | {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."}, |
| 4 | {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"} |
| 5 | ] |
| 6 |
La ruta gestiona automáticamente los cambios de hablante, emociones e interrupciones.
La ruta de API gestiona automáticamente los cambios de hablante, emociones e interrupciones.aquí.
| Plan | Launch promo | At the end of June |
|---|---|---|
| UI (self-serve) | 80% off (~5× cheaper) | Same as Multilingual V2 |
| UI (enterprise) | 80% off business plan pricing | Business plan pricing |
Para activar v3:
El acceso por API y el soporte en Studio llegarán pronto. Si quieres acceso anticipado, contacta con ventas.
Cuándo no usar v3
Eleven v3 (alpha) requiere más prompt engineering que nuestros modelos anteriores. Cuando funciona, el resultado es impresionante, pero la fiabilidad y la mayor latencia hacen que no sea adecuado para casos de uso en tiempo real o conversaciones. Para estos, recomendamos Eleven v2.5 Turbo/Flash.documentación completa de v3 y las preguntas frecuentes.
Nos hace ilusión ver cómo das vida a v3 en nuevos proyectos: desde narrativas inmersivas hasta producciones cinematográficas.
Transforming how we interact with technology

Scaling personal, multilingual outreach with privacy-first AI voice and chat agents