Salta al contenido

Presentamos Eleven v3 (alpha)

El modelo de Texto a Voz más expresivo

v3

Nos alegra presentar Eleven v3 (alpha): el modelo de Texto a Voz más expresivo.

Eleven v3 ya no está en alfa y está disponible para todos.

  • Más de 70 idiomas
  • Diálogo con varios hablantes
  • Etiquetas de audio como [excited], [whispers] y [sighs]

más de 70 idiomas requiere más prompt engineering que los modelos anteriores, pero los resultados son impresionantes.

Si trabajas en vídeos, audiolibros o herramientas de contenido, esto te permite alcanzar un nuevo nivel de expresividad. Para casos de uso en tiempo real o conversaciones, te recomendamos seguir usando v2.5 Turbo o Flash por ahora. Estamos desarrollando una versión en tiempo real de v3.

Si trabajas en vídeos, audiolibros o herramientas de creación de contenido, esto te permite alcanzar un nuevo nivel de expresividad. Para casos de uso en tiempo real o conversaciones, te recomendamos seguir usando v2.5 Turbo o Flash por ahora. Estamos desarrollando una versión en tiempo real de v3.API.

Por qué hemos creado v3

Por qué hemos creado v3expresividad. Emociones más marcadas, interrupciones naturales y diálogos creíbles eran difíciles de conseguir.

Desde el lanzamiento de Multilingual v2, hemos visto cómo la voz IA se utiliza en cine profesional, desarrollo de videojuegos, educación y accesibilidad. Pero la limitación no era la calidad del sonido, sino la

Eleven v3 resuelve este reto. Lo hemos creado desde cero para ofrecer voces que suspiran, susurran, ríen y reaccionan, generando un habla que suena realmente viva y natural.

Feature What it unlocks
Audio tags Inline control of tone, emotion, and non-verbal reactions
Dialogue mode Multi-speaker conversations with natural pacing and interruptions
70+ languages Full coverage of high-demand global languages
Deeper text understanding Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Background
Background

Cómo usar las etiquetas de audio

Cómo usar las etiquetas de audioguía de prompting para v3 en la documentación.

Las etiquetas de audio se incluyen directamente en tu guion y se escriben entre corchetes en minúscula. Puedes ver más sobre las etiquetas de audio en nuestra

Los clones de voz profesionales (PVC) aún no están totalmente optimizados para Eleven v3, por lo que la calidad puede ser inferior a la de modelos anteriores. Durante esta fase de prueba, lo mejor es usar un Instant Voice Clone (IVC) o una voz diseñada si necesitas las funciones de v3. La optimización de PVC para v3 llegará pronto.

1[happily][shouts] We did it! [laughs].

Cómo crear diálogos con varios hablantes

Cómo crear diálogos con varios hablantesruta de API de Texto a Diálogo. Solo tienes que enviar un array estructurado de objetos JSON —cada uno representa el turno de un hablante— y el modelo genera un archivo de audio cohesivo y con solapamientos:

1[
2 {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
3 {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
4 {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
5]
6

La ruta gestiona automáticamente los cambios de hablante, emociones e interrupciones.

La ruta de API gestiona automáticamente los cambios de hablante, emociones e interrupciones.aquí.

v3 is our most expressive model

Background
Background

Precios y disponibilidad

Plan Launch promo At the end of June
UI (self-serve) 80% off (~5× cheaper) Same as Multilingual V2
UI (enterprise) 80% off business plan pricing Business plan pricing

Para activar v3:

  • Usa el Selector de modelo y elige Eleven v3 (alpha)

El acceso por API y el soporte en Studio llegarán pronto. Si quieres acceso anticipado, contacta con ventas.

El acceso por API y el soporte en Proyectos llegarán pronto. Si quieres acceso anticipado,

Cuándo no usar v3

Eleven v3 (alpha) requiere más prompt engineering que nuestros modelos anteriores. Cuando funciona, el resultado es impresionante, pero la fiabilidad y la mayor latencia hacen que no sea adecuado para casos de uso en tiempo real o conversaciones. Para estos, recomendamos Eleven v2.5 Turbo/Flash.documentación completa de v3 y las preguntas frecuentes.

Try it today

Background
Background
  1. Inicia sesión en la interfaz de ElevenLabs
  2. Selecciona v3 (alpha) en el desplegable de modelos
  3. Pega tu guion — usa etiquetas o diálogo
  4. Genera audio

Nos hace ilusión ver cómo das vida a v3 en nuevos proyectos: desde narrativas inmersivas hasta producciones cinematográficas.

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión