¿Cómo funciona el descuento del 80% en Eleven v3?

Eleven v3 tiene un 80% de descuento hasta finales de junio de 2025 para usuarios autoservicio que lo usen desde la interfaz.

¿Cómo se generaron las muestras del vídeo y la web?

Se generaron solo con el modelo Eleven v3.

¿Cómo funciona la generación de diálogos?

Texto a Diálogo combina varias voces para crear una interacción fluida entre ellas. Ajustando la entonación, el rango emocional y siguiendo las etiquetas de audio, Texto a Diálogo supone un gran avance para generar conversaciones naturales.

¿Está disponible por API?

La API pública para Eleven v3 (alpha) estará disponible pronto. Si quieres acceso anticipado, contacta con ventas .

¿Qué etiquetas de audio se pueden usar?

Eleven v3 admite una gran variedad de etiquetas de audio, que dependen en parte de la voz y el contexto. Consulta la para más información.

¿Qué idiomas admite?

Afrikáans (afr), árabe (ara), armenio (hye), asamés (asm), azerí (aze), bielorruso (bel), bengalí (ben), bosnio (bos), búlgaro (bul), catalán (cat), cebuano (ceb), chichewa (nya), croata (hrv), checo (ces), danés (dan), neerlandés (nld), inglés (eng), estonio (est), filipino (fil), finlandés (fin), francés (fra), gallego (glg), georgiano (kat), alemán (deu), griego (ell), guyaratí (guj), hausa (hau), hebreo (heb), hindi (hin), húngaro (hun), islandés (isl), indonesio (ind), irlandés (gle), italiano (ita), japonés (jpn), javanés (jav), canarés (kan), kazajo (kaz), kirguís (kir), coreano (kor), letón (lav), lingala (lin), lituano (lit), luxemburgués (ltz), macedonio (mkd), malayo (msa), malayalam (mal), chino mandarín (cmn), maratí (mar), nepalí (nep), noruego (nor), pastún (pus), persa (fas), polaco (pol), portugués (por), panyabí (pan), rumano (ron), ruso (rus), serbio (srp), sindhi (snd), eslovaco (slk), esloveno (slv), somalí (som), español (spa), suajili (swa), sueco (swe), tamil (tam), telugu (tel), tailandés (tha), turco (tur), ucraniano (ukr), urdu (urd), vietnamita (vie), galés (cym)

Presentamos Eleven v3 (alpha)

Escrito por: Piotr Dabkowski; Mati Staniszewski
Publicado: 3 jun 2025

EscucharEscucha este artículo

0:00

0:000:00

Contacta con ventas

Más información

Nos alegra presentar Eleven v3 (alpha): el modelo de Texto a Voz más expresivo.

Eleven v3 ya no está en alfa y está disponible para todos.

Más de 70 idiomas
Diálogo con varios hablantes
Etiquetas de audio como [excited], [whispers] y [sighs]

más de 70 idiomas requiere más prompt engineering que los modelos anteriores, pero los resultados son impresionantes.

Si trabajas en vídeos, audiolibros o herramientas de contenido, esto te permite alcanzar un nuevo nivel de expresividad. Para casos de uso en tiempo real o conversaciones, te recomendamos seguir usando v2.5 Turbo o Flash por ahora. Estamos desarrollando una versión en tiempo real de v3.

Si trabajas en vídeos, audiolibros o herramientas de creación de contenido, esto te permite alcanzar un nuevo nivel de expresividad. Para casos de uso en tiempo real o conversaciones, te recomendamos seguir usando v2.5 Turbo o Flash por ahora. Estamos desarrollando una versión en tiempo real de v3.API.

Por qué hemos creado v3

Por qué hemos creado v3expresividad. Emociones más marcadas, interrupciones naturales y diálogos creíbles eran difíciles de conseguir.

Desde el lanzamiento de Multilingual v2, hemos visto cómo la voz IA se utiliza en cine profesional, desarrollo de videojuegos, educación y accesibilidad. Pero la limitación no era la calidad del sonido, sino la

Eleven v3 resuelve este reto. Lo hemos creado desde cero para ofrecer voces que suspiran, susurran, ríen y reaccionan, generando un habla que suena realmente viva y natural.

Feature	What it unlocks
Audio tags	Inline control of tone, emotion, and non-verbal reactions
Dialogue mode	Multi-speaker conversations with natural pacing and interruptions
70+ languages	Full coverage of high-demand global languages
Deeper text understanding	Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Cómo usar las etiquetas de audio

Cómo usar las etiquetas de audioguía de prompting para v3 en la documentación.

Las etiquetas de audio se incluyen directamente en tu guion y se escriben entre corchetes en minúscula. Puedes ver más sobre las etiquetas de audio en nuestra

Los clones de voz profesionales (PVC) aún no están totalmente optimizados para Eleven v3, por lo que la calidad puede ser inferior a la de modelos anteriores. Durante esta fase de prueba, lo mejor es usar un Instant Voice Clone (IVC) o una voz diseñada si necesitas las funciones de v3. La optimización de PVC para v3 llegará pronto.

“[happily][shouts] We did it! [laughs].”

Cómo crear diálogos con varios hablantes

Cómo crear diálogos con varios hablantesruta de API de Texto a Diálogo. Solo tienes que enviar un array estructurado de objetos JSON —cada uno representa el turno de un hablante— y el modelo genera un archivo de audio cohesivo y con solapamientos:

[
  {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
  {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
  {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
]

La ruta gestiona automáticamente los cambios de hablante, emociones e interrupciones.

La ruta de API gestiona automáticamente los cambios de hablante, emociones e interrupciones.aquí.

v3 is our most expressive model

Precios y disponibilidad

Plan	Launch promo	At the end of June
UI (self-serve)	80% off (~5× cheaper)	Same as Multilingual V2
UI (enterprise)	80% off business plan pricing	Business plan pricing

Para activar v3:

Usa el Selector de modelo y elige Eleven v3 (alpha)

El acceso por API y el soporte en Studio llegarán pronto. Si quieres acceso anticipado, contacta con ventas.

El acceso por API y el soporte en Proyectos llegarán pronto. Si quieres acceso anticipado,

Cuándo no usar v3

Eleven v3 (alpha) requiere más prompt engineering que nuestros modelos anteriores. Cuando funciona, el resultado es impresionante, pero la fiabilidad y la mayor latencia hacen que no sea adecuado para casos de uso en tiempo real o conversaciones. Para estos, recomendamos Eleven v2.5 Turbo/Flash.documentación completa de v3 y las preguntas frecuentes.

Try it today

Inicia sesión en la interfaz de ElevenLabs
Selecciona v3 (alpha) en el desplegable de modelos
Pega tu guion — usa etiquetas o diálogo
Genera audio

Nos hace ilusión ver cómo das vida a v3 en nuevos proyectos: desde narrativas inmersivas hasta producciones cinematográficas.

Presentamos Eleven v3 (alpha)

Por qué hemos creado v3

Eleven v3 resuelve este reto. Lo hemos creado desde cero para ofrecer voces que suspiran, susurran, ríen y reaccionan, generando un habla que suena realmente viva y natural.

Hear v3 for yourself

Cómo usar las etiquetas de audio

Cómo crear diálogos con varios hablantes

v3 is our most expressive model

Precios y disponibilidad

El acceso por API y el soporte en Proyectos llegarán pronto. Si quieres acceso anticipado,

Try it today

Artículos relacionados

Ya está aquí Eleven Music

Presentamos Voice Design v3

Conoce a Scribe

Conoce a Flash