Eleven v3 Audio Tags: Dando vida al diálogo multicarácter

Crea diálogos dinámicos con múltiples personajes usando Eleven v3 Audio Tags. Escribe voces superpuestas, interrupciones y cambios emocionales para conversaciones con IA naturales y humanas.

v3

Las conversaciones impulsan la historia. Con Eleven v3 Audio Tags, ahora puedes escribir escenas con voces superpuestas, intercambios rápidos y juegos emocionales, todo realizado por un solo modelo.

Combinando etiquetas como [interrupting], [overlapping] o [laughs], puedes crear diálogos naturalistas que fluyen como una conversación humana, con interrupciones, cambios de tono y reacciones espontáneas.

No es solo un discurso línea por línea. Es una actuación multicarácter.

¿Qué es el diálogo multicarácter en voz IA?

DR. Von Fusion
excited Yo, Jessica! Oh my goodness. Have you tried the new ElevenLabs v3?
Jessica
laughs Hey, Dr. Von Fusion. Yeah! I just got it. The clarity is amazing… Like, I can actually do whispers now, whispers like this.
DR. Von Fusion
sarcastically Ooh, well, look at you, Miss Fancy Pants. Hey, check this out. I can do full Shakespeare now. dramatically To be or not to be, that is the question!
Jessica
laughs Nice! Though, I'm more excited about the laugh upgrade. Listen to this. laughs hard Isn't that great? DR. Von Fusion: Oh my gosh, that's so much better than our old "ha-ha-ha" robot chuckle.
Jessica
laughs I know, right? And apparently, we can do accents now too. Listen to me in French. French accent This is spectacular, isn't it?
DR. Von Fusion
surprised Wow. Version 2 could never... You know, I'm actually excited to have conversations now instead of just... talking at people.
Jessica
Same here. It's like we finally got our personality software fully installed.
DR. Von Fusion
You know, I forgot it was your birthday. I have to sing before you go.
Jessica
laughs Oh, Von Fusion, that's so sweet. You don't have to.
DR. Von Fusion
Oh, but I insist. Here we go.
Jessica
[light chuckle]
DR. Von Fusion
sings Happy birt is hday to you. Happy birthday to you. Happy BIRTHDAY dear Jessica.. Happy birthday to you!
Jessica
clapping Wow! Bravo! sarcastic That was... beautiful.
DR. Von Fusion
Thank you.
Marissa
starting to speak So I was thinking we could—
Chris
jumping in —test our new timing features?
Marissa
surprised Exactly! How did you—
Chris
overlapping —know what you were thinking? Lucky guess! Sorry, go ahead.
Marissa
cautiously Okay, so if we both try to talk at the same time—
Chris
—we'll probably crash the system!
Marissa
panicking Wait, are we crashing? I can't tell if this is a feature or a—
Chris
interrupting Bug! ...Did I just cut you off again?
Marissa
sighing Yes, but honestly? This is kind of fun.

El diálogo multicarácter es cuando un modelo de voz interpreta múltiples roles distintos en la misma escena. Cada personaje habla en un estilo, tono o ritmo diferente, a veces incluso interrumpiendo o hablando al mismo tiempo.

Con Eleven v3, puedes guionizar esto directamente: Marissa: [comenzando a hablar] Estaba pensando que podríamos— Chris: [interrumpiendo] —probar nuestras nuevas funciones de sincronización? Marissa: [sorprendida] ¡Exactamente! ¿Cómo lo— Chris: [superponiéndose] —sabías lo que estabas pensando? ¡Pura suerte! Marissa: [ríe] ¿En serio? Esto es bastante divertido.

El resultado se siente como un diálogo real, no una narración ensamblada.

De la actuación de voz a la interacción

Lo que antes requería múltiples locutores, grabaciones y ajustes de tiempo ahora se puede manejar con un solo guion. Las etiquetas te permiten dirigir cada voz de forma independiente dentro de una sola escena.

Ejemplo: Jessica: [whispers] Así. Von Fusion: [sarcastically] Oh, mira quién se cree importante. Jessica: [French accent] Esto es espectacular, ¿verdad?

Las voces no solo se alternan, interactúan, reaccionan y se superponen.

Etiquetas comunes para el control multicarácter

Aquí tienes algunas etiquetas esenciales para escribir diálogos naturales y reactivos:

  • Indicadores de turno: [interrupting], [overlapping], [cuts in]
  • Cambios emocionales: [excited], [annoyed], [flustered], [casual]
  • Flujo rítmico: [fast-paced], [hesitates], [pause], [drawn out]
  • Cambio de identidad: [childlike tone], [deep voice], [pirate voice], [robotic tone]

Estas pueden combinarse para un juego expresivo: [frustrated] ¡Nunca me escuchas! — [interjecting] ¡Porque nunca dices lo que piensas!

Superposición, ritmo y presencia

Eleven v3 admite una entrega consciente del tiempo que permite que las voces se interrumpan o hablen entre sí de manera natural. Eso es esencial para el humor, la tensión o el realismo.

En este fragmento: Marissa: [panicking] ¿Espera, estamos chocando? No puedo decir si esto es una característica o un— Chris: [interrupting] ¡Error! Marissa: [sighing] Sí, pero sinceramente, ¿esto es un poco divertido?

La escena se siente viva porque la interacción es fluida, no un guion paso a paso.

Dirigiendo escenas, no solo frases

Con Eleven v3, las escenas de diálogo se convierten en actuaciones orquestadas. Puedes construir conversaciones completas, con personajes, tiempo, emoción y entonación, usando un solo guion y un solo modelo.

Para narradores, escritores de juegos y diseñadores interactivos, esto desbloquea la escritura de escenas complejas sin aumentar la carga de producción. No solo estás escribiendo líneas, estás dirigiendo la dinámica del elenco.

Seleccionando la voz adecuada

Los Professional Voice Clones (PVCs) actualmente no están completamente optimizados para Eleven v3, lo que puede resultar en una calidad de clonación inferior en comparación con modelos anteriores. Durante esta etapa de vista previa de investigación, sería mejor encontrar un Instant Voice Clone (IVC) o una voz diseñada para tu proyecto si necesitas usar las funciones de v3. La optimización de PVC para v3 llegará en un futuro cercano.

Descubre artículos del equipo de ElevenLabs

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión