
Le Walk brings cities to life with ElevenLabs
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
Skapa dynamisk dialog med flera karaktärer med Eleven v3 Audio Tags. Skriv överlappande röster, avbrott och känslomässiga skiftningar för naturliga, mänskliga AI-konversationer.
Samtal driver berättelsen. Med Eleven v3 Audio Tags kan du nu skriva scener med överlappande röster, snabba utbyten och känslomässigt samspel — allt utfört av en enda modell.
Genom att kombinera taggar som [interrupting], [overlapping] eller [laughs] kan du skapa naturlig dialog som flyter som mänsklig konversation — komplett med avbrott, tonförändringar och spontana reaktioner.
Det här är inte bara replik för replik. Det är en föreställning med flera karaktärer.
Multikaraktärsdialog är när en röstmodell spelar flera olika roller i samma scen. Varje karaktär talar i en annan stil, ton eller rytm — ibland avbryter de eller talar samtidigt.
Med Eleven v3 kan du skriva detta direkt: Marissa: [börjar tala] Så jag tänkte att vi kunde— Chris: [avbryter] —testa våra nya tidsfunktioner? Marissa: [förvånad] Precis! Hur visste du— Chris: [överlappar] —vad du tänkte? Ren tur! Marissa: [skrattar] Ärligt talat? Det här är ganska kul.
Resultatet känns som riktig dialog — inte hoplappad berättelse.
Det som tidigare krävde flera talare, inspelningar och tidsjusteringar kan nu hanteras med ett manus. Taggar låter dig regissera varje röst oberoende inom en enda scen.
Exempel: Jessica: [viskar] Så här. Von Fusion: [sarkastiskt] Åh, titta på dig, fröken Fina Fisken. Jessica: [fransk accent] Det här är fantastiskt, eller hur?
Rösterna växlar inte bara — de interagerar, reagerar och överlappar.
Här är några viktiga taggar för att skriva naturlig, reaktiv dialog:
Dessa kan kombineras för uttrycksfullt samspel: [frustrated] Du lyssnar aldrig på mig — [interjecting] För att du aldrig säger vad du menar!
Eleven v3 stöder tidsmedveten leverans som låter röster avbryta eller tala över varandra naturligt. Det är viktigt för humor, spänning eller realism.
I detta utdrag: Marissa: [panikslagen] Vänta, kraschar vi? Jag kan inte avgöra om detta är en funktion eller en— Chris: [interrupting] Bugg! Marissa: [suckar] Ja, men ärligt? Det här är ganska kul.
Scenen känns levande eftersom interaktionen är flytande, inte skriptad tur för tur.
Med Eleven v3 blir dialogsituationer orkestrerade föreställningar. Du kan bygga hela konversationer — komplett med karaktärer, timing, känsla och leverans — med ett manus och en modell.
För berättare, spelmanusförfattare och interaktiva designers öppnar detta upp för komplex scenförfattande utan extra produktionskostnader. Du skriver inte bara repliker. Du regisserar rollbesättningens dynamik.
Professionella Voice Clones (PVCs) är för närvarande inte fullt optimerade för Eleven v3, vilket kan resultera i lägre kloningskvalitet jämfört med tidigare modeller. Under denna forskningsförhandsvisning är det bäst att hitta en Instant Voice Clone (IVC) eller designad röst för ditt projekt om du behöver använda v3-funktioner. PVC-optimering för v3 kommer snart.
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
Supporting 10,000+ research conversations with natural, trustworthy voices
Drivs av ElevenLabs Agenter