
Eleven v3 Audio Tags: Emulating accents with precision
Seamlessly switch accents mid-sentence with Eleven v3 Audio Tags. Emulate American, British, French, and more for dynamic, culturally rich AI speech.
Presenterar Eleven v3 Alpha
Prova v3Professionell Voice Cloning ger en möjlighet till bekvämlighet och konsekvens i olika ljudsammanhang
Vi är stolta över att släppa vår Professional Voice Cloning (PVC)-modell till allmänheten. Tidigare tillgänglig endast för våra företagskunder, öppnar vi nu upp för alla, vilket gör det möjligt för dig attskapa en perfekt digital kopia av din egen röst; en som är praktiskt taget omöjlig att skilja från originalet.
Vi gjorde det möjligt för användare att ladda upp sina röstdata i mars och lovade att släppa rösterna i turordning i juli - nu är de äntligen här.
PVC är gratis för alla på eller över Creator-planen. Dessutom kan din PVC-röst ocksåautomatiskt tala alla språk som stöds av Eleven Multilingual v1!
För att få tillgång till PVC, gå helt enkelt till VoiceLab, klicka på “lägg till en ny röst” och välj Professional Voice Cloning. Till skillnad från vår Instant cloning-funktion innebär PVC att träna en dedikerad modell på en stor dataset av röstprover -minst 30 minuter, med 3 timmar som optimalt.
För att säkerställa högsta kvalitet på resultatet finns det några saker att tänka på när du förbereder dina prover för finjustering.
För det första, se till att träningsdata består avrena ljudfiler av en enda talare utan bakgrundsljud, musik eller andra effekter. Alla icke-tal ljud kan förvirra modellen och hamna i resultatet. Om du laddar upp flera ljudfiler inspelade vid olika tillfällen, se till attmatcha inspelningsförhållandena så nära som möjligt - märkbara skillnader i efterklang eller avstånd från mikrofonen etc. kommer också att påverka resultatet.
Detsamma gäller din talstil - dinleveransstil bör vara enhetlig över alla prover du laddar upp. Till exempel, om du planerar att använda din röst för att spela in en ljudbok bör träningsdata bestå av inspelningar där du läser i ljudboksstil.
PVC är integrerat med alla våra modeller, inklusive Eleven Multilingual v1. Om du talar något av de språk som stöds kan du skapa en perfekt kopia av din röst och få den att tala alla andra språk också!
Vi kör modellen minst en gång per månad, beroende på antalet förfrågningar, med ytterligare hastighetsökningar förväntade mot slutet av kvartalet.
För att säkerställa säker användning av vår teknik och upprätthålla strikta användar- och etiska riktlinjer har vi integrerat robusta säkerhetsåtgärder för att se till attdu bara kan klona din egen röst.
När du laddar upp dina taldata för träning följer ett verifieringssteg. I det får du en textcaptcha som du ska läsa högt inom 10 sekunder. Vi validerar din förfrågan genom att jämföra röstprofilen från denna inspelning med rösten i de data du laddade upp.
Om det finns en matchning skickas din förfrågan för finjustering. Om inte, har du 4 verifieringsförsök kvar. Om alla är ogiltiga måste du kontakta vår kundtjänst för att få din röst verifierad manuellt.
Om du inte väljer att dela den, tillhör din röst och är endast tillgänglig för dig.
Professional Voice Cloning går bortom enkel bekvämlighet och erbjuder en rad fördelar för dina personliga och kommersiella projekt. Här är några exempel:
Professional Voice Cloning ger mer kontroll över hur du representerar dig själv digitalt. Det är mer än röstreplikering - det är en möjlighet för bekvämlighet och konsekvens över en mängd olika ljudanvändningsområden!
Seamlessly switch accents mid-sentence with Eleven v3 Audio Tags. Emulate American, British, French, and more for dynamic, culturally rich AI speech.
Fine-grained control over timing, rhythm, and emphasis with Eleven v3 Audio Tags. Transform flat delivery into dynamic, performative content.