Gå till innehåll

ElevenLabs Voices: En omfattande guide

Introduktion

På ElevenLabs driver vi innovationen inom generativ AI-röst. Den här guiden ger en översikt över våra metoder, processer och teknologin bakom plattformens röster.

Kategorisering av röster på ElevenLabs

1. ElevenLabs Röster

Användare på vår plattform kan välja bland flera tillgängliga, färdiga röster. Dessa är de röster du ser som standard i rullgardinsmenyn för Speech Synthesis. De delas in i två kategorier:


Legalt Kontrakterade Röster
Dessa är röster som erhållits genom legala, betalda samarbeten med professionella röstskådespelare. De utgör majoriteten av rösterna du hittar i Speech Synthesis. Vi prioriterar dem inte bara för deras oöverträffade kvalitet utan också som ett bevis på vårt engagemang för att stödja artister i branschen.

  • Samarbete med professionella röstskådespelare i specifika projekt.
  • Röstskådespelare kompenseras på tidsbegränsade kontrakt.
  • Licensavtal som säkerställer att röstskådespelare behåller rättigheterna till sina röster.

Slumpmässigt Genererade Röster
Dessa är röster som produceras med hjälp av komplexa algoritmer som slumpmässigt samplar röstegenskaper. Dessa röster genereras med vårt verktyg Voice Design.

  • Unika och nya - varje genererad röst är annorlunda.
  • Imiterar eller replikerar inte någon specifik individs röst.
  • Tillhör inte någon specifik individ.

2. Användarröster

VoiceLab är vår verktygssvit tillgänglig för användare för röstskapande och anpassning. Den består av två röstkloningsmodeller (Instant Voice Cloning (IVC) och Professional Voice Cloning (PVC), och Voice Design - ett verktyg för att generera nya röster genom att slumpmässigt sampla vokala egenskaper.


Instant Voice Cloning (IVC)
Instant Voice Cloning gör det möjligt för användare att snabbt skapa en digital avbild av en röst baserat på korta prover. IVC är utformat för att erbjuda snabba resultat, med lägre förhandsgranskningskvalitet, vilket gör det enkelt att experimentera med olika röststilar.

Viktiga funktioner:

  • Snabb kloning från korta röstprover.

Säkerhetsåtgärder:

  • Till skillnad från träning från grunden, där stora mängder data behövs, använder denna teknik vad som kallas zero-shot learning. Här lyssnar AI:n på ett kort ljudklipp och förstår direkt hur man replikerar en röst, utan behov av ytterligare träning. Resultaten kommer inte att exakt likna de ursprungliga uppladdade proverna.
  • Röster tillagda av en enskild användare för Instant Voice Cloning förblir exklusiva för den användarens konto och kan inte delas. Ingen annan användare har tillgång till röster skapade med IVC.

Användaransvar:

  • Innan varje röstprov laddas upp måste användare bekräfta att de har erhållit nödvändiga rättigheter och tillstånd för att klona den specifika rösten. Detta är ett obligatoriskt steg för att initiera kloningsprocessen.
  • För mer information om hur du använder vår röstkloningsteknik säkert, se vår Voice Cloning Guide.
  • Missbruk av röstkloningsfunktionen, särskilt för obehöriga eller kommersiella ändamål utan korrekt samtycke, resulterar i strikta åtgärder, inklusive permanenta avstängningar.

Professional Voice Cloning (PVC)
Professional Voice Cloning är en mer avancerad röstkloningsfunktion som låter användare skapa en högkvalitativ replika av sin egen röst. Detta innebär träning av en dedikerad modell på en stor mängd röstprover – minst 30 minuter av ren ljuddata.

Viktiga funktioner:

  • Högkvalitativ, ultrarealistisk röståtergivning.

Säkerhetsåtgärder:

  • På grund av den höga kvaliteten på utdata som produceras med PVC har vi implementerat robusta säkerhetsåtgärder för att säkerställa att användare endast kan klona sin egen röst.
  • Efter att ha laddat upp taldata för träning måste en användare klara ett verifieringssteg: en textcaptcha-prompt ges, som användaren måste läsa högt inom en tidsram på 10 sekunder.
  • Vi validerar begäran genom att jämföra röstprofilen från denna inspelning med rösten i den data som användaren laddat upp för kloning.
  • Om det finns en matchning skickas begäran för finjustering. Om inte, har användaren 4 verifieringsförsök kvar. Efter att alla försök är uttömda utan framgång måste användaren kontakta vår kundtjänst för manuell röstverifiering.
  • Som standard förblir röster tillagda av en enskild användare exklusiva för den användarens konto.
  • Användare kan välja att dela sin Professional Voice Clone via Voice Library för andra att använda och tjäna belöningar när de gör det.

Användaransvar:

  • Precis som med IVC betonar våra användarvillkor vikten av att respektera individuella rättigheter. Missbruk av denna funktion, i strid med våra villkor, resulterar i snabba och bestämda åtgärder, upp till och inklusive permanenta avstängningar från vår plattform.

Voice Design
Voice Design möjliggör generering av nya syntetiska röster baserat på användarvalda parametrar, såsom ålder, kön och accent. Röster skapade på detta sätt förblir konsekventa i talegenskaper över språk.

Viktiga funktioner:

  • Unika och nya - varje genererad röst är annorlunda.
  • Imiterar eller replikerar inte någon specifik individs röst.
  • Tillhör inte någon specifik individ.

3. Delade Röster

Voice Library är vår miljö för röstdelning. Användare kan antingen dela röster genererade med Voice Design eller sin egen röst genererad med Professional Voice Cloning.

Community Röstdelning & Belöningar
Kompatibilitet:

  • Voice Design
  • Professional Voice Cloning

Funktioner:

  • Användarbelöningar: Användare tjänar belöningar när andra använder deras delade röst.
  • Röstupptäckt: Utforska och använd röster från biblioteket för olika innehållsbehov.
  • Alla röster i Voice Library kommer med en gratis kommersiell användningslicens.

En Notis om Innehållsdelning
Även om ElevenLabs erbjuder avancerade verktyg för röstgenerering och röstkloning, är det viktigt att notera att vår plattform inte erbjuder en mekanism för att publicera eller dela några ljudfiler. Voice Library gör det möjligt för användare att dela vissa röster, som i sin tur kan användas för att producera nytt ljudinnehåll, men det tillåter inte delning av något faktiskt ljudinnehåll i sig.

All distribution eller delning av innehåll som producerats med våra verktyg utanför vår plattform vilar helt på användarens eget omdöme och ansvar.

Vi uppmuntrar ansvarsfull och respektfull användning av vår teknologi och vi kommer att agera beslutsamt om vi får kännedom om några överträdelser av våra Användarvillkor. Vi litar på att vår community är medveten om de potentiella konsekvenserna av röstkloning och agerar i enlighet med lagen och vår plattforms riktlinjer.

Vårt Engagemang för Transparens

Vi har introducerat verktyg och resurser för att underlätta ansvarsfull användning av vår teknologi.

  • AI Speech Classifier: Låter vem som helst verifiera om ett ljudprov härstammar från ElevenLabs.
  • Voice Captcha protection: Ensures the Professional Voice Cloning service remains secure.
  • Utbildning: Samarbetsguider om säker och laglig användning av röstkloningsteknik utarbetade med juridiska experter.
  • Användarvillkor: Riktlinjer som betonar laglig användning av vår teknologi.
  • Om du stöter på innehåll som du misstänker genererats på vår plattform och som väcker oro, vänligen rapportera det här.

Avslutande Notis

Som pionjärer inom AI-drivna röstteknologier prioriterar vi transparens, integritet och respekt. Vi värdesätter våra samarbeten med röstskådespelarcommunityn och strävar alltid efter att skapa värde för våra användare samtidigt som vi respekterar individuella rättigheter. När vi fortsätter vår resa förblir vi engagerade i att förstärka mänsklig kreativitet på ett ansvarsfullt sätt.

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in