
Online Conversational Agent Hackathon
To celebrate 1 million agents created, build the best agent you can in 2 hours and compete for $20k+ in prizes.
Einführung von Eleven v3 Alpha
v3 ausprobierenProfessionelles Voice Cloning bietet eine bequeme und konsistente Lösung für verschiedene Audioanwendungen.
Wir freuen uns, unser Professional Voice Cloning (PVC) Modell der breiten Öffentlichkeit zugänglich zu machen. Bisher ausschließlich für unsere Unternehmenskunden verfügbar, öffnen wir nun den Zugang für alle und ermöglichen es Ihnen,eine perfekte digitale Kopie Ihrer eigenen Stimme zu erstellen, die praktisch nicht vom Original zu unterscheiden ist.
Im März haben wir Nutzern ermöglicht, ihre Sprachdaten hochzuladen, und versprochen, die Stimmen im Juli nach dem Prinzip 'Wer zuerst kommt, mahlt zuerst' freizugeben - jetzt sind sie endlich da.
PVC ist für alle ab dem Creator-Plan kostenlos verfügbar. Darüber hinaus kann Ihre PVC-Stimme auchautomatisch alle von Eleven Multilingual v1 unterstützten Sprachen sprechen.
Um auf PVC zuzugreifen, gehen Sie einfach zu VoiceLab, klicken Sie auf „Neue Stimme hinzufügen“ und wählen Sie Professional Voice Cloning. Im Gegensatz zu unserer Instant Cloning-Funktion erfordert PVC das Training eines dedizierten Modells auf einem großen Datensatz von Sprachproben -mindestens 30 Minuten, optimal sind 3 Stunden.
Um die höchste Wiedergabetreue zu gewährleisten, gibt es einige Dinge zu beachten, wenn Sie Ihre Proben für das Feintuning vorbereiten.
Stellen Sie zunächst sicher, dass die Trainingsdatensaubere Audiodateien eines einzelnen Sprechers ohne Hintergrundgeräusche, Musik oder andere Effekteenthalten. Jegliche Nicht-Sprachgeräusche können das Modell verwirren und im Ergebnis auftauchen. Wenn Sie mehrere Audiodateien aus verschiedenen Sitzungen hochladen, achten Sie darauf,die Aufnahmebedingungenso genau wie möglich anzugleichen - merkliche Unterschiede in Nachhall oder Abstand zum Mikrofon usw. werden ebenfalls das Ergebnis beeinträchtigen.
Gleiches gilt für Ihren Sprechstil - IhrVortragsstil sollte einheitlichüber alle hochgeladenen Proben hinweg sein. Wenn Sie beispielsweise Ihre Stimme zur Aufnahme eines Hörbuchs verwenden möchten, sollten die Trainingsdaten Aufnahmen von Ihnen im Hörbuch-Vortragsstil enthalten.
PVC ist in alle unsere Modelle integriert, einschließlich Eleven Multilingual v1. Wenn Sie eine der unterstützten Sprachen sprechen, können Sie eine perfekte Replik Ihrer Stimme erstellen und sie auch alle anderen Sprachen sprechen lassen!
Wir führen das Modell mindestens einmal pro Monat aus, abhängig von der Anzahl der Anfragen, mit weiteren Beschleunigungen gegen Ende des Quartals.
Um die sichere Nutzung unserer Technologie zu gewährleisten und strikte Datenschutz- und ethische Richtlinien einzuhalten, haben wir robuste Sicherheitsmaßnahmen integriert, um sicherzustellen, dassSie nur Ihre eigene Stimme klonen können.
Nachdem Sie Ihre Sprachdaten zum Training hochgeladen haben, folgt ein Verifizierungsschritt. Dabei erhalten Sie eine Text-Captcha-Aufforderung. Sie werden dann gebeten, diese innerhalb von 10 Sekunden laut vorzulesen. Wir validieren Ihre Anfrage, indem wir das Stimmprofil dieser Aufnahme mit der in den hochgeladenen Daten enthaltenen Stimme vergleichen.
Wenn es eine Übereinstimmung gibt, wird Ihre Anfrage zum Feintuning weitergeleitet. Wenn nicht, haben Sie noch 4 Verifizierungsversuche. Wenn alle ungültig sind, müssen Sie sich über unser Help Center melden, um Ihre Stimme manuell verifizieren zu lassen.
Sofern Sie sich nicht entscheiden, sie zu teilen, gehört Ihre Stimme nur Ihnen und ist nur für Sie verfügbar.
Professional Voice Cloning geht über einfache Bequemlichkeit hinaus und bietet eine Reihe von Vorteilen für Ihre persönlichen und kommerziellen Projekte. Hier sind nur einige:
Professional Voice Cloning ermöglicht mehr Kontrolle darüber, wie Sie sich digital repräsentieren. Es ist mehr als nur Stimmreplikation - es ist eine Gelegenheit für Bequemlichkeit und Konsistenz in einer Vielzahl von Audioanwendungen!
To celebrate 1 million agents created, build the best agent you can in 2 hours and compete for $20k+ in prizes.
Seamlessly switch accents mid-sentence with Eleven v3 Audio Tags. Emulate American, British, French, and more for dynamic, culturally rich AI speech.