
Eleven v3 Audio Tags: Emulating accents with precision
Seamlessly switch accents mid-sentence with Eleven v3 Audio Tags. Emulate American, British, French, and more for dynamic, culturally rich AI speech.
Présentation de Eleven v3 Alpha
Essayez v3Le Voice Cloning professionnel offre une opportunité de commodité et de cohérence pour divers cas d'utilisation audio
Nous sommes fiers de rendre notre modèle de Professional Voice Cloning (PVC) accessible au grand public. Auparavant réservé à nos clients entreprises, nous ouvrons maintenant l'accès à tous, vous permettant de créer une copie numérique parfaite de votre propre voix, pratiquement indiscernable de l'originale.
Nous avons permis aux utilisateurs de télécharger leurs données vocales en mars et promis de publier les voix sur la base du premier arrivé, premier servi en juillet - elles sont enfin là.
PVC est gratuit pour tous ceux qui ont le plan Creator ou supérieur. De plus, votre voix PVC peut aussi parler automatiquement toutes les langues prises en charge par Eleven Multilingual v1 !
Pour accéder à PVC, allez simplement sur VoiceLab, cliquez sur « ajouter une nouvelle voix » et sélectionnez Professional Voice Cloning. Contrairement à notre fonction de clonage instantané, PVC implique l'entraînement d'un modèle dédié sur un grand ensemble de données d'échantillons vocaux - 30 minutes minimum, avec 3 heures étant optimal.
Pour garantir une sortie de la plus haute fidélité, il y a quelques points à garder à l'esprit lors de la préparation de vos échantillons pour le réglage fin.
Tout d'abord, assurez-vous que les données d'entraînement comprennent des fichiers audio propres d'un seul locuteur sans bruit de fond, musique ou autres effets. Tout son non vocal peut perturber le modèle et se retrouver dans la sortie. Si vous téléchargez plusieurs fichiers audio enregistrés lors de sessions distinctes, assurez-vous de faire correspondre les conditions d'enregistrement aussi étroitement que possible - des différences notables de réverbération ou de distance au microphone, etc., pollueront également la sortie.
Il en va de même pour votre style de parole - votre style de livraison doit être uniforme sur tous les échantillons que vous téléchargez. Par exemple, si vous prévoyez d'utiliser votre voix pour enregistrer un livre audio, les données d'entraînement doivent comprendre des enregistrements de vous lisant dans le style de livraison d'un livre audio.
PVC est intégré à tous nos modèles, y compris Eleven Multilingual v1. Si vous parlez l'une des langues qu'il prend en charge, vous pouvez créer une réplique parfaite de votre voix et la faire parler toutes les autres langues aussi !
Nous exécutons le modèle au moins une fois par mois, selon le nombre de demandes, avec des accélérations supplémentaires prévues vers la fin du trimestre.
Pour garantir une utilisation sûre de notre technologie et maintenir des directives strictes de confidentialité et d'éthique, nous avons intégré des mesures de sécurité robustes pour nous assurer que vous pouvez uniquement cloner votre propre voix.
Une fois que vous téléchargez vos données vocales pour l'entraînement, une étape de vérification suit. Vous recevez une invite captcha texte. Vous devez ensuite la lire à haute voix en 10 secondes. Nous validons votre demande en comparant le profil vocal de cet enregistrement avec la voix contenue dans les données que vous avez téléchargées.
S'il y a correspondance, votre demande est envoyée pour le réglage fin. Sinon, il vous reste 4 tentatives de vérification. Si elles sont toutes invalides, vous devrez nous contacter via notre centre d'aide pour faire vérifier votre voix manuellement.
À moins que vous ne décidiez de la partager, votre voix vous appartient et n'est disponible que pour vous.
Professional Voice Cloning va au-delà de la simple commodité et offre une gamme d'avantages pour vos projets personnels et commerciaux. Voici quelques exemples :
Professional Voice Cloning permet un meilleur contrôle de la façon dont vous vous représentez numériquement. C'est plus qu'une simple réplication de voix - c'est une opportunité de commodité et de cohérence à travers une variété d'utilisations audio !
Seamlessly switch accents mid-sentence with Eleven v3 Audio Tags. Emulate American, British, French, and more for dynamic, culturally rich AI speech.
Fine-grained control over timing, rhythm, and emphasis with Eleven v3 Audio Tags. Transform flat delivery into dynamic, performative content.