Avec la sortie de Eleven v3, l'audio prompting est devenu une compétence essentielle. Au lieu de taper ou coller les mots que vous voulez que la voix IA dise, vous pouvez maintenant utiliser une nouvelle capacité — Tags Audio — pour tout contrôler, de l'émotion à la livraison.
Eleven v3 est une version alpha aperçu de recherche du nouveau modèle. Cela nécessite plus d'ingénierie de promptque les modèles précédents — mais les générations sont époustouflantes.
Les Tags Audio d'ElevenLabs sont des mots entre crochets que le nouveau modèle Eleven v3 peut interpréter et utiliser pour diriger l'action audible. Ils peuvent être [excité], [chuchote], et [soupire] jusqu'à [coup de feu], [applaudissements] et [explosion].
Les Tags Audio vous permettent de façonner le son des voix IA, y compris les indices non verbaux comme le ton, les pauses et le rythme. Que vous créiez des livres audio immersifs, des personnages interactifs ou des médias axés sur le dialogue, ces outils simples au niveau du script vous donnent un contrôle précis sur l'émotion et la livraison.
Vous pouvez placer des Tags Audio n'importe où dans votre script pour façonner la livraison en temps réel. Vous pouvez également utiliser des combinaisons de tags dans un script ou même une phrase. Les tags se répartissent en catégories principales :
Émotions
Ces tags peuvent vous aider à définir le ton émotionnel de la voix — qu'il soit sombre, intense ou joyeux. Par exemple, vous pourriez utiliser une ou une combinaison de [triste], [en colère], [joyeusement] et [chagriné].