
Eleven v3 Audio Tags: Bringing multi-character dialogue to life
Create dynamic multi-character dialogue with Eleven v3 Audio Tags. Script overlapping voices, interruptions, and emotional shifts for natural, human-like AI conversations.
Présentation de Eleven v3 Alpha
Essayez v3Jamie remplace sa pipeline personnalisée par ElevenLabs Scribe pour améliorer la précision, et constate une amélioration de vitesse de 3x
Jamie is an AI assistant for meetings that generates summaries and delivers key insights. The team built a custom LLM pipeline to summarize conversations, extract action items, and highlight decisions.
Pour obtenir des transcriptions précises, ils ont testé tous les principaux fournisseurs de Speech-to-Text (STT) — mais aucun ne répondait à leurs normes pour la transcription et la diarisation des locuteurs. Ils ont fini par créer leur propre pipeline, combinant des modèles open-source pour la diarisation et d'autres pour la transcription. Le maintenir nécessitait un effort d'ingénierie considérable.
Cela a changé avec le lancement de ElevenLabs Scribe. Jamie l'a testé immédiatement, et les résultats étaient clairs : Scribe gérait mieux les discours qui se chevauchent, les interruptions et les événements audio non verbaux que les autres modèles. L'intégration a pris seulement quelques jours, avec peu de personnalisations nécessaires. En passant à Scribe, Jamie a considérablement réduit la charge d'ingénierie tout en améliorant la qualité des transcriptions.
Le changement a eu un impact immédiat sur l'entreprise. Les plaintes concernant les erreurs de locuteur ont disparu. La vitesse de transcription a triplé — une réunion d'une heure est maintenant traitée en 30 à 45 secondes. Cela a aidé les utilisateurs à atteindre leur moment “aha” plus rapidement, ce qui a augmenté à la fois l'activation et le nombre de réunions enregistrées par utilisateur.
Scribe a également fourni ces résultats dans plusieurs langues, y compris l'anglais, l'allemand, l'espagnol et le néerlandais.
"Passer à Scribe a considérablement amélioré la qualité de notre produit. La capacité à capturer avec précision les dynamiques de conversation nuancées, même dans des environnements audio difficiles, s'est directement traduite par des clients plus satisfaits et de meilleures informations sur les réunions."
— Egor Spirin, Responsable Produit & Ingénierie, meetjamie.ai
Scribe est le premier modèle à combiner une haute précision de transcription et de diarisation — dès le départ — à un prix compétitif. Jamie n'a plus besoin de maintenir un pipeline complexe. Avec Scribe, ils ont simplifié les opérations et amélioré l'expérience produit pour chaque utilisateur.
Create dynamic multi-character dialogue with Eleven v3 Audio Tags. Script overlapping voices, interruptions, and emotional shifts for natural, human-like AI conversations.
Learn how Voice Cloning works, how to use it, and how to get started.