Présentation de Scribe v2

Aujourd'hui, nous présentons Scribe v2 : le modèle de transcription le plus précis jamais lancé, avec prise en charge de plus de 90 langues.

Introducing Scribe v2

Scribe v2 est conçu pour la transcription par lots, le sous-titrage et le sous-titrage à grande échelle. Il améliore la stabilité et la précision de Scribe v1, avec une meilleure gestion des audios longs, des pauses, des changements de ton et des silences prolongés.

Introducing Scribe v2

Alors que Scribe v2 Realtime est optimisé pour une latence ultra-faible et les cas d'utilisation des agents, Scribe v2 est optimisé pour les enregistrements longs et complexes, maintenant la précision à travers divers locuteurs, accents et styles de livraison. Le résultat est des transcriptions constamment fiables dans une large gamme de conditions audio réelles.


Scribe v2 atteint le taux d'erreur de mots le plus bas enregistré sur les benchmarks standard de l'industrie.

Scribe v2 FLEURS benchmark

Saisie de termes clés pour une transcription contextuelle

La saisie de termes clés va au-delà du vocabulaire personnalisé standard en utilisant le contexte de la transcription. Sélectionnez jusqu'à 100 mots ou expressions, et Scribe v2 décidera avec précision quand transcrire ces termes. Cela le rend bien adapté aux domaines techniques, aux noms de marque et au langage spécifique à l'industrie.

Scribe v2 keyterm prompting

Détection d'entités intégrée avec des horodatages précis

Scribe v2 inclut la détection native d'entités pour une analyse audio structurée.

Vous pouvez sélectionner jusqu'à 56 catégories couvrant les informations personnellement identifiables, les données de santé ou les détails de paiement. Scribe v2 détectera automatiquement ces instances et leurs horodatages exacts dans votre transcription, facilitant ainsi la révision, la censure ou le traitement des informations sensibles à grande échelle.

En savoir plus dans la documentation de l'API : https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection

Transcription automatique multilingue

Scribe v2 prend en charge les workflows multilingues intelligents dès le départ.

Vous pouvez envoyer un audio contenant plusieurs langues dans un seul fichier. Le modèle détecte automatiquement chaque langue et la transcrit correctement sans segmentation ou configuration manuelle.

Fonctionnalités supplémentaires pour les workflows de production

Scribe v2 inclut un ensemble de fonctionnalités conçues pour les cas d'utilisation des entreprises et des développeurs :

  • Diarisation intelligente des locuteurs pour un étiquetage clair et intuitif des locuteurs
  • Horodatages précis au niveau des mots pour un alignement précis des sous-titres et des expériences interactives
  • Étiquetage audio dynamique qui détecte les événements non vocaux tels que les rires ou les pas
  • Prêt pour l'entreprise avec conformité SOC 2, ISO 27001, PCI DSS L1, HIPAA et RGPD, résidence des données dans l'UE et en Inde, et prise en charge du mode sans rétention

Scribe v2, maintenant dans ElevenLabs Studio

Scribe v2 est maintenant utilisé dans ElevenLabs Studio pour des sous-titres, légendes et transcriptions plus précis, soutenant les équipes qui gèrent de grandes bibliothèques audio et vidéo dans les cas d'utilisation de marketing, médias, recherche, formation et conformité.

Scribe v2 in Studio

Essayez-le maintenant : https://elevenlabs.io/app/studio

Construisez avec l'API

Avec Scribe v2, les développeurs et les entreprises peuvent automatiser des pipelines audio complexes, améliorer la précision dans les workflows de contenu mondiaux et évoluer en toute sécurité avec une conformité totale et des contrôles de résidence des données.

Scribe v2 Keyterm prompting code snippet

Scribe v2 est disponible dès aujourd'hui via notre API et notre plateforme Creative.

Essayez-le maintenant : https://elevenlabs.io/app/speech-to-text

Lisez la documentation : https://elevenlabs.io/docs/capabilities/speech-to-text

Inscrivez-vous ici : https://elevenlabs.io/speech-to-text

Découvrez les articles de l'équipe ElevenLabs

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter