Passer au contenu

Scribe v2 vient d’être amélioré

Scribe v2 Upgrade 1 1

Nous ajoutons le masquage d’entités intégré, une meilleure transcription Indic-Anglais, un nouveau mode Sans Verbatim et la saisie de mots-clés étendue jusqu’à 1 000 termes.

Ces améliorations offrent aux développeurs plus de contrôle sur la confidentialité, la précision multilingue, la qualité des transcriptions et la précision sur des domaines spécifiques.

Nouveau masquage d’entités dans Scribe v2

Scribe v2 peut désormais détecter et masquer automatiquement les entités sensibles dans les transcriptions – y compris les noms, numéros de carte bancaire, numéros de sécurité sociale et autres informations personnelles identifiables.

Le masquage a lieu pendant la transcription. Les données sensibles sont supprimées avant d’atteindre votre stockage ou d’autres systèmes.

  • Masquage complet : remplace les entités par [REDACTED] ;
  • Catégorisé : remplace par le type d’entité, par exemple [CREDIT_CARD] ;
  • Numéroté : remplace par une étiquette catégorisée et numérotée, par exemple [CREDIT_CARD_1].

C’est particulièrement utile pour les équipes dans la santé, la finance ou le support client, où la conformité impose de traiter les données personnelles avant de stocker ou partager les transcriptions.

Transcription précise du code-switching Indic-Anglais

En Inde, il est courant de mélanger l’anglais avec l’hindi, le télougou, le kannada et d’autres langues indiennes. Beaucoup de systèmes de transcription translittèrent les mots anglais en écriture indienne, produisant des transcriptions qui ne reflètent pas la réalité des échanges.

Scribe v2 transcrit les mots anglais en anglais, quel que soit le reste de la langue. Cela fonctionne automatiquement, sans configuration de langue. Que vous indiquiez l’anglais, l’hindi ou aucun code langue, les mots anglais restent en alphabet latin.

Cela s’applique à toutes les langues indiennes, pas seulement à l’hindi-anglais. Si une personne passe du télougou à l’anglais ou du kannada à l’anglais, les parties en anglais sont correctement transcrites.

Mode Sans Verbatim pour des transcriptions épurées

Nous lançons le mode Sans Verbatim, un réglage de transcription qui supprime automatiquement les mots de remplissage comme « euh » ou « hum », ainsi que les répétitions et les bégaiements.

Vous obtenez ainsi une transcription claire et lisible, sans retouche manuelle ni post-traitement.

Le mode Sans Verbatim est idéal pour les comptes-rendus de réunion, les sous-titres et tout workflow où l’objectif est un texte soigné plutôt qu’une capture brute de chaque son.

Saisie de mots-clés étendue à 1 000

La saisie de mots-clés prend désormais en charge jusqu’à 1 000 mots et expressions par transcription, contre 100 auparavant.

Cela permet aux équipes qui travaillent avec de grands vocabulaires techniques, des catalogues produits ou des termes spécialisés de mieux guider le modèle vers une transcription précise.

La saisie de mots-clés reste contextuelle. Le modèle utilise l’audio environnant pour déterminer si un mot-clé s’applique, au lieu de l’insérer systématiquement. Avec 1 000 termes, c’est 10 fois plus qu’avant.

Remarque : Les requêtes avec plus de 100 mots-clés ont une unité minimale de facturation de 20 secondes.

Disponible dès maintenant

Ces fonctionnalités sont disponibles dès aujourd’hui dans l’API et l’interface de Scribe v2.

Consultez la documentation :
https://elevenlabs.io/docs/cookbooks/speech-to-text/quickstart

Essayez-le dans l’application :
https://elevenlabs.io/app/speech-to-text

Découvrez les articles de l'équipe ElevenLabs

Créez avec l'audio IA de la plus haute qualité