Comparaison de Scribe avec le modèle 4o Speech to Text d'OpenAI

Un mois après son lancement, Scribe continue de prouver qu'il est le modèle de reconnaissance vocale le plus avancé de l'industrie.

En seulement un mois depuis le lancement, notre modèle de reconnaissance vocale Scribe a attiré des milliers d'entreprises grâce à sa précision inégalée dans l'industrie. Des sous-titres médias aux centres d'appels et transcriptions médicales, Scribe est rapidement devenu le modèle préféré des développeurs.

Performance inégalée dans l'industrie

De nombreuses analyses tierces ont confirmé nos propres critères de précision, Scribe surpassant tous les modèles, y compris les nouveaux modèles 4o d'OpenAI. Par exemple, un benchmark de Artificial Analysis révèle que Scribe surpasse à la fois 4o et 4o mini en termes de taux d'erreur de mots, en moyenne :

  • 4o transcribe fait 16 % d'erreurs de plus que Scribe
  • 4o mini transcribe fait 71% d'erreurs de plus que Scribe

INSÉRER GRAPHIQUE

Scribe surpasse également ou est à égalité avec les modèles de transcription 4o et 4o mini dans le benchmark de lancement d'OpenAI, pour 11 des 15 langues testées. En regardant le japonais et l'hindi par exemple, Scribe est meilleur que les deux modèles 4o d'OpenAI par des marges significatives, dans les benchmarks d'OpenAI :

  • En japonais, le modèle de reconnaissance vocale 4o d'OpenAI fait 55% d'erreurs de plus que Scribe, et 105% d'erreurs de plus pour leur modèle 4o mini
    • Le modèle de reconnaissance vocale 4o d'OpenAI fait 55 % d'erreurs de plus que Scribe
    • Leur modèle 4o mini fait 105 % d'erreurs de plus que Scribe
  • Hindi :
    • Le modèle de reconnaissance vocale 4o d'OpenAI fait 18 % d'erreurs de plus que Scribe
    • Leur modèle 4o mini fait 37 % d'erreurs de plus que Scribe

Nous avons pris des décisions avec Scribe pour être aussi utile que possible pour les clients, même si cela peut créer des incohérences dans les benchmarks de l'industrie. Par exemple :

  1. Scribe capture les chiffres comme « un » « deux » « trois » ce qui est plus utile pour les transcriptions, cependant le benchmark FLEURS utilise les chiffres réels « 1 », « 2 », « 3 », créant ainsi des erreurs
  2. Scribe est capable de détecter des mots comme « hum » « ha » « hey », une autre fonctionnalité utile pour les clients pour obtenir plus de contexte, mais ces mots ne font pas partie des benchmarks, créant à nouveau des erreurs artificielles

C'est pourquoi il est utile de regarder les résultats finaux lorsqu'on pense à la performance. Par exemple, en anglais, le modèle 4o Speech to Text d'OpenAI a une performance similaire à Scribe dans les benchmarks. Cependant, comparer les transcriptions anglaises met vraiment en lumière les capacités avancées de Scribe. Dans l'analyse ci-dessous des commentateurs sportifs, Scribe ne fait aucune erreur et capture correctement les significations.bande-annonce de House of Dragons de HBO, Scribe ne fait aucune erreur, capte les effets sonores et les étiquette correctement, créant une transcription immersive.

Les journalistes commentent les actions mémorables de Messi

 / 

Scribe d'ElevenLabs

Messi est là ! C'est pour ça qu'ils sont venus. Messi. Messi ! Quoi ? Vous plaisantez ? Une œuvre d'art. Cet homme est absolument connecté à la pure magie du football. Alba à l'intérieur. C'est Messi ! Oh, non ! Encore, le guérisseur arrive et plante sa lance enflammée.

OpenAI’s 4o

Le chaos de Messi ! C'est pour ça qu'ils sont venus ! Messi ! Vous plaisantez ?! Cet homme est absolument fou, comme la pure magie du football ! Alba à l'intérieur, c'est Messi ! Encore ! Le guérisseur arrive et

Audience parlementaire britanniqueaudition parlementaire britannique Les petites gens de King's Landing écoutent. Ils ont faim. Notre cadeau est envoyé. Donnez-le-moi ! Vos Grâces, nous devons partir. Allons-y.

Solutions pour les entreprises

Avec chaque avancée de l'IA, un groupe souvent négligé en profite énormément : les personnes qui bégaient. Le bégaiement, un trouble génétique de la parole qui affecte environ 1% de la population, pose des défis uniques pour les systèmes de reconnaissance vocale automatique (ASR). Dans une étude avec des échantillons de test où le bégaiement apparaissait dans près d'un mot sur quatre, la performance de Scribe est particulièrement impressionnante avec une précision moyenne de 98,7%. Cela prouve encore une fois que Scribe est leader de l'industrie et offre un modèle adapté à tous les besoins des entreprises. (Temps pris pour créer la transcription : 4,66s)Entendu, entendu. (murmures de la foule) Je suis désolé, cela doit avoir quelque chose à voir avec mon origine antipodéenne. Pourrait-il répéter la question, car je ne l'ai pas suivie ?(rires de la foule) Wow. Oh, wow. Très populaire aujourd'hui. Euh, je- je disais que- qu'un certain nombre de collègues parlementaires qui ont des handicaps trouvent assez difficile de se déplacer dans certaines parties du domaine. Étant donné que nous faisons ces travaux de rénovation, que peut-on faire pour s'assurer que ceux qui ont un handicap peuvent se déplacer plus librement et que l'endroit est accessible ?M. Paul. (rires de la foule) Je suis vraiment désolé. Pourrait-il le faire très lentement en anglais antipodéen ? Merci. Donnez n'importe quelle vieille réponse. Je- je pense que la réponse... Je pense que la réponse pourrait être aidée si vous pouvez répondre par écritquand vous lirez, M. le Président. D'accord, Chris Elmore. (rires) Merci, M. le Vice-Président, je vais essayer dès le premier coup.(murmures de la foule) Oh, non. Vous êtes gallois. Puis-je- puis-je- puis-je- parce que je suis gallois, alors que Dieu l'aide.

INCLURE LE GRAPHIQUE DE MISE À JOUR DE JACK

Commencez dès aujourd'hui (Temps pris pour créer la transcription : 5,01s)Désolé, cela doit avoir quelque chose à voir avec mon origine antipodéenne. Pourrait-il répéter la question, car je ne l'ai pas suivie ?Eh bien, très populaire aujourd'hui. Je vois qu'un certain nombre de collègues parlementaires qui ont des handicaps trouvent assez difficile de se déplacer dans certaines parties du domaine. Étant donné que nous faisons ces travaux de rénovation, que peut-on faire pour s'assurer que ceux qui ont un handicap peuvent se déplacer plus librement et que l'endroit est accessible ?Je suis vraiment désolé. Pourriez-vous le faire très lentement en anglais antipodéen ?Je pense que la réponse pourrait être aidée si vous pouvez répondre par écritquand vous le lirez. Merci, M. le Vice-Président. Je vais essayer dès le premier coup. Parce que je suis gallois, alors que Dieu l'aide.

La performance de Scribe prend vie avec son ensemble de fonctionnalités adaptées pour répondre aux besoins des clients d'entreprise.

Puis-je demander à l'hon. Monsieur

  • Des horodatages précis au niveau mondial débloquent une valeur énorme pour les créateurs, les médias et le divertissement, transformant vos transcriptions en sous-titres, entrées consultables et traductions précises
  • La diarisation intelligente des intervenants vous permet de résumer les réunions, les présentations commerciales ou les appels de support client pour obtenir les informations les plus précises et exploitables et augmenter la collaboration et la formation au sein de votre équipe
  • Le marquage audio dynamique vous donne plus de contenu et de contexte à partir de votre entrée audio pour permettre par exemple l'analyse des sentiments
  • Support pour 99 langues, atteignez facilement le monde avec une seule intégration
  • Toutes ces fonctionnalités sont disponibles dans notre API, permettant aux développeurs de construire sans compromis
  • Une version de streaming en temps réel de Scribe, ainsi qu'une version à faible latence, sont également prévues pour les semaines à venir. Cela consolidera Scribe comme le modèle de reconnaissance vocale le plus avancé jamais créé, couvrant tous vos cas d'utilisation commerciale, et vous offrant plus de choix et de flexibilité entre vitesse, prix et précision.

Solutions pour les entreprises

La performance de Scribe prend vie avec son ensemble de fonctionnalités adaptées pour répondre aux besoins des clients d'entreprise.contacter notre équipe commerciale, nous serons ravis de vous organiser une démonstration et de vous montrer comment nous pouvons aider votre entreprise.

En voir plus

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter