Scribe-Vergleich mit OpenAIs 4o Speech to Text Modell

Einen Monat nach dem Start beweist Scribe, dass es das fortschrittlichste Speech to Text-Modell der Branche ist.

In nur einem Monat seit dem Start hat unser Speech to Text-Modell Scribe Tausende von Unternehmen mit seiner branchenführenden Genauigkeit angezogen. Von Medienuntertiteln bis zu Callcentern und medizinischen Transkriptionen ist Scribe schnell zum bevorzugten Modell für Entwickler geworden.

Branchenführende Leistung

Mehrere unabhängige Analysen bestätigten unsere eigenen Genauigkeitsbenchmarks, wobei Scribe alle Modelle übertrifft, einschließlich der neuen 4o-Transkriptionsmodelle von OpenAI. Zum Beispiel zeigt ein Benchmark von Artificial Analysis, dass Scribe sowohl 4o als auch 4o mini Transkript in der Wortfehlerrate im Durchschnitt übertrifft:

  • 4o Transkript macht 16% mehr Fehler als Scribe
  • 4o mini Transcribe macht 71% mehr Fehler als Scribe

DIAGRAMM EINFÜGEN

Scribe übertrifft oder ist gleichauf mit den 4o & 4o mini Transkriptionsmodellen in OpenAIs eigenem Benchmark bei 11 der 15 getesteten Sprachen. Betrachtet man zum Beispiel Japanisch und Hindi, ist Scribe in OpenAIs eigenen Benchmarks deutlich besser als beide 4o-Modelle:

  • Bei Japanisch macht OpenAIs 4o Speech to Text Modell 55% mehr Fehler als Scribe und 105% mehr Fehler bei ihrem 4o mini Modell
    • OpenAIs 4o Speech to Text-Modell macht 55% mehr Fehler als Scribe
    • Ihr 4o mini Modell macht 105% mehr Fehler als Scribe
  • Hindi:
    • OpenAIs 4o Speech to Text-Modell macht 18% mehr Fehler als Scribe
    • Ihr 4o mini Modell macht 37% mehr Fehler als Scribe

Wir haben Entscheidungen mit Scribe getroffen, um für Kunden so nützlich wie möglich zu sein, auch wenn dies zu Inkonsistenzen in Branchenbenchmarks führen kann. Zum Beispiel:

  1. Scribe erfasst Zahlen als „eins“ „zwei“ „drei“, was für Transkripte nützlicher ist, während der FLEURS-Benchmark die tatsächlichen Zahlen „1“, „2“, „3“ verwendet, was zu Fehlern führt
  2. Scribe kann Wörter wie „äh“ „hm“ „hey“ erkennen, eine weitere nützliche Funktion für Kunden, um mehr Kontext zu erhalten, aber diese Wörter sind nicht Teil der Benchmarks, was erneut zu künstlichen Fehlern führt

Deshalb ist es hilfreich, die Endergebnisse zu betrachten, wenn man über Leistung nachdenkt. Zum Beispiel hat OpenAIs 4o Speech to Text Modell in Benchmarks eine ähnliche Leistung wie Scribe. Der Vergleich englischer Transkripte hebt jedoch Scribes fortschrittliche Fähigkeiten hervor.House of Dragons Trailers von HBO macht Scribe keinen Fehler, erfasst Soundeffekte und beschriftet sie korrekt, was ein immersives Transkript erstellt.

Journalisten kommentieren unvergessliche Spielzüge von Messi

 / 

In dieser Transkriptanalyse einer

ElevenLabs’s Scribe (Zeit zur Erstellung des Transkripts: 4,66s)Messi. Messi! Was? Meinen Sie das ernst? Ein Kunstwerk. Dieser Mann ist absolut direkt verbunden mit purer Fußballmagie. Alba innen. Es ist Messi! Oh, nein! Nein! Wieder, kommt der Medizinmann und senkt seinen flammenden Speer.

Darf ich den ehrenwerten Herrn fragen

OpenAI’s 4o (Zeit zur Erstellung des Transkripts: 5,01s)Messi! Meinen Sie das ernst?! Dieser Mann ist absolut verrückt, wie die pure Fußballmagie! Alba innen, es ist Messi! Wieder! Der Medizinmann kommt und

Darf ich den ehrenwerten Herrn fragenbritische ParlamentsanhörungEntschuldigung

Barrierefreiheit mit Stottertranskription

Mit jedem Fortschritt in der KI profitiert eine oft übersehene Gruppe enorm: Menschen, die stottern. Stottern, eine genetische Sprachstörung, die etwa 1% der Bevölkerung betrifft, stellt automatische Spracherkennungssysteme (ASR) vor einzigartige Herausforderungen. In einer Studie mit Testproben, bei denen in fast jedem vierten Wort Stottern auftrat, ist die Leistung von Scribe mit durchschnittlich 98,7% Genauigkeit besonders beeindruckend. Dies beweist erneut, dass Scribe die Branche anführt und ein Modell bietet, das auf alle Unternehmensbedürfnisse zugeschnitten ist. (Zeit zur Erstellung des Transkripts: 4,66s)Hört, hört. (Gemurmel der Menge) Es tut mir leid, es muss etwas mit meinem antipodischen Hintergrund zu tun haben. Könnte er bitte die Frage wiederholen, da ich sie nicht verstanden habe?(Lachen der Menge) Wow. Oh, wow. Heute sehr beliebt. Ähm, ich- ich sagte, dass- dass eine Anzahl von parlamentarischen Kollegen mit Behinderungen es ziemlich schwierig finden, sich in bestimmten Teilen des Anwesens zurechtzufinden. Da wir diese Renovierungsarbeiten durchführen, was kann getan werden, um sicherzustellen, dass diejenigen mit Behinderung sich freier bewegen können und der Ort zugänglich ist?Herr Paul. (Lachen der Menge) Es tut mir wirklich leid. Könnte er es bitte sehr langsam auf antipodischem Englisch tun? Danke. Geben Sie einfach irgendeine Antwort. Ich- ich denke, die Antwort... Ich denke, die Antwort könnte helfen wenn Sie schriftlich antworten könnenwenn Sie lesen, Herr Sprecher. Richtig, Chris Elmore. (lacht) Danke, Herr stellvertretender Sprecher, ich- ich werde es beim ersten Versuch versuchen.(Gemurmel der Menge) Oh, nein. Sie sind Waliser. Kann ich- kann ich- kann ich- weil ich Waliser bin, so Gott helfe ihm.

Lösungen für Unternehmen

Die Leistung von Scribe wird mit seinem Funktionsumfang lebendig, der auf die Bedürfnisse von Unternehmenskunden zugeschnitten ist. (Zeit zur Erstellung des Transkripts: 5,01s)Entschuldigung, es muss etwas mit meinem antipodischen Hintergrund zu tun haben. Könnte er bitte die Frage wiederholen, da ich sie nicht verstanden habe?Nun, heute sehr beliebt. Ich sehe, dass eine Anzahl von parlamentarischen Kollegen mit Behinderungen es ziemlich schwierig finden, sich in bestimmten Teilen des Anwesens zurechtzufinden. Da wir diese Renovierungsarbeiten durchführen, was kann getan werden, um sicherzustellen, dass diejenigen mit Behinderung sich freier bewegen können und der Ort zugänglich ist?Es tut mir wirklich leid. Bitte, könnten Sie es sehr langsam auf antipodischem Englisch machen?Ich denke, die Antwort könnte helfen wenn Sie schriftlich antworten könnenwenn Sie es lesen werden. Danke, Herr stellvertretender Sprecher. Ich werde es beim ersten Versuch versuchen. Weil ich Waliser bin, so Gott helfe ihm.

Die Leistung von Scribe wird mit seinem Funktionsumfang lebendig, der auf die Bedürfnisse von Unternehmenskunden zugeschnitten ist.

Heute starten

  • Probieren Sie Scribe heute aus
  • Intelligente Sprecher-Diarisierung ermöglicht es Ihnen, Besprechungen, Verkaufsgespräche oder Kundensupport-Anrufe zusammenzufassen, um die präzisesten und umsetzbarsten Einblicke zu erhalten und die Zusammenarbeit und Schulung in Ihrem Team zu verbessern
  • unser Vertriebsteam zu kontaktieren
  • Unterstützung für 99 Sprachen, erreichen Sie die Welt mit einer einzigen Integration
  • Alle diese Funktionen sind in unserer API verfügbar, sodass Entwickler ohne Kompromisse bauen können
  • Eine Echtzeit-Streaming-Version von Scribe, zusammen mit einer Version mit niedriger Latenz, ist ebenfalls für die kommenden Wochen geplant. Dies wird Scribe als das fortschrittlichste Speech to Text-Modell aller Zeiten festigen, das alle Ihre geschäftlichen Anwendungsfälle abdeckt und Ihnen mehr Auswahl und Flexibilität zwischen Geschwindigkeit, Preis und Genauigkeit bietet.

Lösungen für Unternehmen

Scribes Leistung wird durch seine Funktionen lebendig, die auf die Bedürfnisse von Unternehmenskunden zugeschnitten sind.unser Vertriebsteam zu kontaktieren, wir richten gerne eine Demo ein und zeigen Ihnen, wie wir Ihrem Unternehmen helfen können.

Mehr entdecken

ElevenLabs

AI-Audioinhalte in höchster Qualität generieren

Kostenlos registrieren

Haben Sie bereits ein Konto? Anmelden