
Scribe v2 vient d’être amélioré
- Catégorie
- Développeur
- Date
Scribe v2 Realtime est la reconnaissance vocale en temps réel la plus précise, avec une latence de 150 ms et plus de 90 langues prises en charge. Disponible via l’API.
Ultra-rapide, ultra-précis, conçu pour la parole en direct. Scribe v2 Realtime offre une transcription instantanée pour les usages en temps réel.
Scribe v2 Realtime atteint une précision de transcription inégalée avec environ 150 ms de latence, même dans des conditions audio difficiles ou avec des accents variés.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Une transcription efficace même dans le bruit, avec musique de fond, accents marqués et audio de faible qualité.
Basé sur Scribe v1, Scribe v2 Realtime atteint environ 150 ms de latence avec une précision inédite sur les accents, les tons et tous les environnements.

Scribe v2 Realtime est conçu pour les développeurs qui créent des agents conversationnels, des assistants de réunion et des applications vocales où la rapidité et la précision sont essentielles.
Scribe v2 Realtime utilise la transcription prédictive pour anticiper les mots et la ponctuation les plus probables – garantissant une précision en temps réel.
Détecte le début et la fin de la parole, segmente l’audio précisément pour une transcription fluide et efficace en temps réel.
Permet aux développeurs de choisir quand finaliser les transcriptions – idéal pour le streaming personnalisé et une précision ajustée.
Compatible avec l’audio PCM (8–48 kHz) et l’encodage μ-law pour la téléphonie, les navigateurs et les studios.
Scribe v2 pour les usages en volume, et Scribe v2 Realtime pour les besoins à faible latence

Précision maximale, conçu pour les traitements par lots.

Latence minimale, pour les usages en temps réel.
Une précision exceptionnelle, quels que soient les accents, dialectes ou conditions d’enregistrement.
Modifiez le languageCode pour prévisualiser les langues
import { useScribe } from "@elevenlabs/react";
const scribe = useScribe({
modelId: "scribe_v2_realtime",
languageCode: , // Définir la langue
onSessionStarted: () =>
console.log("Session started"),
onPartialTranscript: (data) =>
console.log("Partial:", data.text)
});“Du doublage de Reels dans des langues locales à la création de musiques et de voix de personnages dans Horizon, la plateforme ElevenLabs permet aux créateurs, entreprises et organisations du monde entier de travailler la voix, la musique et le son à grande échelle.”
“La précision inégalée de Scribe dans autant de langues permet à Fieldy de comprendre chaque conversation quotidienne et de se développer facilement à l’international. Fieldy a augmenté la fidélité de ses utilisateurs de 50 % après être passé à ElevenLabs Scribe.”
“ElevenLabs nous a permis d’intégrer rapidement des fonctionnalités puissantes de Text to Speech à notre SDK, pour que les Agents répondent en temps réel avec des voix expressives aux questions des utilisateurs ou en retour sur ce qu’ils voient.”

“Twilio a intégré la technologie de voix IA générative d’ElevenLabs à sa CPaaS, améliorant ConversationRelay. Cette intégration permet aux entreprises et développeurs de créer des interactions vocales IA conversationnelles, naturelles, expressives et en temps réel directement depuis la plateforme CPaaS de Twilio. Chez ElevenLabs, nous sommes ravis que Twilio ait choisi ElevenLabs pour enrichir ConversationRelay avec les voix les plus expressives et naturelles disponibles.”

Profitez d’une précision et d’une réactivité de pointe avec des tarifs adaptés aussi bien aux start-ups qu’aux équipes en entreprise.
0,28 $ de l’heure et moins
avec les offres Business annuelles









