Question 1

Quelles langues Scribe prend-il en charge ?

Accepted Answer

Excellente précision (≤ 5 % de taux d'erreur de mots - WER)
Bulgare, Catalan, Tchèque, Danois, Néerlandais, Anglais, Finnois, Français, Galicien, Allemand, Grec, Hindi, Indonésien, Italien, Japonais, Kannada, Malais, Malayalam, Macédonien, Norvégien, Polonais, Portugais, Roumain, Russe, Serbe, Slovaque, Espagnol, Suédois, Turc, Ukrainien, Vietnamien

Haute précision (>5 % à ≤10 % WER)
Bengali, Biélorusse, Bosnien, Cantonais, Estonien, Philippin, Gujarati, Hongrois, Kazakh, Letton, Lituanien, Mandarin, Marathi, Népalais, Odia, Persan, Slovène, Tamoul, Télougou

Bonne (>10 % à ≤25 % WER)
Afrikaans, Arabe, Arménien, Assamese, Asturien, Azerbaïdjanais, Birman, Cebuano, Croate, Géorgien, Haoussa, Hébreu, Islandais, Javanais, Kabuverdianu, Coréen, Kirghiz, Lingala, Maltais, Mongol, Māori, Occitan, Pendjabi, Sindhi, Swahili, Tadjik, Thaï, Ourdou, Ouzbek, Gallois

Modérée (>25 % à ≤50 % WER)
Amharique, Chichewa, Peul, Ganda, Igbo, Irlandais, Khmer, Kurde, Lao, Luxembourgeois, Luo, Sotho du Nord, Pachto, Shona, Somali, Umbundu, Wolof, Xhosa, Zoulou

Question 2

Qu'est-ce que la transcription de la parole en texte en anglais et comment ça fonctionne ?

Accepted Answer

La transcription de la parole en texte est une technologie qui transcrit l'anglais parlé en texte écrit en utilisant la reconnaissance automatique de la parole (ASR). Elle traite les signaux audio, identifie les motifs de parole et les transcrit en texte avec une grande précision.

Le logiciel de transcription de la parole en texte d'ElevenLabs, alimenté par l'IA, est conçu pour transcrire le contenu audio et vidéo avec une précision proche de celle d'un humain, ce qui le rend idéal pour la conversion de la voix en texte, la transcription audio et la reconnaissance vocale en temps réel.

La technologie de transcription de la parole en texte est utilisée dans :
 ✔ Transcription audio en texte pour les podcasts, réunions et interviews.
 ✔ Sous-titres et légendes dans le contenu vidéo.
 ✔ Logiciel de voix en texte pour la saisie mains libres et les outils d'accessibilité.

L'ASR d'ElevenLabs offre une conversion de la parole en texte rapide, fiable et très précise pour plusieurs langues et accents.

Question 3

Comment transcrire une vidéo anglaise en texte ?

Accepted Answer

ElevenLabs propose la transcription vidéo pour transcrire le dialogue anglais parlé en format texte, facilitant la création de sous-titres, légendes et transcriptions consultables.

Étapes pour transcrire une vidéo en texte :
1. Téléchargez votre fichier vidéo sur ElevenLabs ASR
2. La technologie de reconnaissance vocale traite l'audio
3. Une transcription est générée automatiquement, avec des horodatages
4. Téléchargez le fichier texte ou exportez les sous-titres pour édition.

Ce modèle de transcription vidéo alimenté par l'IA aide les créateurs de contenu, les entreprises et les éducateurs à transcrire rapidement le discours vidéo en texte précis pour l'accessibilité et la réutilisation du contenu.

Question 4

ElevenLabs prend-il en charge la conversion de la parole en texte en temps réel ?

Accepted Answer

Scribe fonctionne actuellement bien pour les cas d'utilisation où l'audio d'entrée est disponible à l'avance. Une version en temps réel à faible latence sera bientôt disponible.

Question 5

Combien coûte Scribe ?

Accepted Answer

0,40 $ par heure d'audio transcrit, bien en dessous de ce montant à grande échelle avec les plans Entreprise.

Modèle	FLEURS
Scribe v1	3.4% WER
Deepgram Nova 2	6.9% WER
Gemini Flash 2	4.2% WER
Whisper Large v3	4.7% WER

Transcription gratuite de l'anglais parlé en texte

Chaque mot, parfaitement capturé

Benchmark de transcription anglaise

Fonctionnalités puissantes d'audio en texte pour votre application

Précision inégalée

Diarisation intelligente des locuteurs

Horodatages précis au niveau des mots

Marquage audio dynamique

Support linguistique mondial

Aperçu des langues

Informations sur la langue anglaise

Développeurs

Intégrez ElevenLabs Scribe

Transcription IA de la parole en texte en 99 langues

Questions fréquentes