Question 1

Quais idiomas o Scribe suporta?

Accepted Answer

Excelente Precisão (≤ 5% Taxa de Erro de Palavras - WER)
Búlgaro, Catalão, Tcheco, Dinamarquês, Holandês, Inglês, Finlandês, Francês, Galego, Alemão, Grego, Hindi, Indonésio, Italiano, Japonês, Canarim, Malaio, Malaiala, Macedônio, Norueguês, Polonês, Português, Romeno, Russo, Sérvio, Eslovaco, Espanhol, Sueco, Turco, Ucraniano, Vietnamita

Alta Precisão (>5% a ≤10% WER)
Bengali, Bielorrusso, Bósnio, Cantonês, Estoniano, Filipino, Gujarati, Húngaro, Cazaque, Letão, Lituano, Mandarim, Marathi, Nepalês, Odia, Persa, Esloveno, Tâmil, Telugu

Boa (>10% a ≤25% WER)
Africâner, Árabe, Armênio, Assamesa, Asturiano, Azerbaijano, Birmanês, Cebuano, Croata, Georgiano, Hausa, Hebraico, Islandês, Javanês, Kabuverdianu, Coreano, Quirguiz, Lingala, Maltês, Mongol, Maori, Occitano, Punjabi, Sindhi, Suaíli, Tajique, Tailandês, Urdu, Uzbeque, Galês

Moderada (>25% a ≤50% WER)
Amárico, Chichewa, Fulah, Ganda, Igbo, Irlandês, Khmer, Curdo, Lao, Luxemburguês, Luo, Sotho do Norte, Pashto, Shona, Somali, Umbundu, Wolof, Xhosa, Zulu

Question 2

O que é fala em mandarim para texto e como funciona?

Accepted Answer

Fala para texto é uma tecnologia que transcreve o mandarim falado em texto escrito usando reconhecimento automático de fala (ASR). Ela processa sinais de áudio, identifica padrões de fala e os transcreve em texto com alta precisão.

O software de fala para texto da ElevenLabs, alimentado por IA, é projetado para transcrever conteúdo de áudio e vídeo com precisão semelhante à humana, tornando-o ideal para conversão de voz para texto, transcrição de áudio e reconhecimento de fala em tempo real.

A tecnologia de fala para texto é usada em:
 ✔ Transcrição de áudio para texto para podcasts, reuniões e entrevistas.
 ✔ Legendas e legendas em conteúdo de vídeo.
 ✔ Software de voz para texto para digitação sem as mãos e ferramentas de acessibilidade.

O ASR da ElevenLabs oferece conversão de fala para texto rápida, confiável e altamente precisa para múltiplos idiomas e sotaques.

Question 3

Como transcrevo vídeo em mandarim para texto?

Accepted Answer

A ElevenLabs oferece transcrição de vídeo para transcrever diálogos falados em mandarim para formato de texto, facilitando a criação de legendas, legendas ocultas e transcrições pesquisáveis.

Passos para transcrever vídeo para texto:
1. Envie seu arquivo de vídeo para o ASR da ElevenLabs
2. A tecnologia de reconhecimento de fala processa o áudio
3. Uma transcrição é gerada automaticamente, com marcações de tempo
4. Baixe o arquivo de texto ou exporte legendas para edição.

Este modelo de transcrição de vídeo com IA ajuda criadores de conteúdo, empresas e educadores a transcrever rapidamente a fala de vídeo em texto preciso para acessibilidade e reaproveitamento de conteúdo.

Question 4

A ElevenLabs suporta conversão de fala para texto em tempo real?

Accepted Answer

Atualmente, o Scribe funciona bem para casos de uso onde o áudio de entrada está disponível antecipadamente. Uma versão de baixa latência e em tempo real será lançada em breve.

Question 5

Quanto custa o Scribe?

Accepted Answer

$0,40 por hora de áudio transcrito, caindo bem abaixo disso em escala com planos Enterprise.

Modelo	FLEURS
Scribe v1	7.2% WER
Deepgram Nova 2	98.2% WER
Gemini Flash 2	17.6% WER
Whisper Large v3	23.6% WER

Transcrição Gratuita de Fala em Mandarim para Texto

Cada palavra, perfeitamente capturada

Benchmark de Transcrição em Mandarim

Recursos Poderosos de Áudio para Texto em Mandarim para seu app

Precisão líder do setor

Diarização inteligente de falantes

Marcação precisa de tempo por palavra

Marcação dinâmica de áudio

Suporte global de idiomas

Visão Geral do Idioma

Informações sobre o Idioma Mandarim

Desenvolvedores

Integre o ElevenLabs Scribe

Transcrição de Fala para Texto em 99 Idiomas

Perguntas frequentes