Apresentando o Eleven v3 (alpha)

Experimente o v3

Transcrição Gratuita de Fala em Mandarim para Texto

Transcrição gratuita de fala em mandarim usando nossa ferramenta avançada de transcrição com IA, Scribe. Transcreva voz, áudio e fala em mandarim com precisão líder do setor—Scribe supera Google Gemini e OpenAI Whisper, entregando uma taxa de erro de palavras de apenas 3,1% no benchmark FLEURS e 5,5% no Common Voice. Obtenha transcrições precisas em mandarim para filmes, podcasts, reuniões de negócios, ditado médico e mais.

Experimente a plataforma completa de Áudio IA

Cada palavra, perfeitamente capturada

Scribe ouve cada nuance, capturando cada palavra em mandarim com precisão incomparável. Entregando transcrição de áudio em 99 idiomas—com marcação de tempo a nível de caractere, diarização de falantes e marcação de eventos de áudio—retorna resultados estruturados para integração perfeita

Benchmark de Transcrição em Mandarim

ModeloFLEURS
Scribe v1
7.2% WER
Deepgram Nova 2
98.2% WER
Gemini Flash 2
17.6% WER
Whisper Large v3
23.6% WER

Recursos Poderosos de Áudio para Texto em Mandarim para seu app

Transforme seu áudio em mandarim em texto impecável com o Scribe, o modelo ASR (reconhecimento automático de fala) mais avançado do mundo com a integração de API de fala para texto mais simples

Progress bar with a gradient from black to purple, labeled "II Scribe V1," "Gemini 2.0 Flash," and "Whisper Large v3" on a black background.

Precisão líder do setor

Alcance precisão como nunca antes—Scribe oferece a menor taxa de erro de palavras do setor para transcrição em mandarim perfeitamente precisa

Three colorful, glowing circles with radial patterns on a black background.

Diarização inteligente de falantes

Em qualquer conversa, mesmo as mais movimentadas, Scribe distingue e rotula intuitivamente cada falante para transcrições claras e organizadas

Audio level meter with red peaks at 1:00, T4 and T5 markers, and time stamps at 0:58 and 1:02.

Marcação de tempo precisa a nível de palavra

Capture o momento exato em que cada palavra é falada. As marcações de tempo detalhadas do Scribe permitem sincronização perfeita de legendas e experiências de áudio interativas

'It that funny? (laughter)

Marcação dinâmica de áudio

De risadas a passos, o modelo de transcrição do Scribe marca cada evento sonoro, enriquecendo suas transcrições em mandarim com todo o contexto do seu áudio

Multilingual text with the word "Multilingual" highlighted in blue and pink on a black background.

Suporte global de idiomas

Quebre barreiras linguísticas com suporte para mandarim e outros 98 idiomas—Scribe desbloqueia capacidades de transcrição com IA para idiomas anteriormente fora de alcance

Visão Geral do Idioma

Informações sobre o Idioma Mandarim

Falantes: 1,1 bilhão Acentos: Pequim (Padrão), Nordeste, Sudoeste, Mandarim Taiwanês Idioma oficial em: China, Taiwan e Singapura Falado em: China, Taiwan, Singapura, Malásia e entre comunidades da diáspora chinesa em todo o mundo Um idioma tonal onde a entonação muda o significado. Usa um sistema de escrita logográfico com milhares de caracteres e tem gramática simplificada sem conjugações ou gênero gramatical.

Desenvolvedores

Integre o ElevenLabs Scribe

Integre perfeitamente o modelo de fala para texto mais preciso do mundo para mandarim em seu aplicativo. Comece com nossos exemplos amigáveis para desenvolvedores que mostram recursos como diarização, marcação de tempo a nível de caractere e marcação de eventos de áudio para transcrições impecáveis

Perguntas frequentes

Excelente Precisão (≤ 5% Taxa de Erro de Palavras - WER)
Búlgaro, Catalão, Tcheco, Dinamarquês, Holandês, Inglês, Finlandês, Francês, Galego, Alemão, Grego, Hindi, Indonésio, Italiano, Japonês, Canarês, Malaio, Malaiala, Macedônio, Norueguês, Polonês, Português, Romeno, Russo, Sérvio, Eslovaco, Espanhol, Sueco, Turco, Ucraniano, Vietnamita

Alta Precisão (>5% a ≤10% WER)
Bengali, Bielorrusso, Bósnio, Cantonês, Estoniano, Filipino, Gujarati, Húngaro, Cazaque, Letão, Lituano, Mandarim, Marathi, Nepalês, Odia, Persa, Esloveno, Tâmil, Telugu

Boa (>10% a ≤25% WER)
Africâner, Árabe, Armênio, Assamesa, Asturiano, Azerbaijano, Birmanês, Cebuano, Croata, Georgiano, Hauçá, Hebraico, Islandês, Javanês, Kabuverdianu, Coreano, Quirguiz, Lingala, Maltês, Mongol, Maori, Occitano, Punjabi, Sindhi, Suaíli, Tajique, Tailandês, Urdu, Uzbeque, Galês

Moderada (>25% a ≤50% WER)
Amárico, Chichewa, Fulah, Ganda, Igbo, Irlandês, Khmer, Curdo, Lao, Luxemburguês, Luo, Sotho do Norte, Pashto, Shona, Somali, Umbundu, Wolof, Xhosa, Zulu

Fala para texto é uma tecnologia que transcreve o mandarim falado em texto escrito usando reconhecimento automático de fala (ASR). Processa sinais de áudio, identifica padrões de fala e os transcreve em texto com alta precisão. O software de fala para texto da ElevenLabs, alimentado por IA, é projetado para transcrever conteúdo de áudio e vídeo com precisão semelhante à humana, tornando-o ideal para conversão de voz para texto, transcrição de áudio e reconhecimento de fala em tempo real. A tecnologia de fala para texto é usada em: ✔ Transcrição de áudio para texto para podcasts, reuniões e entrevistas. ✔ Legendas e subtítulos em conteúdo de vídeo. ✔ Software de voz para texto para digitação sem as mãos e ferramentas de acessibilidade. O ASR da ElevenLabs oferece conversão de fala para texto rápida, confiável e altamente precisa para múltiplos idiomas e sotaques.

A ElevenLabs oferece transcrição de vídeo para transcrever diálogos falados em mandarim em formato de texto, facilitando a criação de legendas, subtítulos e transcrições pesquisáveis. Passos para transcrever vídeo para texto: 1. Envie seu arquivo de vídeo para o ASR da ElevenLabs 2. A tecnologia de reconhecimento de fala processa o áudio 3. Uma transcrição é gerada automaticamente, com marcações de tempo 4. Baixe o arquivo de texto ou exporte legendas para edição. Este modelo de transcrição de vídeo com IA ajuda criadores de conteúdo, empresas e educadores a transcrever rapidamente a fala de vídeo em texto preciso para acessibilidade e reaproveitamento de conteúdo.

Atualmente, o Scribe funciona bem para casos de uso onde o áudio de entrada está disponível antecipadamente. Uma versão de baixa latência e em tempo real será lançada em breve.

$0,40 por hora de áudio transcrito, caindo bem abaixo disso em escala com planos Enterprise.
ElevenLabs

Crie com o áudio IA da mais alta qualidade