Apresentando o Eleven v3 (alpha)

Experimente o v3

Transcrição de Fala Persa para Texto Grátis

Transcrição de fala persa para texto grátis usando nossa ferramenta avançada de transcrição com IA, Scribe. Transcreva voz, áudio e fala persa com precisão líder do setor—Scribe supera Google Gemini e OpenAI Whisper, entregando uma taxa de erro de palavras de apenas 3,1% no benchmark FLEURS e 5,5% no Common Voice. Obtenha transcrições precisas em persa para filmes, podcasts, reuniões de negócios, ditado médico e mais.

Experimente a plataforma completa de Áudio IA

Cada palavra, perfeitamente capturada

Scribe ouve cada nuance, capturando cada palavra persa com precisão incomparável. Oferecendo transcrição de áudio em 99 idiomas—com marcação de tempo a nível de caractere, diarização de falantes e marcação de eventos de áudio—ele retorna resultados estruturados para integração perfeita

Benchmark de Transcrição Persa

ModeloFLEURS
Scribe v1
7.8% WER
Deepgram Nova 2
100.0% WER
Gemini Flash 2
8.0% WER
Whisper Large v3
24.0% WER

Recursos Poderosos de Áudio para Texto em Persa para seu app

Transforme seu áudio persa em texto impecável com o Scribe, o modelo ASR (reconhecimento automático de fala) mais avançado do mundo com a integração de API de fala para texto mais simples

Progress bar with a gradient from black to purple, labeled "II Scribe V1," "Gemini 2.0 Flash," and "Whisper Large v3" on a black background.

Precisão líder do setor

Alcance precisão como nunca antes—Scribe oferece a menor taxa de erro de palavras do setor para transcrição persa perfeitamente precisa

Three colorful, glowing circles with radial patterns on a black background.

Diarização inteligente de falantes

Em qualquer conversa, mesmo as mais movimentadas, Scribe distingue e rotula intuitivamente cada falante para transcrições claras e organizadas

Audio level meter with red peaks at 1:00, T4 and T5 markers, and time stamps at 0:58 and 1:02.

Marcação de tempo precisa a nível de palavra

Capture o momento exato em que cada palavra é falada. As marcações de tempo detalhadas do Scribe permitem sincronização perfeita de legendas e experiências de áudio interativas

'It that funny? (laughter)

Marcação dinâmica de áudio

De risadas a passos, o modelo de transcrição do Scribe marca cada evento sonoro, enriquecendo suas transcrições persas com o contexto completo do seu áudio

Multilingual text with the word "Multilingual" highlighted in blue and pink on a black background.

Suporte global de idiomas

Quebre barreiras linguísticas com suporte para persa e outros 98 idiomas—Scribe desbloqueia capacidades de transcrição com IA para idiomas anteriormente fora de alcance

Visão Geral do Idioma

Informações sobre o Idioma Persa

Falantes: 110 milhões Acentos: Tehrani (Padrão), Dari (Afeganistão), Tajiki, Shirazi Idioma oficial em: Irã, Afeganistão (como Dari) e Tajiquistão (como Tajik) Falado em: Irã, Afeganistão, Tajiquistão, Uzbequistão e entre comunidades da diáspora persa Um idioma iraniano com mais de 2.500 anos de história escrita. Apresenta gramática simples sem gênero gramatical, escrito em alfabeto árabe com letras adicionais.

Desenvolvedores

Integre o ElevenLabs Scribe

Integre perfeitamente o modelo de fala para texto mais preciso do mundo para persa, em seu aplicativo. Comece com nossos exemplos amigáveis para desenvolvedores que mostram recursos como diarização, marcação de tempo a nível de caractere e marcação de eventos de áudio para transcrições impecáveis

Perguntas frequentes

Excelente Precisão (≤ 5% Taxa de Erro de Palavras - WER)
Búlgaro, Catalão, Tcheco, Dinamarquês, Holandês, Inglês, Finlandês, Francês, Galego, Alemão, Grego, Hindi, Indonésio, Italiano, Japonês, Kannada, Malaio, Malaiala, Macedônio, Norueguês, Polonês, Português, Romeno, Russo, Sérvio, Eslovaco, Espanhol, Sueco, Turco, Ucraniano, Vietnamita

Alta Precisão (>5% a ≤10% WER)
Bengali, Bielorrusso, Bósnio, Cantonês, Estoniano, Filipino, Gujarati, Húngaro, Cazaque, Letão, Lituano, Mandarim, Marathi, Nepalês, Odia, Persa, Esloveno, Tâmil, Telugu

Boa (>10% a ≤25% WER)
Africâner, Árabe, Armênio, Assamesa, Asturiano, Azerbaijano, Birmanês, Cebuano, Croata, Georgiano, Hausa, Hebraico, Islandês, Javanês, Kabuverdianu, Coreano, Quirguiz, Lingala, Maltês, Mongol, Maori, Occitano, Punjabi, Sindhi, Suaíli, Tajique, Tailandês, Urdu, Uzbeque, Galês

Moderada (>25% a ≤50% WER)
Amárico, Chichewa, Fulah, Ganda, Igbo, Irlandês, Khmer, Curdo, Lao, Luxemburguês, Luo, Sotho do Norte, Pashto, Shona, Somali, Umbundu, Wolof, Xhosa, Zulu

Fala para texto é uma tecnologia que transcreve o persa falado em texto escrito usando reconhecimento automático de fala (ASR). Ela processa sinais de áudio, identifica padrões de fala e os transcreve em texto com alta precisão. O software de fala para texto com IA da ElevenLabs é projetado para transcrever conteúdo de áudio e vídeo com precisão semelhante à humana, tornando-o ideal para conversão de voz para texto, transcrição de áudio e reconhecimento de fala em tempo real. A tecnologia de fala para texto é usada em: ✔ Transcrição de áudio para texto para podcasts, reuniões e entrevistas. ✔ Legendas e subtítulos em conteúdo de vídeo. ✔ Software de voz para texto para digitação sem as mãos e ferramentas de acessibilidade. O ASR da ElevenLabs oferece conversão de fala para texto rápida, confiável e altamente precisa para múltiplos idiomas e sotaques.

A ElevenLabs oferece transcrição de vídeo para transcrever diálogos falados em persa em formato de texto, facilitando a criação de legendas, subtítulos e transcrições pesquisáveis. Passos para transcrever vídeo para texto: 1. Envie seu arquivo de vídeo para o ASR da ElevenLabs 2. A tecnologia de reconhecimento de fala processa o áudio 3. Uma transcrição é gerada automaticamente, com marcações de tempo 4. Baixe o arquivo de texto ou exporte legendas para edição. Este modelo de transcrição de vídeo com IA ajuda criadores de conteúdo, empresas e educadores a transcrever rapidamente a fala de vídeo em texto preciso para acessibilidade e reaproveitamento de conteúdo.

Atualmente, o Scribe funciona bem para casos de uso onde o áudio de entrada está disponível antecipadamente. Uma versão de baixa latência e em tempo real será lançada em breve.

$0,40 por hora de áudio transcrito, caindo bem abaixo disso em escala com planos Enterprise.
ElevenLabs

Crie com o áudio IA da mais alta qualidade