Apresentando o Eleven v3 (alpha)

Experimente o v3

Transcrição Gratuita de Fala Pashto para Texto

Reconhecimento Automático de Fala (ASR) Pashto gratuito usando nossa ferramenta avançada de transcrição com IA, Scribe. A ElevenLabs supera o Google Gemini e o OpenAI Whisper em testes, com taxas de erro de palavras de apenas 37,8% no benchmark FLEURS e 37,1% no benchmark Common Voice. Transcrições líderes do setor para filmes, podcasts, reuniões de negócios, ditados médicos em Pashto e mais.

Experimente a plataforma completa de Áudio IA

Cada palavra, perfeitamente capturada

O Scribe ouve cada nuance, capturando cada palavra em Pashto com precisão incomparável. Oferecendo transcrição de áudio em 99 idiomas—com marcação de tempo a nível de caractere, diarização de falantes e marcação de eventos de áudio—ele retorna resultados estruturados para integração perfeita

Benchmark de Transcrição Pashto

ModeloFLEURS
Scribe v1
37.8% WER
Deepgram Nova 2
100.0% WER
Gemini Flash 2
42.9% WER
Whisper Large v3
94.3% WER

Recursos Poderosos de Áudio para Texto para seu app

Transforme seu áudio Pashto em texto impecável com o Scribe, o modelo ASR (reconhecimento automático de fala) mais avançado do mundo com a integração de API de fala para texto mais simples

Progress bar with a gradient from black to purple, labeled "II Scribe V1," "Gemini 2.0 Flash," and "Whisper Large v3" on a black background.

Precisão líder do setor

Alcance precisão como nunca antes—o Scribe oferece a menor taxa de erro de palavras do setor para transcrição Pashto perfeitamente precisa

Three colorful, glowing circles with radial patterns on a black background.

Diarização inteligente de falantes

Em qualquer conversa, mesmo as mais movimentadas, o Scribe distingue e rotula intuitivamente cada falante para transcrições claras e organizadas

Audio level meter with red peaks at 1:00, T4 and T5 markers, and time stamps at 0:58 and 1:02.

Marcação de tempo precisa a nível de palavra

Capture o momento exato em que cada palavra é falada. As marcações de tempo detalhadas do Scribe permitem sincronização perfeita de legendas e experiências de áudio interativas

'It that funny? (laughter)

Marcação dinâmica de áudio

De risadas a passos, o modelo de transcrição do Scribe marca cada evento sonoro, enriquecendo suas transcrições Pashto com o contexto completo do seu áudio

Multilingual text with the word "Multilingual" highlighted in blue and pink on a black background.

Suporte global de idiomas

Quebre barreiras linguísticas com suporte para Pashto e outros 98 idiomas—o Scribe desbloqueia capacidades de transcrição com IA para idiomas anteriormente fora de alcance

Visão Geral do Idioma

Informações sobre o Idioma Pashto

Falantes: 50 milhões Sotaques: Kandahari (Sul), Kabuli (Leste), Peshawar (Norte) Idioma oficial em: Afeganistão e Paquistão (Khyber Pakhtunkhwa) Falado em: Afeganistão, Paquistão (Khyber Pakhtunkhwa) e partes do Irã Um idioma iraniano com alinhamento ergativo-absolutivo em tempos passados. Apresenta consoantes retroflexas (influenciadas por idiomas indo-arianos) e rica tradição poética.

Desenvolvedores

Integre o ElevenLabs Scribe

Integre perfeitamente o modelo de fala para texto mais preciso do mundo para Pashto em seu aplicativo. Comece com nossos exemplos amigáveis para desenvolvedores que mostram recursos como diarização, marcação de tempo a nível de caractere e marcação de eventos de áudio para transcrições impecáveis

Perguntas frequentes

Excelente Precisão (≤ 5% Taxa de Erro de Palavras - WER)
Búlgaro, Catalão, Tcheco, Dinamarquês, Holandês, Inglês, Finlandês, Francês, Galego, Alemão, Grego, Hindi, Indonésio, Italiano, Japonês, Kannada, Malaio, Malayalam, Macedônio, Norueguês, Polonês, Português, Romeno, Russo, Sérvio, Eslovaco, Espanhol, Sueco, Turco, Ucraniano, Vietnamita

Alta Precisão (>5% a ≤10% WER)
Bengali, Bielorrusso, Bósnio, Cantonês, Estoniano, Filipino, Gujarati, Húngaro, Cazaque, Letão, Lituano, Mandarim, Marathi, Nepalês, Odia, Persa, Esloveno, Tâmil, Telugu

Boa (>10% a ≤25% WER)
Africâner, Árabe, Armênio, Assamese, Asturiano, Azerbaijano, Birmanês, Cebuano, Croata, Georgiano, Hausa, Hebraico, Islandês, Javanês, Kabuverdianu, Coreano, Quirguiz, Lingala, Maltês, Mongol, Maori, Occitano, Punjabi, Sindhi, Suaíli, Tajique, Tailandês, Urdu, Uzbeque, Galês

Moderada (>25% a ≤50% WER)
Amárico, Chichewa, Fulah, Ganda, Igbo, Irlandês, Khmer, Curdo, Lao, Luxemburguês, Luo, Sotho do Norte, Pashto, Shona, Somali, Umbundu, Wolof, Xhosa, Zulu

Fala para texto é uma tecnologia que transcreve o Pashto falado em texto escrito usando reconhecimento automático de fala (ASR). Ela processa sinais de áudio, identifica padrões de fala e os transcreve em texto com alta precisão. O software de fala para texto da ElevenLabs, alimentado por IA, é projetado para transcrever conteúdo de áudio e vídeo com precisão semelhante à humana, tornando-o ideal para conversão de voz para texto, transcrição de áudio e reconhecimento de fala em tempo real. A tecnologia de fala para texto é usada em: ✔ Transcrição de áudio para texto para podcasts, reuniões e entrevistas. ✔ Legendas e legendas em conteúdo de vídeo. ✔ Software de voz para texto para digitação sem as mãos e ferramentas de acessibilidade. O ASR da ElevenLabs oferece conversão de fala para texto rápida, confiável e altamente precisa para múltiplos idiomas e sotaques.

A ElevenLabs oferece transcrição de vídeo para transcrever diálogos falados em Pashto para formato de texto, facilitando a criação de legendas, legendas ocultas e transcrições pesquisáveis. Passos para transcrever vídeo para texto: 1. Envie seu arquivo de vídeo para o ASR da ElevenLabs 2. A tecnologia de reconhecimento de fala processa o áudio 3. Uma transcrição é gerada automaticamente, com marcações de tempo 4. Baixe o arquivo de texto ou exporte legendas para edição. Este modelo de transcrição de vídeo com IA ajuda criadores de conteúdo, empresas e educadores a transcrever rapidamente a fala de vídeo em texto preciso para acessibilidade e reaproveitamento de conteúdo.

O Scribe atualmente funciona bem para casos de uso onde o áudio de entrada está disponível antecipadamente. Uma versão de baixa latência e em tempo real será lançada em breve.

$0,40 por hora de áudio transcrito, caindo bem abaixo disso em escala com planos Enterprise.
ElevenLabs

Crie com o áudio IA da mais alta qualidade