
ElevenLabs vs. Cartesia (June 2025)
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Apresentando o Eleven v3 (alpha)
Experimente o v3Um mês após seu lançamento, o Scribe continua provando ser o modelo de fala para texto mais avançado do setor.
Em apenas um mês desde o lançamento, nosso modelo de fala para texto Scribe atraiu milhares de empresas com sua precisão líder no setor. De legendas de mídia a call centers e transcrições médicas, o Scribe rapidamente se tornou o modelo preferido dos desenvolvedores.
Várias análises de terceiros confirmaram nossos próprios benchmarks de precisão com o Scribe superando todos os modelos, incluindo os novos modelos 4o de transcrição da OpenAI. Por exemplo, um benchmark da Artificial Analysis revela que o Scribe supera tanto o 4o quanto o 4o mini em Taxa de Erro de Palavra, em média:
O Scribe também supera ou está no mesmo nível dos modelos de transcrição 4o e 4o mini nos próprios benchmarks de lançamento da OpenAI, para 11 das 15 línguas testadas. Observando o japonês e o hindi, por exemplo, o Scribe é melhor que ambos os modelos 4o da OpenAI por margens significativas, nos próprios benchmarks da OpenAI:
Tomamos decisões com o Scribe para ser o mais útil possível para os clientes, mesmo que isso possa criar inconsistências nos benchmarks do setor. Por exemplo:
É por isso que é útil olhar para os resultados finais ao pensar sobre desempenho. Por exemplo, em inglês, o modelo 4o Speech to Text da OpenAI tem um desempenho semelhante ao Scribe nos benchmarks. No entanto, comparar transcrições em inglês realmente destaca as capacidades avançadas do Scribe.
Nesta análise de transcrição de uma audiência parlamentar do Reino Unido, você pode ver como o Scribe não comete erros ao capturar adequadamente sotaques, diferentes tons de voz e rotular corretamente ruídos de fundo e risadas.
Scribe da ElevenLabs (Tempo para criar a transcrição: 4.66s)
Posso perguntar ao nobre cavalheiro que trabalho está sendo feito para garantir que este lugar seja mais acessível, especialmente para alguns de nossos colegas que têm uma deficiência? Ouça, ouça. (murmúrio da multidão) Desculpe, deve ser algo relacionado ao meu histórico antípoda. Poderia repetir a pergunta, porque não a segui? (risos da multidão) Uau. Oh, uau. Muito popular hoje. Hum, eu- eu estava dizendo que- que um número de colegas parlamentares que têm deficiências acham bastante difícil se locomover em certas partes do local. Dado que estamos fazendo este trabalho de reforma, o que pode ser feito para garantir que aqueles com deficiência possam se mover mais livremente e o lugar seja acessível? Sr. Paul. (risos da multidão) Sinto muito. Poderia fazer isso muito devagar em inglês antípoda? Obrigado. Apenas dê qualquer resposta antiga. Eu- eu acho que a resposta... Eu acho que a resposta pode ser ajudada se você puder responder por escrito quando você ler, Sr. Presidente. Certo, Chris Elmore. (risos) Obrigado, Sr. Vice-Presidente, eu- eu tentarei na primeira tentativa. (murmúrio da multidão) Oh, não. Você é galês. Posso- posso- posso- porque sou galês, então Deus o ajude.
OpenAI’s 4o (Tempo para criar a transcrição: 5.01s)
Posso perguntar ao nobre cavalheiro que trabalho está sendo feito para garantir que este lugar seja mais acessível, especialmente para alguns de nossos colegas que têm uma deficiência? Desculpe, deve ser algo relacionado ao meu histórico antípoda. Poderia repetir a pergunta, porque não a segui? Bem, muito popular hoje. Estou vendo que um número de colegas parlamentares que têm deficiências acham bastante difícil se locomover em certas partes do local. Dado que estamos fazendo este trabalho de reforma, o que pode ser feito para garantir que aqueles com deficiência possam se mover mais livremente e o lugar seja acessível? Sinto muito. Por favor, poderia fazer isso muito devagar em inglês antípoda? Eu acho que a resposta pode ser ajudada se você puder responder por escrito quando você ler. Obrigado, Sr. Vice-Presidente. Eu tentarei na primeira tentativa. Porque sou galês, então Deus o ajude.
Com cada avanço em IA, um grupo frequentemente negligenciado se beneficia imensamente: pessoas que gaguejam. A gagueira, um distúrbio genético de fala que afeta cerca de 1% da população, apresenta desafios únicos para sistemas de reconhecimento automático de fala (ASR). Em um estudo com amostras de teste onde a gagueira ocorreu em quase uma em cada quatro palavras, o desempenho do Scribe é particularmente impressionante com 98,7% de precisão em média. Isso mais uma vez prova que o Scribe lidera o setor e oferece um modelo adaptado para todas as necessidades empresariais.
O desempenho do Scribe ganha vida com seu conjunto de recursos adaptados para resolver as necessidades dos clientes empresariais.
Experimente o Scribe hoje, nosso produto web é gratuito até 9 de abril. O preço do Scribe é muito competitivo, começando em $0,22/hora para clientes empresariais. Sinta-se à vontade para contatar nossa equipe de vendas, ficaremos felizes em agendar uma demonstração e mostrar como podemos ajudar seu negócio.
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Unlocking the Power of AI Voiceovers for eLearning