
API de Transformar Texto em Áudio - Até 40% Mais Rápido no Mundo Todo
Transcreva áudios com a API da ElevenLabs
A mais alta precisão em Speech to Text para aplicações em lote. Detecte ênfase e efeitos sonoros, e oriente a transcrição com termos-chave.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Crie legendas, transcrições editáveis e arquivos de texto para podcasts, vídeos, entrevistas e outros conteúdos gravados – tudo com precisão líder do setor via API.
O Scribe v2 alcança precisão líder do setor, entregando texto limpo e editável mesmo em áudios desafiadores ou com diferentes sotaques.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Transcrição que funciona em ambientes barulhentos, com música de fundo, sotaques fortes e áudio de baixa qualidade.
A API de Transcrição da ElevenLabs detecta risadas, emoções e efeitos sonoros. Use sugestões de termos-chave para orientar a transcrição com termos específicos do seu setor.
.webp&w=3840&q=95)
.webp&w=3840&q=95)

Identifique eventos não verbais como risadas, aplausos, música e ruídos de fundo. As transcrições trazem todo o contexto do seu áudio, não só as palavras.
Identifique e marque automaticamente até 48 locutores. Atribuição clara de quem falou o quê, organizada em transcrições fáceis de ler.
Identifique e marque automaticamente 56 tipos de entidades, incluindo nomes, datas, locais e organizações nas suas transcrições.

Máxima precisão, ideal para grandes volumes.

Menor latência, para uso em tempo real.
Precisão excepcional em diferentes sotaques, dialetos e condições de gravação.
Altere o languageCode para visualizar outros idiomas
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
const elevenlabs = new ElevenLabsClient({
apiKey: "<your_api_key>"
});
const response = await fetch(
"https://storage.googleapis.com/eleven-public-cdn/audio/marketing/nicole.mp3"
);
const audioBlob = new Blob([await response.arrayBuffer()], { type: "audio/mp3" });
const transcription = await elevenlabs
.speechToText.convert({
file: audioBlob,
modelId: "scribe_v2",
tagAudioEvents: true,
languageCode: , // Definir idioma
diarize: true
});
console.log(transcription);“De dublar Reels em idiomas locais a gerar músicas e vozes de personagens no Horizon, a plataforma ElevenLabs permite que criadores, empresas e negócios do mundo todo criem com voz, música e som em escala.”
“A precisão incomparável do Scribe em tantos idiomas permite que a Fieldy entenda todas as conversas do dia a dia e escale facilmente para outros continentes. A Fieldy aumentou a retenção de usuários em 50% após migrar para o ElevenLabs Scribe.”
“A ElevenLabs facilitou para nós a integração rápida de recursos avançados de transformar texto em áudio no nosso SDK, permitindo que Agentes respondam em tempo real com vozes expressivas às perguntas dos usuários ou como feedback ao que estão vendo.”

“A Twilio integrou a tecnologia de voz IA generativa da ElevenLabs ao seu CPaaS, aprimorando o ConversationRelay. Essa integração permite que empresas e desenvolvedores criem interações de voz com IA que soam naturais, são expressivas e respondem em tempo real diretamente da plataforma Twilio CPaaS. Nós, da ElevenLabs, estamos animados que a Twilio escolheu a ElevenLabs para tornar o ConversationRelay ainda mais expressivo e natural.”


API de Transformar Texto em Áudio - Até 40% Mais Rápido no Mundo Todo
.webp&w=3840&q=80)
Converse com uma Estátua: Criando um App Multimodal com ElevenAgents




.webp&w=3840&q=80)
Adicione um Agente de Voz do Papai Noel ao seu app React em minutos

Apresentando o ElevenLabs UI: componentes open source de áudio e agentes para a web
.webp&w=3840&q=80)
ElevenLabs Agents vs OpenAI Realtime API: Batalha de Agentes Conversacionais