
ElevenAPI para desenvolvedores
Construa IA de áudio pronta para produção em minutos
APIs confiáveis por equipes que operam em grande escala, incluindo Text to Speech, Speech to Text, Voice Agents e Música.
Na antiga terra de Eldoria, onde os céus brilhavam e as florestas sussurravam segredos ao vento, vivia um dragão chamado Zephyros. [sarcastically] Não do tipo que “queima tudo... [giggles] mas ele era gentil, sábio, com olhos como estrelas antigas. [whispers] Até os pássaros ficavam em silêncio quando ele passava.
API de Transformar Texto em Áudio
Transcrição
Música
Efeitos Sonoros
- Lovable
- Synthesia
- Stripe
- Perplexity
- Twilio
Construa com o conjunto completo de APIs da ElevenLabs
Construa qualquer projeto de áudio com os SDKs nativos ElevenLabs para TypeScript e Python, ou com nossa REST API. Comece com demos detalhadas, exemplos e documentação.
Gerar Fala
Converta texto em fala com o modelo de voz mais expressivo do mundo.

Transcrever Fala
Speech to Text em tempo real ou em lote para qualquer plataforma.

Compor Música
Gere stems, letras e composições completas com total flexibilidade.

Criar Efeitos Sonoros
Looping perfeito, qualquer duração, efeitos sonoros de nível profissional.

Criar Vozes
Clone a voz de alguém, gere uma com um prompt ou use uma das nossas 10 mil vozes existentes.

Implantar Agentes
Plataforma de agentes totalmente gerenciada, com SDKs nativos para mobile e web.

Impulsionando as principais empresas e marcas do mundo
“A ElevenLabs tornou a criação da nossa série de áudio mais rápida e simples, reduzindo custos em até 90%”
“A Toyota fez parceria com a H/L e a ElevenLabs para entregar uma ativação de marketing orientada por voz com uma versão IA do quarterback Brock Purdy. A campanha gerou mais de 12.000 interações, quase dois minutos de engajamento médio, e mais de 25% das conversas levaram a ações significativas.”
“A NVIDIA usou a tecnologia de clonagem de voz da ElevenLabs para narrar partes do keynote de Jensen Huang ao vivo em inglês e mandarim.”
“As soluções de IA sofisticadas da ElevenLabs são de ponta, garantindo experiências de áudio de alta qualidade e multilíngues”
APIs criadas para produção desde o primeiro dia

Perguntas frequentes
A API da ElevenLabs oferece acesso programático aos nossos modelos de IA para voz, música, efeitos sonoros, dublagem e transcrição. Você pode integrar essas capacidades diretamente em suas aplicações, fluxos de trabalho e pipelines de produção.
Text to Speech - Gerar voz a partir de texto
Speech to Text - Transcrever e diarizar áudio
Voice Library - Acessar e clonar vozes
Dubbing - Traduzir e localizar áudio em mais de 70 idiomas
Sound Effects - Gerar áudio personalizado
Music - Criar faixas instrumentais e líricas
Voice Isolation - Remover ruído de fundo
Casos de uso comuns incluem pipelines de localização de conteúdo, produção automatizada de vídeo, interfaces conversacionais, ferramentas de acessibilidade e geração de conteúdo para treinamento. A API é projetada para processamento em tempo real e em lote.
Todas as solicitações à API exigem uma chave de API passada no cabeçalho xi-api-key. As chaves são geradas nas configurações da sua conta e podem ser limitadas a espaços de trabalho específicos.
Os limites de uso variam por plano e endpoint. O uso PAYG é habilitado a partir do nosso plano Starter e superiores.
Sim. SDKs oficiais estão disponíveis para Python e JavaScript/TypeScript, e plataformas adicionais como Flutter, Swift e Kotlin para nossa plataforma de Agentes.
Text to Speech é cobrado por caractere. Speech to Text é cobrado por minuto de áudio. Música e Sound Effects são cobrados por geração. Dublagem é cobrada por minuto de áudio de origem.
Sim. Você pode referenciar qualquer voz na sua biblioteca pelo ID, incluindo vozes profissionais, vozes clonadas e vozes que você criou.
Sim. O conteúdo gerado através da API usando os modelos da ElevenLabs é licenciado comercialmente. Música requer uma licença adicional para publicidade, filmes, TV, jogos e distribuição empresarial.
Text to Speech geralmente responde em menos de 500ms para streaming. Speech to Text processa de 20 a 50 vezes em tempo real, dependendo do tamanho do arquivo. Dublagem e Música são operações em lote com tempos de processamento proporcionais ao comprimento do conteúdo.
Sim. Text to Speech e Speech to Text suportam saída em streaming, permitindo que você use as APIs em aplicações em tempo real.
A API retorna códigos de status HTTP padrão. Erros de limite de taxa retornam 429. Solicitações inválidas retornam 400 com detalhes do erro. Falhas de autenticação retornam 401.
Referência completa da API, exemplos de código e guias de integração estão disponíveis em elevenlabs.io/docs/api-reference
Sim. Planos empresariais incluem suporte dedicado, SLAs, limites de taxa personalizados, SSO, conformidade SOC 2 e MSAs.

.webp&w=3840&q=80)




.webp&w=3840&q=80)
