Question 1

¿Qué es la API de ElevenLabs?

Accepted Answer

La API de ElevenLabs proporciona acceso programático a nuestros modelos de IA para voz, música, efectos de sonido, doblaje y transcripción. Puedes integrar estas capacidades directamente en tus aplicaciones, flujos de trabajo y líneas de producción.

Question 2

¿Qué APIs están disponibles?

Accepted Answer

Texto a Voz - Genera voz a partir de texto
Speech to Text - Transcribe y diariza audio
Voice Library - Accede y clona voces
Doblaje - Traduce y localiza audio en más de 70 idiomas
Sound Effects - Genera audio personalizado
Música - Crea pistas instrumentales y líricas
Voice Isolation - Elimina el ruido de fondo

Question 3

¿Qué puedo crear con la API?

Accepted Answer

Casos de uso comunes incluyen la localización de contenido, producción de video automatizada, interfaces conversacionales, herramientas de accesibilidad y generación de contenido para formación. La API está diseñada para procesamiento en tiempo real y por lotes.

Question 4

¿Cómo funciona la autenticación?

Accepted Answer

Todas las solicitudes a la API requieren una clave API pasada en el encabezado xi-api-key. Las claves se generan en la configuración de tu cuenta y pueden estar limitadas a espacios de trabajo específicos.

Question 5

¿Cuáles son los límites de uso?

Accepted Answer

Los límites de uso varían según el plan y la ruta de API. El uso PAYG está habilitado desde nuestro plan Starter en adelante.

Question 6

¿Proporcionáis SDKs?

Accepted Answer

Sí. Hay SDKs oficiales disponibles para Python y JavaScript/TypeScript, y plataformas adicionales como Flutter, Swift y Kotlin para nuestra plataforma de Agentes.

Question 7

¿Cómo se mide el uso?

Accepted Answer

Texto a Voz se factura por carácter. Speech to Text se factura por minuto de audio. Música y Sound Effects se facturan por generación. Doblaje se factura por minuto de audio fuente.

Question 8

¿Puedo usar voces personalizadas a través de la API?

Accepted Answer

Sí. Puedes referenciar cualquier voz en tu biblioteca por ID, incluidas voces profesionales, voces clonadas y voces que hayas diseñado.

Question 9

¿Es seguro el contenido de la API para uso comercial?

Accepted Answer

Sí. El contenido generado a través de la API usando modelos de ElevenLabs tiene licencia comercial. La música requiere una licencia adicional para publicidad, cine, TV, juegos y distribución empresarial.

Question 10

¿Qué latencia debo esperar?

Accepted Answer

Texto a Voz responde típicamente en menos de 500ms para streaming. Speech to Text procesa a 20-50x en tiempo real dependiendo del tamaño del archivo. Doblaje y Música son operaciones por lotes con tiempos de procesamiento proporcionales a la longitud del contenido.

Question 11

¿Soportáis streaming?

Accepted Answer

Sí. Texto a Voz y Speech to Text soportan salida en streaming, permitiéndote usar las APIs en aplicaciones en tiempo real.

Question 12

¿Cómo manejo los errores?

Accepted Answer

La API devuelve códigos de estado HTTP estándar. Los errores de límite de tasa devuelven 429. Las solicitudes inválidas devuelven 400 con detalles del error. Las fallas de autenticación devuelven 401.

Question 13

¿Dónde puedo encontrar la documentación de la API?

Accepted Answer

La referencia completa de la API, ejemplos de código y guías de integración están disponibles en elevenlabs.io/docs/api-reference

Question 14

¿Ofrecéis soporte empresarial?

Accepted Answer

Sí. Los planes empresariales incluyen soporte dedicado, SLAs, límites de tasa personalizados, SSO, cumplimiento SOC 2 y MSAs.

Crea IA de audio lista para producción en minutos

Crea con toda la suite de APIs de ElevenLabs

Generar voz

Transcribir voz

Componer música

Crear efectos de sonido

Crear voces

Desplegar agentes

Impulsando a las principales empresas y marcas del mundo

APIs diseñadas para producción desde el primer día

Protección de datos a nivel empresarial

SDKs de Python y TypeScript

Soporte avanzado y despliegues personalizados

Preguntas frecuentes

Últimas actualizaciones