Crea ElevenAgents con Claude Code
- Publicado
- Última actualización
EscucharEscucha este artículo
Antes, crear agentes de voz requería semanas y varios proveedores. Ahora puedes hacerlo de principio a fin en una tarde con Claude Code. Esta guía te acompaña en todo el proceso: persona, base de conocimiento, workflow, herramientas, reglas de seguridad, tests y un número de teléfono al que puedes llamar.
Lo que puedes crear en una tarde:
- Agente de voz que te despierta con un resumen de los fallos de CI durante la noche
- Línea de soporte multilingüe para tu proyecto paralelo esta misma tarde
- Agente interactivo para tu portfolio que habla como tú
Las limitaciones que hacían que los agentes de voz sonaran mecánicos, como la latencia, la prosodia o los turnos de palabra, han mejorado muchísimo. Nuestro modelo más rápido funciona con una latencia de unos 75 ms y un sistema de turnos que gestiona pausas e interrupciones en tiempo real. Eleven v3 es nuestro modelo de Texto a Voz más expresivo: puede cambiar de registro, reírse o suspirar como una persona.
Configuración rápida
Primero, instala la skill de ElevenLabs con este prompt en Claude Code:
Después ejecuta la skill setup-api-key para conectar tu clave de la API de ElevenLabs:
Consejo: limita la clave solo a "agents-write" y pon un tope de gasto diario. Un bucle descontrolado puede gastar créditos rápido.
Crea el agente
ElevenAgents está pensado para que puedas tener un agente de voz listo para producción en Claude Code en pocos minutos usando prompts en lenguaje natural. El resto de la guía son esos prompts, para que pases de un espacio en blanco a un número de teléfono al que puedes llamar.
Empecemos con el propio agente. Este primer prompt crea uno con una persona, una voz y un LLM para razonar. Sin herramientas, sin base de conocimiento, sin workflow todavía; solo el camino más rápido de cero al agente mínimo viable.

Añade una base de conocimiento
Una base de conocimiento es el conjunto de documentos, URLs y FAQs que tu agente puede consultar cuando alguien le hace una pregunta. ElevenAgents gestiona el pipeline de recuperación (RAG, o generación aumentada por recuperación) por ti. Cuando un usuario pregunta algo, la plataforma busca en el contenido indexado, selecciona los fragmentos más relevantes y se los pasa al LLM como contexto antes de generar la respuesta. Las fuentes se reindexan automáticamente cuando cambian, así que el agente siempre está sincronizado con tu documentación sin que tengas que volver a subir nada.

Añade un workflow
Un solo agente con un prompt puede gestionar tareas concretas. Los workflows amplían esto a conversaciones con varias intenciones. En vez de meter todos los comportamientos posibles en un solo prompt, divides el agente en nodos, cada uno con una intención específica, y los conectas según lo que necesite la persona que llama. Cada nodo tiene su propio comportamiento, y los enlaces entre ellos se gestionan según condiciones evaluadas por un LLM.

Añade herramientas
ElevenAgents admite tres tipos de herramientas, cada una con una función distinta. Las herramientas de cliente ejecutan acciones en la interfaz, así el agente puede navegar, resaltar o actualizar lo que ve el usuario. Las herramientas webhook llaman a tus APIs, permitiendo que el agente lea o escriba datos en tus sistemas. Las herramientas integradas cubren acciones comunes de la plataforma que no quieres programar tú, como colgar la llamada, detectar el idioma o transferir a una persona.
.webp&w=3840&q=95)
Añade reglas de seguridad
Las reglas de seguridad funcionan de forma independiente al LLM, así que detectan casos límite que tu prompt no cubre. Lo habitual es configurarlas en platform_settings en vez de depender solo del prompt, pero para las reglas más críticas conviene hacer ambas cosas. Inclúyelas en tu prompt y como regla personalizada independiente. Así tienes doble protección: si el LLM se desvía de las instrucciones, el validador de respuestas lo detecta antes de que llegue al usuario.
Añade tests
Antes de poner tu agente delante de usuarios reales, querrás comprobar que funciona como esperas. ElevenAgents admite tres tipos de tests, y normalmente te interesan los tres. Los tests de respuesta comprueban que el agente dice lo correcto y con el tono adecuado. Los tests de herramientas verifican que usa la herramienta correcta con los parámetros adecuados. Los tests de simulación comprueban que el flujo de varias interacciones se mantiene cuando la conversación se sale del guion.

Ponlo en un teléfono
Hasta ahora el agente solo funciona en el dashboard. Al conectarlo a un número de teléfono, el tráfico de voz pasa por un proveedor de telefonía, permitiendo llamadas entrantes y salientes. Quien llama puede marcar, tu agente puede llamar, y el audio se gestiona a través del proveedor. ElevenAgents tiene integraciones nativas con Twilio, SIP trunk, Vonage, Telnyx, Plivo y Genesys, así que no necesitas servidores de medios externos ni configurar rutas TwiML manualmente. Todo el stack, desde el modelo de voz hasta el LLM y el proveedor de telefonía, está conectado en una sola plataforma.
La integración nativa con Twilio es la más rápida. Importas un número de Twilio en el dashboard de ElevenAgents con tu Account SID y Auth Token, y la plataforma configura automáticamente los webhooks de voz y el formato de audio. Un detalle importante: los números comprados en Twilio permiten llamadas entrantes y salientes. Los números verificados como caller ID en Twilio solo permiten llamadas salientes.
Consejo: si aún no tienes Twilio, el botón Habla con el agente del dashboard funciona en el navegador. El número de teléfono es para producción.
Ahora tienes un agente de voz que no suena como un robot.

.webp&w=3840&q=80)

.webp&w=3840&q=80)
