Salta al contenido

Duvo lanza agentes de voz en producción en solo una semana con ElevenAgents

Duvo integró una capa de voz lista para producción en días en vez de 8-12 semanas.

duvo

De la primera llamada a la API a agentes de voz en producción en una semana, gracias a las Becas ElevenLabs para Startups

Duvo crea agentes IA que gestionan operaciones de principio a fin, convirtiendo conversaciones en workflows automatizados y controlados. Los usuarios empresariales describen un proceso en voz alta y Duvo lo mapea, detecta carencias y lo convierte en una tarea con seguimiento, responsable, estado y controles integrados. Su sistema luego despliega agentes de voz que ejecutan esos workflows: llaman a proveedores, confirman fechas de entrega, recopilan documentación y actualizan sistemas empresariales.

La voz es clave en la experiencia de producto de Duvo. Para potenciarla, Duvo utiliza ElevenAgents - pasando de la primera llamada a la API a una capa de voz lista para producción en solo una semana.

Voz en producción en una semana

La flexibilidad de ElevenAgents permitió a los ingenieros de Duvo ajustar la latencia y el comportamiento del streaming, modificar las características de voz para distintos contextos empresariales e integrar la voz directamente en la orquestación de workflows, sin tener que crear infraestructura para audio en tiempo real, gestión de interrupciones o manejo del habla.

En vez de invertir unas 8-12 semanas en desarrollar y reforzar una infraestructura de voz personalizada, Duvo desplegó una capa de voz lista para producción en solo unos días. Así, no tuvieron que implementar ni mantener pipelines de streaming, gestión de interrupciones ni el ciclo de vida del habla internamente.

Para una startup que crea un producto empresarial nativo de voz, esto ahorra meses de trabajo en infraestructura y reduce el riesgo operativo. Duvo también ha recibido la Beca ElevenLabs para Startups, lo que redujo los costes iniciales y les permitió centrar el esfuerzo de ingeniería en la orquestación, el control y la lógica empresarial, en vez de en la infraestructura de voz.

Automatización por voz para empresas

La mayoría de las operaciones empresariales siguen dependiendo de conversaciones humanas y trabajo manual: llamar a proveedores, perseguir confirmaciones, recopilar documentos. Estos workflows abarcan varios sistemas y equipos, y nunca se han mapeado, mucho menos automatizado.

Duvo ha creado dos productos con ElevenAgents para cambiar esto.

Duvo Clarity recoge cómo funcionan realmente los workflows a través de conversaciones estructuradas con quienes los gestionan. En una sesión con un supermercado europeo, Clarity mapeó un workflow de promociones que abarcaba cinco sistemas y tres equipos. Detectó dos carencias de control y más de un millón de euros de margen anual perdido por retrasos en las confirmaciones de proveedores, un problema que nadie había documentado. Todo esto en una tarde, no en las seis u ocho semanas que suele requerir una consultoría.

Luego, los agentes de voz autónomos de Duvo actúan según lo que detecta Clarity. En vez de que un comprador pase la mañana llamando a proveedores para confirmar fechas de entrega, el agente hace las llamadas, recoge las confirmaciones y escribe los resultados en el ERP.

Por qué ElevenAgents

En vez de unir por separado Voz a Texto, modelo de lenguaje y Texto a Voz, Duvo integró ElevenAgents como una capa conversacional unificada, diseñada para conversaciones naturales. Con ElevenAgents, Duvo pudo ofrecer interacciones de voz con baja latencia, gestionar turnos en tiempo real sin pausas incómodas, iterar sobre el estilo de voz y el comportamiento del agente mediante un workflow API-first, e integrar la voz directamente en la lógica de orquestación en vez de tratarla como una simple capa superficial.

"La primera vez que un cliente explicó su workflow y vio cómo se generaba un mapa de procesos estructurado en minutos, la sala se quedó en silencio. Ahí supimos que la voz no era una función, era la interfaz. ElevenLabs hizo posible lanzar esa experiencia en una semana." – Tomas Cupr, CEO, Duvo

¿Qué viene ahora?

Para equipos que crean operadores IA, herramientas empresariales nativas de voz o sistemas de automatización que dependen del diálogo en tiempo real, crear y mantener una infraestructura de voz personalizada ralentiza el desarrollo y aumenta la complejidad operativa. ElevenAgents permite lanzar agentes conversacionales listos para producción de inmediato y centrarse en el producto que los hace únicos.

Para empezar, explora ElevenAgents o solicita la Beca ElevenLabs para Startups.

Descubre artículos del equipo de ElevenLabs

Crea con el audio IA de la más alta calidad