
Layer integra ElevenLabs per offrire audio pronto per il gaming
- Categoria
- Storie di ElevenCreative
- Data
Trasforma le conversazioni aziendali in workflow automatizzati in pochi giorni
Dal primo API call agli agenti vocali in produzione in una settimana – grazie agli Startup Grants di ElevenLabs
Duvo sviluppa agenti IA che gestiscono le operazioni end-to-end, trasformando le conversazioni in workflow automatizzati e controllati. Gli utenti aziendali descrivono un processo a voce, e Duvo lo mappa, individua eventuali lacune e lo trasforma in un’attività tracciata con responsabilità, stato e controlli integrati. Il sistema poi attiva agenti vocali che eseguono questi workflow: chiamano fornitori, confermano date di consegna, raccolgono documentazione e aggiornano i sistemi aziendali.
La voce è una parte fondamentale dell’esperienza di prodotto di Duvo. Per renderla possibile, Duvo utilizzaElevenAgents – passando dalla prima chiamata API a uno strato vocale pronto per la produzione in una settimana.
La configurabilità di ElevenAgents ha permesso agli ingegneri di Duvo di ottimizzare latenza e comportamento dello streaming, regolare le caratteristiche vocali per diversi contesti aziendali e integrare la voce direttamente nell’orchestrazione dei workflow, senza dover creare infrastrutture per lo streaming audio in tempo reale, la gestione delle interruzioni o l’elaborazione del parlato.
Invece di impiegare 8-12 settimane per costruire e consolidare un’infrastruttura vocale personalizzata, Duvo ha implementato uno strato vocale pronto per la produzione in pochi giorni. Questo ha eliminato la necessità di sviluppare e mantenere pipeline di streaming, gestione delle interruzioni e del ciclo di vita del parlato internamente.
Per una startup che sviluppa un prodotto enterprise nativamente vocale, questo ha eliminato mesi di lavoro infrastrutturale e ridotto i rischi operativi. Duvo ha anche ricevuto il Startup Grant di ElevenLabs, che ha ridotto i vincoli di costo nelle prime fasi e permesso di concentrare gli sforzi di ingegneria su orchestrazione, governance e logica aziendale invece che sull’infrastruttura vocale.
La maggior parte delle operazioni aziendali si basa ancora su conversazioni umane e attività manuali: chiamare fornitori, inseguire conferme, raccogliere documenti. Questi workflow coinvolgono più sistemi e team e non sono mai stati mappati, tantomeno automatizzati.
Duvo ha creato due prodotti con ElevenAgents per cambiare questa situazione.
Duvo Clarity rileva come funzionano realmente i workflow attraverso conversazioni strutturate con chi li gestisce. In una sessione con una catena di supermercati europea, Clarity ha mappato un workflow di attivazione promozioni che coinvolgeva cinque sistemi e tre team. Ha individuato due lacune nei controlli e oltre un milione di euro di margine annuo perso a causa di ritardi nelle conferme dei fornitori, un problema mai documentato prima. Tutto questo in un pomeriggio, invece delle sei-otto settimane normalmente richieste da una consulenza.
Gli agenti vocali autonomi di Duvo poi agiscono su quanto rilevato da Clarity. Invece che un buyer passi la mattina a chiamare i fornitori per confermare le date di consegna, l’agente effettua le chiamate, raccoglie le conferme e aggiorna i risultati nell’ERP.
Invece di mettere insieme separatamente Speech to Text, language model e Text to Speech, Duvo ha integrato ElevenAgents come layer conversazionale unificato progettato per dialoghi naturali. Con ElevenAgents, Duvo offre interazioni vocali a bassa latenza, gestisce il turn-taking in tempo reale senza pause innaturali, modifica stile e comportamento degli agenti tramite un workflow API-first e integra la voce direttamente nella logica di orchestrazione invece di trattarla come un semplice livello superficiale.
La prima volta che un cliente ha descritto il suo workflow e ha visto tornare una mappa di processo strutturata in pochi minuti, nella stanza è calato il silenzio. È stato allora che abbiamo capito che la voce non era una funzione, ma l’interfaccia. ElevenLabs ci ha permesso di offrire quell’esperienza in una settimana. – Tomas Cupr, CEO, Duvo
Per i team che sviluppano operatori IA, strumenti enterprise voice-native o sistemi di automazione basati su dialoghi in tempo reale, creare e mantenere uno speech stack personalizzato rallenta l’esecuzione e aumenta la complessità operativa. ElevenAgents permette ai team di implementare agenti conversazionali pronti per la produzione subito e concentrarsi sul prodotto che li distingue.
Per iniziare, esplora ElevenAgents oppure candidati ai Grants per Startup di ElevenLabs .



