Direkt zum Inhalt

Duvo setzt produktive Voice-Agents in einer Woche mit ElevenAgents ein

Duvo hat in wenigen Tagen eine produktionsreife Voice-Lösung implementiert – statt in 8–12 Wochen.

duvo

Vom ersten API-Aufruf bis zu produktiven Voice-Agents in einer Woche – unterstützt durch ElevenLabs Startup Grants

Duvo entwickelt KI-Agents, die Abläufe von Anfang bis Ende steuern und Gespräche in kontrollierte, automatisierte Workflows umwandeln. Geschäftsanwender beschreiben einen Prozess mündlich, und Duvo erfasst, analysiert und wandelt ihn in eine nachvollziehbare Ausführung mit Verantwortlichkeiten, Status und Steuerung um. Das System setzt dann Voice-Agents ein, die diese Workflows ausführen – sie rufen Lieferanten an, bestätigen Liefertermine, sammeln Dokumente und aktualisieren Unternehmenssysteme.

Voice ist ein zentraler Bestandteil des Produkterlebnisses von Duvo. Dafür nutzt DuvoElevenAgents – und erreichte vom ersten API-Aufruf bis zur produktionsreifen Voice-Ebene in nur einer Woche.

Produktionsreife Voice in einer Woche

Die Konfigurierbarkeit von ElevenAgents ermöglichte es Duvos Entwicklern, Latenz und Streaming-Verhalten zu steuern, Stimmcharakteristika für verschiedene Unternehmenskontexte anzupassen und Voice direkt in die Workflow-Orchestrierung zu integrieren – ohne eigene Infrastruktur für Echtzeit-Audiostreaming, Unterbrechungsmanagement oder Sprachverarbeitung aufbauen zu müssen.

Statt geschätzten 8–12 Wochen für den Aufbau und die Absicherung einer eigenen Sprachinfrastruktur benötigte Duvo nur wenige Tage, um eine produktionsreife Voice-Ebene bereitzustellen. Damit entfiel die Notwendigkeit, eigene Streaming-Pipelines, Barge-In-Handling und Sprachmanagement zu implementieren und zu warten.

Für ein junges Unternehmen, das ein sprachbasiertes Enterprise-Produkt entwickelt, entfallen so Monate an Infrastrukturarbeit und das operative Risiko sinkt. Duvo ist zudem Empfänger desElevenLabs Startup-Förderungen-Programms, das die Kosten in der frühen Phase senkt und es ermöglicht, den Fokus auf Orchestrierung, Steuerung und Unternehmenslogik statt auf Sprachinfrastruktur zu legen.

Voice-to-Automation für Unternehmen ermöglichen

Die meisten Unternehmensabläufe basieren weiterhin auf Gesprächen und manueller Arbeit: Lieferanten anrufen, Bestätigungen einholen, Dokumente sammeln. Diese Workflows erstrecken sich über mehrere Systeme und Teams und wurden bisher weder erfasst noch automatisiert.

Duvo hat mit ElevenAgents zwei Produkte entwickelt, um das zu ändern.

Duvo Clarity erfasst, wie Workflows tatsächlich ablaufen – durch strukturierte Gespräche mit den Verantwortlichen. In einer Sitzung mit einem europäischen Lebensmitteleinzelhändler kartierte Clarity einen Promotions-Workflow, der fünf Systeme und drei Teams umfasste. Dabei wurden zwei Kontrolllücken und über eine Million Euro jährlicher Margenverluste durch verzögerte Lieferantenbestätigungen entdeckt – ein Problem, das niemand dokumentiert hatte. Das dauerte einen Nachmittag, nicht die sonst üblichen sechs bis acht Wochen Beratungszeit.

Die autonomen Voice-Agents von Duvo setzen dann die Erkenntnisse aus Clarity um. Statt dass ein Einkäufer morgens Lieferanten anruft, übernimmt der Agent die Anrufe, sammelt die Bestätigungen und schreibt die Ergebnisse ins ERP.

Warum ElevenAgents

Statt einzelneSpeech to Text, Sprachmodelle undText to Speech-Systeme zu kombinieren, integrierte Duvo ElevenAgents als einheitliche Konversationsschicht, die für natürlich klingende Gespräche entwickelt wurde. Mit ElevenAgents konnte Duvo latenzarme Voice-Interaktionen bereitstellen, Echtzeit-Gesprächswechsel ohne Pausen ermöglichen, Voice-Stil und Agentenverhalten per API-Workflow anpassen und Voice direkt in die Orchestrierungslogik einbetten – statt es als Oberfläche zu behandeln.

"Als ein Kunde zum ersten Mal seinen Workflow beschrieb und nach wenigen Minuten eine strukturierte Prozesskarte zurückkam, wurde es still im Raum. Da wussten wir: Voice ist keine Funktion, sondern die Schnittstelle. ElevenLabs hat ermöglicht, dieses Erlebnis in einer Woche bereitzustellen." – Tomas Cupr, CEO, Duvo

Wie es weitergeht

Für Teams, die KI-Operatoren, sprachbasierte Enterprise-Tools oder Automatisierungssysteme mit Echtzeit-Dialogen entwickeln, verlangsamt der Aufbau und Betrieb eines eigenen Sprach-Stacks die Umsetzung und erhöht die Komplexität.ElevenAgents ermöglicht es Teams, produktionsreife Konversations-Agents sofort bereitzustellen und sich auf das differenzierende Produkt zu konzentrieren.

Starten Sie jetzt mitElevenAgents oder bewerben Sie sich für dasElevenLabs Startup-Förderungen-Programm.

Entdecken Sie Artikel des ElevenLabs-Teams

Erstellen Sie mit hochwertiger KI-Audio