
Layer integruje ElevenLabs, by dostarczać dźwięk gotowy do gier
Rozszerzanie kreatywnych możliwości dzięki szybkiemu, elastycznemu generowaniu głosu i dźwięku
Duvo wdrożyło gotową warstwę głosową w kilka dni zamiast 8-12 tygodni.
Od pierwszego wywołania API do produkcyjnych voice agents w tydzień – z pomocą grantu ElevenLabs dla startupów
Duvo tworzy AI agents, które zarządzają operacjami od początku do końca, zamieniając rozmowy w uporządkowane, automatyczne workflow. Użytkownik opisuje proces na głos, a Duvo mapuje go, wykrywa luki i zamienia w zadanie z przypisaną odpowiedzialnością, statusem i kontrolą. System wdraża potem voice agents, które realizują te workflow – dzwonią do dostawców, potwierdzają terminy dostaw, zbierają dokumenty i aktualizują systemy firmowe.
Głos to kluczowy element produktu Duvo. Żeby to działało, Duvo korzysta z ElevenAgents – przechodząc od pierwszego wywołania API do gotowej warstwy głosowej w tydzień.
Konfigurowalność ElevenAgents pozwoliła inżynierom Duvo dostosować opóźnienia i sposób streamowania, zmieniać cechy głosu do różnych zastosowań w firmie i zintegrować głos bezpośrednio z orkiestracją workflow – bez budowania własnej infrastruktury do streamingu audio na żywo, obsługi przerwań czy zarządzania mową.
Zamiast spędzać 8-12 tygodni na budowie i dopracowywaniu własnej infrastruktury mowy, Duvo wdrożyło gotową warstwę głosową w kilka dni. Nie musieli wdrażać i utrzymywać własnych pipeline’ów do streamowania, obsługi przerwań czy zarządzania cyklem życia mowy.
Dla młodej firmy budującej produkt enterprise oparty na głosie, to oznaczało oszczędność miesięcy pracy nad infrastrukturą i mniejsze ryzyko operacyjne. Duvo otrzymało też grant ElevenLabs dla startupów, co zmniejszyło koszty na starcie i pozwoliło skupić się na orkiestracji, kontroli i logice biznesowej zamiast na infrastrukturze mowy.
Większość operacji w firmach wciąż opiera się na rozmowach i ręcznej pracy: dzwonieniu do dostawców, zbieraniu potwierdzeń, kompletowaniu dokumentów. Te workflow obejmują wiele systemów i zespołów, a nigdy nie były mapowane, nie mówiąc już o automatyzacji.
Duvo stworzyło dwa produkty z ElevenAgents, żeby to zmienić.
Duvo Clarity pokazuje, jak workflow działają w praktyce – przez uporządkowane rozmowy z osobami, które je prowadzą. W jednej sesji z europejską siecią sklepów Clarity odwzorowało proces ustawiania promocji, który obejmował pięć systemów i trzy zespoły. Wykryło dwie luki kontrolne i ponad milion euro rocznie straty przez opóźnione potwierdzenia od dostawców – problem, którego nikt wcześniej nie zauważył. To zajęło jedno popołudnie, a nie 6-8 tygodni konsultacji.
Autonomiczne voice agents Duvo realizują potem to, co wykryje Clarity. Zamiast żeby kupiec spędzał poranek na dzwonieniu do dostawców i zbieraniu potwierdzeń, agent wykonuje te telefony, zbiera potwierdzenia i zapisuje wyniki w ERP.
Zamiast łączyć osobno Speech to Text, model językowy i Text to Speech, Duvo zintegrowało ElevenAgents jako jedną warstwę konwersacyjną stworzoną do naturalnych rozmów. Dzięki ElevenAgents Duvo może zapewnić rozmowy głosowe bez opóźnień, obsługiwać dialog w czasie rzeczywistym bez niezręcznych pauz, zmieniać styl głosu i zachowanie agenta przez workflow API i osadzić głos bezpośrednio w logice orkiestracji, a nie traktować go jako dodatek.
"Gdy klient po raz pierwszy opisał swój workflow na głos i po kilku minutach zobaczył gotową mapę procesu, zapadła cisza. Wtedy wiedzieliśmy, że głos to nie funkcja – to interfejs. Dzięki ElevenLabs mogliśmy dostarczyć to doświadczenie w tydzień." – Tomas Cupr, CEO, Duvo
Dla zespołów, które budują AI operators, narzędzia enterprise oparte na głosie czy systemy automatyzacji wymagające rozmów na żywo, budowa i utrzymanie własnej infrastruktury mowy spowalnia pracę i komplikuje operacje. ElevenAgents pozwala wdrożyć produkcyjne voice agents od razu i skupić się na tym, co wyróżnia twój produkt.
Aby zacząć, sprawdź ElevenAgents lub zgłoś się po grant ElevenLabs dla startupów.

Rozszerzanie kreatywnych możliwości dzięki szybkiemu, elastycznemu generowaniu głosu i dźwięku

Interaktywne, spersonalizowane doświadczenia edukacyjne z głosem AI