Dust dodaje wielojęzyczny głos do AI w firmowych workflowach dzięki ElevenLabs

Zwiększanie dostępu i produktywności dzięki AI z głosem

Dust logo

Dust, the operating system for AI-native enterprises, now includes multilingual voice input and output - powered by ElevenLabs. Designed to integrate models into everyday work, Dust needed voice capabilities that could operate across languages, devices, and contexts with low latency and high realism.

To nie była eksploracja. Głos stał się priorytetem produktu po licznych prośbach klientów. Efekt: system wspierający interakcję bez użycia rąk podczas dojazdów, wielojęzyczną współpracę w globalnych zespołach i profesjonalne wyjścia audio dla asynchronicznych workflowów.

Dlaczego głos ma znaczenie w firmach

Dust zidentyfikował cztery kluczowe wymagania dla głosu w kontekście pracy:

  • Naturalna jakość, która wytrzymuje krytykę: Wyjście głosowe musi brzmieć profesjonalnie i ludzko - odpowiednie do udostępniania w mailach do klientów, podcastach czy demo produktów.
  • Domyślnie wielojęzyczny: Zespoły działają w globalnych biurach i językach. Przełączanie się między francuskim, angielskim i niemieckim w jednej sesji nie powinno być wyjątkiem.
  • Niskie opóźnienie: Zarówno dla wejścia, jak i wyjścia, szybkość reakcji musi odpowiadać tempu myśli i rozmowy.
  • Obsługa danych na poziomie przedsiębiorstwa: Brak przechowywania danych, routing regionalny i zgodność z SOC2 i RODO były niepodważalne.

Dlaczego Dust wybrał ElevenLabs

Po ocenie dostawców, w tym OpenAI, Google, Deepgram i AssemblyAI, Dust wybrał ElevenLabs za jego doskonałą jakość i gotowość do wdrożenia:

  • Text to Speech głosy dostarczały konsekwentnie wysoki realizm z szerokim zakresem emocji - kluczowe dla narzędzi Speech Generator i Sound Studio Dust.
  • Speech to Text obsługiwał 99 języków transkrypcji, z silną wiernością międzyjęzykową.
  • Brak przechowywania danych i routing wieloregionowy zapewniały zgodność z wymaganiami przedsiębiorstw od razu.
  • SDK i API na poziomie produkcyjnym umożliwiały szybkie wdrożenie i spójną wydajność na różnych platformach.

Jak Dust zintegrował głos

Dust zbudował wsparcie głosowe w dwóch głównych workflowach:

1. Wejście głosowe: rozmowa z agentami

Korzystając z modelu scribe_v1 ElevenLabs, użytkownicy mogą teraz rozmawiać z agentami przez mikrofon. System automatycznie wykrywa język mówiony, transkrybuje go i kieruje żądanie odpowiednio, nawet wnioskując imiona agentów z naturalnej mowy.

Wejście głosowe jest dostępne na urządzeniach mobilnych, co jest zgodne z momentami, gdy pisanie jest najmniej wygodne.

2. Wyjście głosowe: audio generowane przez agentów

Dzięki Speech Generator, agenci Dust mogą tworzyć treści audio używając modeli eleven_multilingual_v2 i eleven_v3 ElevenLabs. Wyjście obejmuje podcasty, briefingi i narracyjne artefakty audio — używane zarówno wewnętrznie, jak i do udostępniania na zewnątrz.

Sound Studio, zasilane przez Text to Sound Effects, dodaje niewerbalne warstwy audio do szkoleń i przypadków użycia treści.

Czego Dust się nauczył

  • Routing regionalny ma znaczenie: Umożliwienie wyboru regionu UE/US zmniejszyło opóźnienia i ułatwiło rozmowy o zgodności.
  • Kuratela bije obfitość: Zestaw 12 starannie dobranych głosów zmniejsza zmęczenie decyzjami, jednocześnie pokrywając wszystkie podstawowe potrzeby.
  • Jakość > szybkość: Mimo dostępności szybszych modeli, użytkownicy konsekwentnie wybierali głosy o wyższej wierności do treści produkcyjnych.

Co to umożliwia

  • Produktywność mobilna: Uchwyć myśli i współpracuj w ruchu.
  • Wielojęzyczna współpraca: Mów naturalnie w swoim języku—agenci zajmą się resztą.
    Dostępne, asynchroniczne workflowy: Zamień badania w audio, obniż bariery wejścia i wspieraj różnorodne style pracy.

Co dalej

Dust bada w czasie rzeczywistym konwersacyjne agenty głosowe, głębsze zrozumienie audio poza transkrypcją i wsparcie dla długich wejść jak spotkania i prezentacje. Dzięki integracji ElevenLabs, Dust sprawia, że głos staje się płynną częścią AI w przedsiębiorstwach.

Przeglądaj artykuły zespołu ElevenLabs

ElevenLabs

Twórz z najwyższą jakością dźwięku AI