Dust fügt KI-gesteuerten Unternehmens-Workflows mit ElevenLabs mehrsprachige Stimme hinzu

Zugang und Produktivität mit sprachgesteuerter KI erweitern

Dust logo

Dust, the operating system for AI-native enterprises, now includes multilingual voice input and output - powered by ElevenLabs. Designed to integrate models into everyday work, Dust needed voice capabilities that could operate across languages, devices, and contexts with low latency and high realism.

Dies war kein Experiment. Stimme wurde nach wiederholten Kundenanfragen zur Produktpriorität. Das Ergebnis: ein System, das freihändige Agenteninteraktion während der Fahrt, mehrsprachige Zusammenarbeit in globalen Teams und professionelle Audioausgaben für asynchrone Workflows unterstützt.

Warum Stimme im Unternehmen wichtig ist

Dust identifizierte vier entscheidende Anforderungen für Stimme im Arbeitskontext:

  • Natürliche Qualität, die der Prüfung standhält: Sprachausgabe muss professionell und menschlich klingen - geeignet für die Weitergabe in Kunden-E-Mails, Podcasts oder Produktdemos.
  • Standardmäßig mehrsprachig: Teams arbeiten in globalen Büros und Sprachen. Der Wechsel zwischen Französisch, Englisch und Deutsch innerhalb einer Sitzung sollte kein Ausnahmefall sein.
  • Geringe Latenz: Sowohl für Eingabe als auch Ausgabe muss die Reaktionsgeschwindigkeit dem Denk- und Gesprächstempo entsprechen.
  • Unternehmensgerechte Datenverarbeitung: Keine Datenspeicherung, regionsbasierte Weiterleitung und Einhaltung von SOC2 und DSGVO waren unverhandelbar.

Warum Dust ElevenLabs wählte

Nach der Bewertung von Anbietern wie OpenAI, Google, Deepgram und AssemblyAI entschied sich Dust für ElevenLabs aufgrund seiner überlegenen Qualität und Einsatzbereitschaft:

  • Text to Speech Stimmen lieferten durchgehend hohe Realitätsnähe mit breitem emotionalem Spektrum - entscheidend für Dusts Speech Generator und Sound Studio Tools.
  • Speech to Text unterstützte 99 Transkriptionssprachen mit starker sprachübergreifender Treue.
  • Keine Datenspeicherung und regionsübergreifende Weiterleitung gewährleisteten Unternehmenskonformität von Anfang an.
  • Produktionsreife SDKs und APIs ermöglichten schnelle Integration und konsistente Leistung über Plattformen hinweg.

Wie Dust Stimme integrierte

Dust baute Sprachunterstützung in zwei Kern-Workflows ein:

1. Spracheingabe: mit Agenten sprechen

Mit dem scribe_v1 Modell von ElevenLabs können Benutzer jetzt über Mikrofon mit Agenten sprechen. Das System erkennt automatisch die gesprochene Sprache, transkribiert sie und leitet die Anfrage entsprechend weiter, wobei sogar Agentennamen aus natürlicher Sprache abgeleitet werden.

Spracheingabe ist auf Mobilgeräten verfügbar und passt zu Momenten, in denen Tippen am wenigsten praktisch ist.

2. Sprachausgabe: von Agenten generiertes Audio

Über den Speech Generator können Dust-Agenten Audioinhalte mit den Modellen eleven_multilingual_v2 und eleven_v3 von ElevenLabs erstellen. Die Ausgabe umfasst Podcasts, Briefings und narrative Audioartefakte - sowohl für den internen Gebrauch als auch für die externe Weitergabe.

Sound Studio, unterstützt von Text to Sound Effects, fügt nicht-verbale Audiolagen für Trainings- und Inhaltsanwendungen hinzu.

Was Dust gelernt hat

  • Regionale Weiterleitung ist wichtig: Die Auswahl von EU/US-Regionen reduzierte Latenz und erleichterte Compliance-Gespräche.
  • Kuratiertes Angebot schlägt Überfluss: Ein kuratiertes Set von 12 Stimmen reduziert Entscheidungsstress und deckt alle Kernbedürfnisse ab.
  • Qualität > Geschwindigkeit: Trotz verfügbarer schnellerer Modelle wählten Benutzer konsequent hochqualitative Stimmen für Produktionsinhalte.

Was dies ermöglicht

  • Mobilitätsorientierte Produktivität: Gedanken erfassen und unterwegs zusammenarbeiten.
  • Mehrsprachige Zusammenarbeit: Sprechen Sie natürlich in Ihrer eigenen Sprache - die Agenten erledigen den Rest.
    Zugängliche, asynchrone Workflows: Verwandeln Sie Forschung in Audio, senken Sie Eingabebarrieren und unterstützen Sie vielfältige Arbeitsstile.

Was als Nächstes kommt

Dust erforscht Echtzeit-konversationelle Sprachagenten, tiefere Audioverständnis jenseits der Transkription und Unterstützung für Langform-Eingaben wie Meetings und Präsentationen. Durch die Integration von ElevenLabs macht Dust Stimme zu einem nahtlosen Bestandteil der Unternehmens-KI.

Entdecken Sie Artikel des ElevenLabs-Teams

ElevenLabs

AI-Audioinhalte in höchster Qualität generieren

Kostenlos registrieren

Haben Sie bereits ein Konto? Anmelden