Dust ajoute une voix multilingue aux workflows d'entreprise pilotés par l'IA grâce à ElevenLabs

Accroître l'accès et la productivité avec l'IA vocale

Dust logo

Dust, the operating system for AI-native enterprises, now includes multilingual voice input and output - powered by ElevenLabs. Designed to integrate models into everyday work, Dust needed voice capabilities that could operate across languages, devices, and contexts with low latency and high realism.

Ce n'était pas exploratoire. La voix est devenue une priorité produit après des demandes répétées des clients. Le résultat : un système qui prend en charge l'interaction mains libres avec les agents pendant les trajets, la collaboration multilingue entre équipes mondiales, et des sorties audio professionnelles pour les workflows asynchrones.

Pourquoi la voix est importante en entreprise

Dust a identifié quatre exigences critiques pour la voix dans un contexte de travail :

  • Qualité naturelle qui résiste à l'examen: La sortie vocale doit sonner professionnelle et humaine - adaptée pour être partagée dans des emails clients, podcasts ou démos de produits.
  • Multilingue par défaut: Les équipes opèrent à travers des bureaux et langues mondiaux. Passer du français à l'anglais et à l'allemand au sein d'une même session ne devrait pas être un cas particulier.
  • Faible latence: Pour l'entrée et la sortie, la vitesse de réponse doit correspondre au rythme de la pensée et de la conversation.
  • Gestion des données de niveau entreprise: Pas de rétention de données, routage basé sur la région, et conformité avec SOC2 et RGPD étaient non négociables.

Pourquoi Dust a choisi ElevenLabs

Après avoir évalué des fournisseurs comme OpenAI, Google, Deepgram et AssemblyAI, Dust a sélectionné ElevenLabs pour sa qualité supérieure et sa préparation au déploiement :

  • Text to Speech les voix ont offert un réalisme élevé constant avec une large gamme émotionnelle - crucial pour les outils Speech Generator et Sound Studio de Dust.
  • Speech to Text a pris en charge 99 langues de transcription, avec une forte fidélité inter-langues.
  • Aucune rétention de données et routage multi-régions ont assuré la conformité d'entreprise dès le départ.
  • SDKs et APIs de niveau production ont permis une intégration rapide et des performances constantes sur les plateformes.

Comment Dust a intégré la voix

Dust a construit le support vocal à travers deux workflows principaux :

1. Entrée vocale : parler aux agents

En utilisant le modèle scribe_v1 d'ElevenLabs, les utilisateurs peuvent désormais parler aux agents via microphone. Le système détecte automatiquement la langue parlée, la transcrit et oriente la demande en conséquence, inférant même les noms des agents à partir de la parole naturelle.

L'entrée vocale est disponible sur mobile, s'alignant avec les moments où taper est le moins pratique.

2. Sortie vocale : audio généré par les agents

Grâce à Speech Generator, les agents Dust peuvent créer du contenu audio en utilisant les modèles eleven_multilingual_v2 et eleven_v3 d'ElevenLabs. La sortie inclut des podcasts, des briefings et des artefacts audio narratifs—utilisés pour la consommation interne et le partage externe.

Sound Studio, propulsé par Text to Sound Effects, ajoute des couches audio non verbales pour les cas d'utilisation de formation et de contenu.

Ce que Dust a appris

  • Le routage régional est important: Activer la sélection de région UE/US a réduit la latence et facilité les discussions de conformité.
  • La curation surpasse l'abondance: Un ensemble de 12 voix sélectionnées réduit la fatigue décisionnelle tout en couvrant tous les besoins essentiels.
  • Qualité > vitesse: Malgré la disponibilité de modèles plus rapides, les utilisateurs ont constamment choisi des voix de haute fidélité pour le contenu de production.

Ce que cela permet

  • Productivité mobile d'abord: Capturez vos pensées et collaborez en déplacement.
  • Collaboration multilingue: Parlez naturellement dans votre propre langue—les agents s'occupent du reste.
    Workflows accessibles et asynchrones: Transformez la recherche en audio, réduisez les barrières d'entrée et soutenez des styles de travail diversifiés.

Et après

Dust explore les agents vocaux conversationnels en temps réel, une compréhension audio plus profonde au-delà de la transcription, et le support pour des entrées longues comme les réunions et présentations. En intégrant ElevenLabs, Dust fait de la voix une partie intégrante de l'IA d'entreprise.

Découvrez les articles de l'équipe ElevenLabs

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter