.webp&w=3840&q=95)
Top 5 Speechify alternatives for reading text aloud
Explore the best alternatives to Speechify.
KUBI est un barista conversationnel qui fonctionne avec l'IA conversationnelle d'ElevenLabs. Voici comment.
KUBI est un barista et réceptionniste conversationnel chez Second Space, un espace de co-working nouvelle génération 24/7 à Kaohsiung, Taïwan. Comme le fonctionnement de l'espace est entièrement automatisé, il est très important pour KUBI — en tant que premier point de contact avec les membres — d'ajouter une touche amicale unique. C'est pourquoi Second Space a choisi l'IA conversationnelle d'ElevenLabs pour créer des interactions amusantes et mémorables avec les membres. Voyons KUBI en action.
KUBI utilise une architecture multisensorielle sophistiquée pour simuler une interaction humaine. Le système repose sur une architecture de microservices, où des services spécialisés fonctionnent simultanément et communiquent via un flux d'événements en temps réel. Ces services gèrent diverses tâches, y compris la reconnaissance faciale et d'objets grâce à l'inférence IA en temps réel, la détection de tasses et les vérifications de sécurité via des caméras, l'impression de reçus, la reconnaissance faciale sécurisée pour le contrôle d'accès, et le contrôle précis des distributeurs de lait et de grains.
Comment fonctionne KUBI
Voici quelques-uns des services qui fonctionnent simultanément :
Pourquoi tous ces microservices ? Facile — nous les gérons indépendamment, les faisons évoluer facilement, et utilisons les meilleurs outils pour chaque tâche."BigBoy". C'est essentiellement un processeur d'événements géant et non bloquant :
1 | |
2 | internal object WeatherIdleScenario: SingleTaskScenario(scenario){ |
3 | |
4 | importance = Importance.Medium |
5 | compilationTimeout = Time.ThreeSeconds |
6 | interruptable = false |
7 | exeutionExpiration = = Time.TenSeconds |
8 | |
9 | override fun isEligible(event: Event, environment: Environment): Maybe<Boolean> = withEnvironment(environment) { |
10 | just { |
11 | (event is IdleEvent |
12 | && !triggeredInLast(40.minutes) |
13 | && (personPresent() || hasActiveSessions) |
14 | && environment.weatherService.lastReportWithin(10.minutes)) |
15 | } |
16 | } |
17 | } |
18 | |
19 | private val scenario = ScenarioRecipe { event, env, session -> |
20 | |
21 | |
22 | invokeOneOf( |
23 | |
24 | phrase { |
25 | sayWith { |
26 | "Rainy day today, isn't it? That's why I have my little umbrella! Look!".asEnglish |
27 | }.withAutoGift().withAutoMotion() |
28 | }.given { Weather.isRaining() }, |
29 | |
30 | phrase { |
31 | sayWith { |
32 | "Friend, it's so cold outside! So sad for you... because you're a human. I don't really mind!".asEnglish |
33 | }.withAutoMotion() |
34 | |
35 | sayWith { |
36 | "Wait, that soudned a bit rude.".asEnglish |
37 | }.withAutoMotion() |
38 | |
39 | }.given { Weather.isCold() }, |
40 | |
41 | ) |
42 | |
43 | |
44 | } |
45 | |
46 |
Qu'est-ce que les scénarios ?
Pensez aux scénarios comme à des compilateurs non bloquants pour les événements d'action du robot. Un événement d'action est généralement l'événement le plus en aval, c'est-à-dire la dernière étape d'une chaîne, entraînant un effet physique, tel qu'un mouvement ou une parole. Par exemple, un scénario de salutation pourrait déclencher :
Pensez aux scénarios comme à des compilateurs non-bloquants pour les événements d'action
Synchronisation des événements d'action : Ces événements passent ensuite par un planificateur qui garantit que la parole, les expressions faciales et les mouvements restent synchronisés. La synchronisation garantit que la parole de KUBI correspond parfaitement à ses gestes.
Synchronisation des événements d'action : Ces événements passent ensuite par un planificateur qui assure la synchronisation de la parole, des expressions faciales et des mouvements. La synchronisation garantit que la parole de KUBI correspond parfaitement à ses gestes. et déclencher de nouveaux événements d'action dynamiquement. Par exemple :
Le truc cool, c'est que les scénarios peuvent même écouter les
BigBoy voit littéralement et sait tout ce qui se passe. Plutôt cool, non ?
Utiliser ElevenLabs pour créer des interactions mémorablesconcevoir la voix en 15 minutes, complète avec des émotions et des pauses qui rendent la voix encore plus humaine.
Second Space avait une personnalité très spécifique en tête pour KUBI - un mélange de Deadpool, Wheatley du jeu Portal et un peu de Pathfinder d'Apex Legends. Ils ont réussi à
Mode Conversationnel (Temps Réel)"Hey KUBI!", l'IA conversationnelle d'ElevenLabs est capable de répondre en 200ms, rendant l'interaction vraiment humaine.
Outils Conversationnels Personnalisés
Étendre KUBI à d'autres marchésintentions de l'outil que d'autres. Ils utilisent actuellement Gemini 2.0 Flash comme modèle principal pour l'IA conversationnelle et ChatGPT 4o pour les générations de discours statiques.
Étendre KUBI à d'autres marchés
Conclusion
Explore the best alternatives to Speechify.
Explore AI voice's growing role in interactive storytelling and gaming.