
Introducing the ElevenLabs app
Our most powerful AI voice tools are now available for iOS and Android.
Presentamos Eleven v3 Alpha
Prueba v3KUBI es un barista conversacional que trabaja con la Conversational AI de ElevenLabs. Aquí te contamos cómo.
KUBI es un barista y recepcionista conversacional en Second Space, un espacio de co-working de nueva generación 24/7 en Kaohsiung, Taiwán. Dado que la operación del espacio de trabajo está completamente automatizada, es muy importante para KUBI —como primer punto de interacción con los miembros— añadir un toque amigable y único. Por eso, Second Space eligió la
KUBI emplea una arquitectura multisensorial sofisticada para simular una interacción similar a la humana. El sistema se basa en una arquitectura de microservicios, donde servicios especializados operan simultáneamente y se comunican a través de un flujo de eventos en tiempo real. Estos servicios gestionan varias tareas, incluyendo reconocimiento facial y de objetos usando inferencia de IA en tiempo real, detección de tazas y verificaciones de seguridad mediante cámaras, impresión de recibos, reconocimiento facial seguro para control de acceso, y control preciso de dispensadores de leche y granos.
Cómo funciona KUBI
Estos son algunos de los servicios que están funcionando simultáneamente:
¿Por qué todos estos microservicios? Fácil — los gestionamos de forma independiente, escalamos fácilmente y usamos las mejores herramientas para cada tarea."BigBoy". Es esencialmente un procesador de eventos gigante y no bloqueante:
1 | |
2 | internal object WeatherIdleScenario: SingleTaskScenario(scenario){ |
3 | |
4 | importance = Importance.Medium |
5 | compilationTimeout = Time.ThreeSeconds |
6 | interruptable = false |
7 | exeutionExpiration = = Time.TenSeconds |
8 | |
9 | override fun isEligible(event: Event, environment: Environment): Maybe<Boolean> = withEnvironment(environment) { |
10 | just { |
11 | (event is IdleEvent |
12 | && !triggeredInLast(40.minutes) |
13 | && (personPresent() || hasActiveSessions) |
14 | && environment.weatherService.lastReportWithin(10.minutes)) |
15 | } |
16 | } |
17 | } |
18 | |
19 | private val scenario = ScenarioRecipe { event, env, session -> |
20 | |
21 | |
22 | invokeOneOf( |
23 | |
24 | phrase { |
25 | sayWith { |
26 | "Rainy day today, isn't it? That's why I have my little umbrella! Look!".asEnglish |
27 | }.withAutoGift().withAutoMotion() |
28 | }.given { Weather.isRaining() }, |
29 | |
30 | phrase { |
31 | sayWith { |
32 | "Friend, it's so cold outside! So sad for you... because you're a human. I don't really mind!".asEnglish |
33 | }.withAutoMotion() |
34 | |
35 | sayWith { |
36 | "Wait, that soudned a bit rude.".asEnglish |
37 | }.withAutoMotion() |
38 | |
39 | }.given { Weather.isCold() }, |
40 | |
41 | ) |
42 | |
43 | |
44 | } |
45 | |
46 |
¿Qué son los escenarios?
Piensa en los escenarios como compiladores no bloqueantes para eventos de acción del robot. Un evento de acción suele ser el evento más descendente, que es el último paso en una cadena, resultando en un efecto físico, como movimiento o habla. Por ejemplo, un escenario de saludo podría activar:
Piensa en los escenarios como compiladores no bloqueantes para eventos de acción
Sincronización de eventos de acción: Estos eventos luego fluyen a través de un programador que asegura que el habla, las expresiones faciales y los movimientos se mantengan sincronizados. La sincronización asegura que el habla de KUBI coincida perfectamente con sus gestos.
Sincronización de eventos de acción: Estos eventos luego fluyen a través de un programador que asegura que el habla, las expresiones faciales y los movimientos se mantengan sincronizados. La sincronización asegura que el habla de KUBI coincida perfectamente con sus gestos. y activar nuevos eventos de acción dinámicamente. Por ejemplo:
Lo genial es que los escenarios pueden incluso escuchar
BigBoy literalmente ve y sabe todo lo que sucede. ¿Bastante genial, no?
Usando ElevenLabs para crear interacciones memorablesdiseñar la voz en 15 minutos, completa con emociones y pausas que hacen que la voz sea aún más humana.
Second Space tenía en mente una personalidad muy específica para KUBI: una mezcla de Deadpool, Wheatley del juego Portal y un poco de Pathfinder de Apex Legends. Lograron
Modo Conversacional (Tiempo Real)"¡Hey KUBI!", la IA conversacional de ElevenLabs es capaz de responder en 200ms, haciendo que la interacción se sienta verdaderamente humana.
Herramientas Conversacionales Personalizadas
Expandiendo KUBI a mercados adicionalesintenciones de la herramienta que otros. Actualmente están usando Gemini 2.0 Flash como su modelo principal para IA conversacional y ChatGPT 4o para las generaciones de habla estática.
Expandiendo KUBI a mercados adicionales
Conclusión
Our most powerful AI voice tools are now available for iOS and Android.
Bringing voice-first, agentic customer support to the enterprise