.webp&w=3840&q=95)
Top 5 Speechify alternatives for reading text aloud
Explore the best alternatives to Speechify.
KUBI ist ein konversationeller Barista, der mit der Conversational KI von ElevenLabs arbeitet. So funktioniert es.
KUBI ist ein konversationeller Barista und Empfangsmitarbeiter bei Second Space, einem modernen 24/7-Co-Working-Space in Kaohsiung, Taiwan. Da der Arbeitsbereich vollständig automatisiert ist, ist es für KUBI sehr wichtig, als erster Kontaktpunkt mit den Mitgliedern eine einzigartige, freundliche Note hinzuzufügen. Deshalb hat sich Second Space für die
KUBI nutzt eine ausgeklügelte multisensorische Architektur, um menschliche Interaktionen zu simulieren. Das System basiert auf einer Microservices-Architektur, bei der spezialisierte Dienste gleichzeitig arbeiten und über einen Echtzeit-Ereignisstrom kommunizieren. Diese Dienste verwalten verschiedene Aufgaben, einschließlich Gesichts- und Objekterkennung mit Echtzeit-KI-Inferenz, Tassen- und Sicherheitsüberprüfungen über Kameras, Belegdruck, sichere Gesichtserkennung für Zugangskontrolle und präzise Steuerung von Milch- und Bohnenautomaten.
Wie KUBI funktioniert
Dies sind einige der Dienste, die gleichzeitig laufen:
Warum all diese Microservices? Ganz einfach — wir verwalten sie unabhängig, skalieren leicht und nutzen die besten Werkzeuge für jede Aufgabe."BigBoy". Im Wesentlichen ist es ein riesiger, nicht blockierender Ereignisprozessor:
1 | |
2 | internal object WeatherIdleScenario: SingleTaskScenario(scenario){ |
3 | |
4 | importance = Importance.Medium |
5 | compilationTimeout = Time.ThreeSeconds |
6 | interruptable = false |
7 | exeutionExpiration = = Time.TenSeconds |
8 | |
9 | override fun isEligible(event: Event, environment: Environment): Maybe<Boolean> = withEnvironment(environment) { |
10 | just { |
11 | (event is IdleEvent |
12 | && !triggeredInLast(40.minutes) |
13 | && (personPresent() || hasActiveSessions) |
14 | && environment.weatherService.lastReportWithin(10.minutes)) |
15 | } |
16 | } |
17 | } |
18 | |
19 | private val scenario = ScenarioRecipe { event, env, session -> |
20 | |
21 | |
22 | invokeOneOf( |
23 | |
24 | phrase { |
25 | sayWith { |
26 | "Rainy day today, isn't it? That's why I have my little umbrella! Look!".asEnglish |
27 | }.withAutoGift().withAutoMotion() |
28 | }.given { Weather.isRaining() }, |
29 | |
30 | phrase { |
31 | sayWith { |
32 | "Friend, it's so cold outside! So sad for you... because you're a human. I don't really mind!".asEnglish |
33 | }.withAutoMotion() |
34 | |
35 | sayWith { |
36 | "Wait, that soudned a bit rude.".asEnglish |
37 | }.withAutoMotion() |
38 | |
39 | }.given { Weather.isCold() }, |
40 | |
41 | ) |
42 | |
43 | |
44 | } |
45 | |
46 |
Was sind Szenarien?
Denken Sie an Szenarien als nicht blockierende Compiler für Roboter Aktionsereignisse. Ein Aktionsereignis ist normalerweise das am weitesten entfernte Ereignis, der letzte Schritt in einer Kette, der zu einem physischen Effekt führt, wie Bewegung oder Sprache. Ein Begrüßungsszenario könnte zum Beispiel auslösen:
Denken Sie an Szenarien als nicht blockierende Compiler für Roboter Aktionsereignisse
Synchronisation von Aktionsereignissen: Diese Ereignisse fließen dann durch einen Scheduler, der sicherstellt, dass Sprache, Gesichtsausdrücke und Bewegungen synchron bleiben. Die Synchronisation sorgt dafür, dass KUBIs Sprache perfekt zu seinen Gesten passt.
Synchronisation von Aktionsereignissen: Diese Ereignisse durchlaufen dann einen Scheduler, der sicherstellt, dass Sprache, Gesichtsausdrücke und Bewegungen synchron bleiben. Die Synchronisation sorgt dafür, dass KUBIs Sprache perfekt zu seinen Gesten passt. hören und neue Aktionsereignisse dynamisch auslösen können. Zum Beispiel:
Das Coole ist, dass Szenarien sogar auf
BigBoy sieht und weiß buchstäblich alles, was vor sich geht. Ziemlich cool, oder?
Mit ElevenLabs unvergessliche Interaktionen schaffendie Stimme zu gestalten in 15 Minuten, komplett mit Emotionen und Pausen, die die Stimme noch menschlicher machen.
Second Space hatte eine sehr spezifische Persönlichkeit für KUBI im Sinn - eine Mischung aus Deadpool, Wheatley aus dem Portal-Spiel und ein bisschen Pathfinder aus Apex Legends. Sie schafften es,
Konversationsmodus (Echtzeit)"Hey KUBI!", kann die Conversational AI von ElevenLabs in 200ms antworten, was die Interaktion wirklich menschlich wirken lässt.
Benutzerdefinierte Konversationswerkzeuge
KUBI auf weitere Märkte ausweitenIntentionen besser erkennen als andere. Sie verwenden derzeit Gemini 2.0 Flash als ihr Kernmodell für Conversational AI und ChatGPT 4o für die statische Sprachgenerierung.
KUBI auf weitere Märkte ausweiten
Fazit
Explore the best alternatives to Speechify.
Scribe transcription outperforms other tools