.webp&w=3840&q=95)
Top 5 Speechify alternatives for reading text aloud
Explore the best alternatives to Speechify.
KUBI to konwersacyjny barista, który działa z Conversational AI od ElevenLabs. Oto jak.
KUBI to konwersacyjny barista i recepcjonista w Second Space, nowoczesnej przestrzeni co-workingowej 24/7 w Kaohsiung, Tajwan. Ponieważ działanie przestrzeni jest w pełni zautomatyzowane, dla KUBI — jako pierwszego punktu kontaktu z członkami — ważne jest, aby dodać unikalny, przyjazny akcent. Dlatego Second Space wybrało
KUBI wykorzystuje zaawansowaną architekturę multisensoryczną do symulacji interakcji przypominającej ludzką. System opiera się na architekturze mikroserwisów, gdzie wyspecjalizowane usługi działają równocześnie i komunikują się przez strumień zdarzeń w czasie rzeczywistym. Te usługi zarządzają różnymi zadaniami, w tym rozpoznawaniem twarzy i obiektów za pomocą AI w czasie rzeczywistym, wykrywaniem kubków i kontrolą poprawności przez kamery, drukowaniem paragonów, bezpiecznym rozpoznawaniem twarzy do kontroli dostępu oraz precyzyjnym sterowaniem dozownikami mleka i ziaren.
Jak działa KUBI
Oto niektóre z usług działających równocześnie:
Dlaczego wszystkie te mikroserwisy? Proste — zarządzamy nimi niezależnie, łatwo skalujemy i używamy najlepszych narzędzi do każdego zadania."BigBoy". To w zasadzie ogromny, nieblokujący procesor zdarzeń:
1 | |
2 | internal object WeatherIdleScenario: SingleTaskScenario(scenario){ |
3 | |
4 | importance = Importance.Medium |
5 | compilationTimeout = Time.ThreeSeconds |
6 | interruptable = false |
7 | exeutionExpiration = = Time.TenSeconds |
8 | |
9 | override fun isEligible(event: Event, environment: Environment): Maybe<Boolean> = withEnvironment(environment) { |
10 | just { |
11 | (event is IdleEvent |
12 | && !triggeredInLast(40.minutes) |
13 | && (personPresent() || hasActiveSessions) |
14 | && environment.weatherService.lastReportWithin(10.minutes)) |
15 | } |
16 | } |
17 | } |
18 | |
19 | private val scenario = ScenarioRecipe { event, env, session -> |
20 | |
21 | |
22 | invokeOneOf( |
23 | |
24 | phrase { |
25 | sayWith { |
26 | "Rainy day today, isn't it? That's why I have my little umbrella! Look!".asEnglish |
27 | }.withAutoGift().withAutoMotion() |
28 | }.given { Weather.isRaining() }, |
29 | |
30 | phrase { |
31 | sayWith { |
32 | "Friend, it's so cold outside! So sad for you... because you're a human. I don't really mind!".asEnglish |
33 | }.withAutoMotion() |
34 | |
35 | sayWith { |
36 | "Wait, that soudned a bit rude.".asEnglish |
37 | }.withAutoMotion() |
38 | |
39 | }.given { Weather.isCold() }, |
40 | |
41 | ) |
42 | |
43 | |
44 | } |
45 | |
46 |
Czym są scenariusze?
Pomyśl o scenariuszach jako o nieblokujących kompilatorach dla zdarzeń akcji robota. Zdarzenie akcji to zazwyczaj najbardziej końcowe zdarzenie, ostatni krok w łańcuchu, prowadzący do fizycznego efektu, takiego jak ruch czy mowa. Na przykład, scenariusz powitania może wywołać:
Pomyśl o scenariuszach jako o nieblokujących kompilatorach dla zdarzeń akcji robota
Synchronizacja zdarzeń akcji: Te zdarzenia przepływają przez harmonogram, który zapewnia synchronizację mowy, wyrazów twarzy i ruchów. Synchronizacja zapewnia, że mowa KUBI idealnie pasuje do jego gestów.
Synchronizacja zdarzeń akcji: Te zdarzenia przepływają następnie przez harmonogram, który zapewnia synchronizację mowy, mimiki i ruchów. Synchronizacja zapewnia, że mowa KUBI idealnie pasuje do jego gestów. i dynamicznie wyzwalać nowe zdarzenia akcji. Na przykład:
Fajne jest to, że scenariusze mogą nawet nasłuchiwać
BigBoy dosłownie widzi i wie wszystko, co się dzieje. Całkiem fajne, prawda?
Wykorzystanie ElevenLabs do tworzenia niezapomnianych interakcjizaprojektować głos w 15 minut, w komplecie z emocjami i pauzami, które sprawiają, że głos brzmi jeszcze bardziej ludzko.
Second Space miało bardzo konkretną osobowość na myśli dla KUBI - mieszankę Deadpoola, Wheatleya z gry Portal i trochę Pathfindera z Apex Legends. Udało im się
Tryb konwersacyjny (w czasie rzeczywistym)"Hej KUBI!", konwersacyjna AI od ElevenLabs potrafi odpowiedzieć w 200ms, sprawiając, że interakcja wydaje się naprawdę ludzka.
Narzędzia konwersacyjne na zamówienie
Rozszerzanie KUBI na dodatkowe rynkiintencje narzędzia niż inne. Obecnie używają Gemini 2.0 Flash jako swojego głównego modelu dla konwersacyjnej AI i ChatGPT 4o do statycznych generacji mowy.
Rozszerzanie KUBI na dodatkowe rynki
Podsumowanie
Explore the best alternatives to Speechify.
Finding the perfect AI voice for your social media videos.