
ElevenLabs vs. Cartesia (June 2025)
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
KUBIはElevenLabsの会話型AIを活用したバリスタです。詳しくはこちら。
KUBIは会話型バリスタ兼受付係です。Second Space、台湾高雄の次世代24時間営業のコワーキングスペースです。ワークスペースの運営が完全に自動化されているため、KUBIがメンバーとの最初の接点としてユニークでフレンドリーなタッチを加えることが非常に重要です。そのため、Second SpaceはElevenLabsの
KUBIは高度なマルチセンサーアーキテクチャを採用し、人間のようなやり取りをシミュレートします。このシステムはマイクロサービスアーキテクチャに基づいており、専門化されたサービスが同時に動作し、リアルタイムのイベントストリームを介して通信します。これらのサービスは、リアルタイムAI推論を使用した顔や物体の認識、カメラを使ったカップ検出と安全確認、レシート印刷、アクセス制御のための安全な顔認識、ミルクと豆のディスペンサーの正確な制御など、さまざまなタスクを管理します。
KUBIの仕組み
同時に動作しているサービスの一部は次のとおりです:
なぜこれらのマイクロサービスが必要なのか?簡単です — 独立して管理し、簡単にスケールし、各タスクに最適なツールを使用します。BigBoy」と呼ばれる中央サービスです。これは本質的に巨大なノンブロッキングイベントプロセッサです:
1 | |
2 | internal object WeatherIdleScenario: SingleTaskScenario(scenario){ |
3 | |
4 | importance = Importance.Medium |
5 | compilationTimeout = Time.ThreeSeconds |
6 | interruptable = false |
7 | exeutionExpiration = = Time.TenSeconds |
8 | |
9 | override fun isEligible(event: Event, environment: Environment): Maybe<Boolean> = withEnvironment(environment) { |
10 | just { |
11 | (event is IdleEvent |
12 | && !triggeredInLast(40.minutes) |
13 | && (personPresent() || hasActiveSessions) |
14 | && environment.weatherService.lastReportWithin(10.minutes)) |
15 | } |
16 | } |
17 | } |
18 | |
19 | private val scenario = ScenarioRecipe { event, env, session -> |
20 | |
21 | |
22 | invokeOneOf( |
23 | |
24 | phrase { |
25 | sayWith { |
26 | "Rainy day today, isn't it? That's why I have my little umbrella! Look!".asEnglish |
27 | }.withAutoGift().withAutoMotion() |
28 | }.given { Weather.isRaining() }, |
29 | |
30 | phrase { |
31 | sayWith { |
32 | "Friend, it's so cold outside! So sad for you... because you're a human. I don't really mind!".asEnglish |
33 | }.withAutoMotion() |
34 | |
35 | sayWith { |
36 | "Wait, that soudned a bit rude.".asEnglish |
37 | }.withAutoMotion() |
38 | |
39 | }.given { Weather.isCold() }, |
40 | |
41 | ) |
42 | |
43 | |
44 | } |
45 | |
46 |
シナリオとは?
シナリオをロボットのアクションイベントのためのノンブロッキングコンパイラと考えてください。アクションイベントは通常、物理的な効果をもたらすチェーンの最後のステップで、動作や音声などです。例えば、挨拶のシナリオは次のようにトリガーされるかもしれません:
シナリオをロボットのアクションイベント
アクションイベントの同期:これらのイベントは、スケジューラーを通じて流れ、音声、表情、動作が同期されるようにします。同期により、KUBIの音声がジェスチャーと完全に一致します。
アクションイベントの同期:これらのイベントはスケジューラーを通じて流れ、スピーチ、表情、動作が同期されるようにします。同期により、KUBIのスピーチがジェスチャーと完全に一致します。を聞いて新しいアクションイベントを動的にトリガーできることです。例えば:
面白いことに、シナリオは
BigBoyは文字通りすべてを見て知っています。すごいですよね?
ElevenLabsを使用して記憶に残るやり取りを作成声をデザインし、感情や間を含めて声をより人間らしくすることができました。
Second SpaceはKUBIに非常に具体的な個性を求めていました。Deadpool、PortalゲームのWheatley、Apex LegendsのPathfinderを混ぜたようなものです。彼らは
会話モード(リアルタイム)Hey KUBI!」と言うと、ElevenLabsの会話型AIが200msで応答し、やり取りが本当に人間らしく感じられます。
カスタム会話ツール
KUBIを他の市場に拡大意図を他のモデルよりもよく認識することに気づきました。彼らは現在、会話型AIのコアモデルとしてGemini 2.0 Flashを使用し、静的音声生成にはChatGPT 4oを使用しています。
KUBIを他の市場に拡大
結論
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Compare PlayHT with other TTS platforms that offer similar features. Analyze voice quality, clarity, and emotional delivery.
Powered by ElevenLabs 会話型AI