
How we scaled our customer interview process with ElevenLabs Agents
We used ElevenLabs Agents to interview over 230 users of our ElevenReader app in 24 Hours.
हमारा अल्ट्रा-लो लेटेंसी स्ट्रीमिंग स्पीच टू टेक्स्ट मॉडल, एजेंटिक उपयोग के लिए अनुकूलित, अब एजेंट्स प्लेटफ़ॉर्म में लाइव है।
इस हफ्ते, हमने पेश किया
Scribe v2 Realtime transcribes speech in under 150ms with state-of-the-art accuracy, enabling agents to respond as naturally as humans do in conversation.
अधिकांश स्पीच टू टेक्स्ट सिस्टम साफ-सुथरे टेस्ट वातावरण में अच्छा प्रदर्शन करते हैं, लेकिन वास्तविकता का सामना करने पर संघर्ष करते हैं - शोरगुल वाले बैकग्राउंड, विविध उच्चारण, या नाम, ईमेल और आईडी जैसे पहचानकर्ता।
Scribe v2 Realtime को इन चुनौतियों से निपटने के लिए प्रशिक्षित किया गया था।
सैकड़ों चुनौतीपूर्ण अंग्रेजी बातचीत के नमूनों पर आंतरिक बेंचमार्क में, जिसमें खराब ऑडियो गुणवत्ता, विविध उच्चारण और फिलर शब्द शामिल थे, Scribe v2 Realtime ने किसी भी प्रतिस्पर्धी रियल-टाइम ASR मॉडल की तुलना में यूज़र की मंशा को अधिक सटीकता से पकड़ा।
नीचे कुछ वास्तविक दुनिया के उदाहरण दिए गए हैं जिन पर हमने विभिन्न वातावरणों में Scribe v2 Realtime ट्रांसक्रिप्शन सटीकता का परीक्षण किया।
एक वैश्विक कंपनी के रूप में, जिसमें स्पेनिश, पुर्तगाली, हिंदी और कई अन्य भाषाओं में बड़ी संख्या में एजेंट्स तैनात हैं, यह महत्वपूर्ण था कि Scribe v2 Realtime ने क्षेत्रों में अत्याधुनिक प्रदर्शन बनाए रखा।
FLEURS बहुभाषी बेंचमार्क पर, जो 30 भाषाओं में सटीकता को मापता है, Scribe v2 Realtime ने किसी भी लो-लेटेंसी ASR मॉडल की तुलना में सबसे कम वर्ड एरर रेट (WER) हासिल किया।
यह उद्यमों को बहुभाषी एजेंट्स लॉन्च करने की अनुमति देता है जो तुरंत और सटीक रूप से प्रतिक्रिया देते हैं, बिना गति या प्रिसिजन से समझौता किए।
Scribe v2 Realtime पूरी तरह से ElevenLabs Agents में इंटीग्रेटेड है और इसे एडवांस्ड कॉन्फ़िगरेशन सेक्शन के तहत सक्षम किया जा सकता है।


We used ElevenLabs Agents to interview over 230 users of our ElevenReader app in 24 Hours.

Enabling cinematic storytelling with Text to Speech and Music
ElevenLabs द्वारा संचालित एजेंट्स