कॉन्टेंट पर जाएं

Scribe v2 Realtime अब ElevenLabs Agents में लाइव

हमारा अल्ट्रा-लो लेटेंसी स्ट्रीमिंग स्पीच टू टेक्स्ट मॉडल, एजेंटिक उपयोग के लिए अनुकूलित, अब एजेंट्स प्लेटफ़ॉर्म में लाइव है।

rt

अल्ट्रा-लो लेटेंसी

इस हफ्ते, हमने पेश किया

Scribe v2 Realtime transcribes speech in under 150ms with state-of-the-art accuracy, enabling agents to respond as naturally as humans do in conversation.

वास्तविक दुनिया की बातचीत के लिए डिज़ाइन किया गया 

अधिकांश स्पीच टू टेक्स्ट सिस्टम साफ-सुथरे टेस्ट वातावरण में अच्छा प्रदर्शन करते हैं, लेकिन वास्तविकता का सामना करने पर संघर्ष करते हैं - शोरगुल वाले बैकग्राउंड, विविध उच्चारण, या नाम, ईमेल और आईडी जैसे पहचानकर्ता।

Scribe v2 Realtime को इन चुनौतियों से निपटने के लिए प्रशिक्षित किया गया था।

सैकड़ों चुनौतीपूर्ण अंग्रेजी बातचीत के नमूनों पर आंतरिक बेंचमार्क में, जिसमें खराब ऑडियो गुणवत्ता, विविध उच्चारण और फिलर शब्द शामिल थे, Scribe v2 Realtime ने किसी भी प्रतिस्पर्धी रियल-टाइम ASR मॉडल की तुलना में यूज़र की मंशा को अधिक सटीकता से पकड़ा।

नीचे कुछ वास्तविक दुनिया के उदाहरण दिए गए हैं जिन पर हमने विभिन्न वातावरणों में Scribe v2 Realtime ट्रांसक्रिप्शन सटीकता का परीक्षण किया।

 / 

 / 

अग्रणी बहुभाषी सटीकता

एक वैश्विक कंपनी के रूप में, जिसमें स्पेनिश, पुर्तगाली, हिंदी और कई अन्य भाषाओं में बड़ी संख्या में एजेंट्स तैनात हैं, यह महत्वपूर्ण था कि Scribe v2 Realtime ने क्षेत्रों में अत्याधुनिक प्रदर्शन बनाए रखा।

FLEURS बहुभाषी बेंचमार्क पर, जो 30 भाषाओं में सटीकता को मापता है, Scribe v2 Realtime ने किसी भी लो-लेटेंसी ASR मॉडल की तुलना में सबसे कम वर्ड एरर रेट (WER) हासिल किया।

यह उद्यमों को बहुभाषी एजेंट्स लॉन्च करने की अनुमति देता है जो तुरंत और सटीक रूप से प्रतिक्रिया देते हैं, बिना गति या प्रिसिजन से समझौता किए।

अब ElevenLabs Agents में उपलब्ध

Scribe v2 Realtime पूरी तरह से ElevenLabs Agents में इंटीग्रेटेड है और इसे एडवांस्ड कॉन्फ़िगरेशन सेक्शन के तहत सक्षम किया जा सकता है।

product

ElevenLabs टीम के लेखों को देखें

ElevenLabs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें