
Eleven v3 (alpha), now available in the API
Eleven v3 (alpha), the most expressive text to speech model, is now available in the API for every developer.
लॉन्च के एक महीने बाद, Scribe ने साबित कर दिया है कि यह उद्योग का सबसे उन्नत स्पीच टू टेक्स्ट मॉडल है।
सिर्फ एक महीने के बाद, हमारा स्पीच टू टेक्स्ट मॉडल Scribe ने अपनी इंडस्ट्री लीडिंग सटीकता के साथ हजारों कंपनियों को आकर्षित किया है। मीडिया कैप्शन से लेकर कॉल सेंटर और मेडिकल ट्रांसक्रिप्शन तक, Scribe डेवलपर्स के लिए पसंदीदा मॉडल बन गया है।
इंडस्ट्री लीडिंग प्रदर्शन
कई थर्ड पार्टी विश्लेषण ने हमारे अपने सटीकता बेंचमार्क की पुष्टि की है, जिसमें Scribe ने सभी मॉडलों को पीछे छोड़ दिया है, जिसमें OpenAI के नए 4o ट्रांसक्राइब मॉडल भी शामिल हैं। उदाहरण के लिए, कृत्रिम विश्लेषण के बेंचमार्क से पता चलता है कि Scribe ने औसतन वर्ड एरर रेट पर 4o और 4o मिनी ट्रांसक्रिप्ट दोनों को पीछे छोड़ दिया है:
चार्ट डालें
Scribe ने OpenAI के अपने लॉन्च बेंचमार्क में 4o और 4o मिनी ट्रांसक्रिप्शन मॉडल्स के साथ 15 में से 11 भाषाओं में बेहतर प्रदर्शन किया है। जापानी और हिंदी को देखें, Scribe दोनों OpenAI के 4o मॉडल्स से काफी बेहतर है, OpenAI के अपने बेंचमार्क में:
हमने Scribe के साथ ऐसे निर्णय लिए हैं जो ग्राहकों के लिए अधिक उपयोगी हों, भले ही इससे इंडस्ट्री बेंचमार्क में असंगतियाँ उत्पन्न हों। उदाहरण के लिए:
यही कारण है कि प्रदर्शन के बारे में सोचते समय अंतिम परिणामों को देखना सहायक होता है। उदाहरण के लिए, अंग्रेजी में, OpenAI का 4o स्पीच टू टेक्स्ट मॉडल बेंचमार्क में Scribe के समान प्रदर्शन करता है। हालांकि, अंग्रेजी ट्रांसक्रिप्ट्स की तुलना वास्तव में Scribe की उन्नत क्षमताओं को उजागर करती है।House of Dragons ट्रेलर के विश्लेषण में, Scribe कोई गलती नहीं करता, साउंड इफेक्ट्स को पकड़ता है और उन्हें सही ढंग से लेबल करता है, एक इमर्सिव ट्रांसक्रिप्ट बनाता है।
एक
ElevenLabs का Scribe (ट्रांसक्रिप्ट बनाने में लिया गया समय: 4.66s)
मेसी। मेसी! क्या? क्या तुम मजाक कर रहे हो?
एक कला का काम। यह आदमी
पूरी तरह से शुद्ध फुटबॉल जादू का मुख्य स्रोत है। अल्बा अंदर। यह
मेसी! ओह, नहीं! फिर से, दवा वाला आदमी आता है और
अपना जलता हुआ भाला डुबोता है।
क्या मैं माननीय सज्जन से पूछ सकता हूँ
OpenAI का 4o (ट्रांसक्रिप्ट बनाने में लिया गया समय: 5.01s)
मेसी! क्या तुम मजाक कर रहे हो?! यह आदमी
पूरी तरह से पागल है, जैसे शुद्ध फुटबॉल जादू! अल्बा अंदर, यह
मेसी! फिर से! दवा वाला आदमी आता है और
क्या मैं माननीय सज्जन से पूछ सकता हूँयूके संसदीय सुनवाईमुझे खेद है
स्टटरिंग ट्रांसक्रिप्शन के साथ सुलभता
AI में प्रत्येक प्रगति के साथ, एक अक्सर अनदेखा समूह अत्यधिक लाभान्वित होता है: हकलाने वाले लोग। हकलाना, एक आनुवंशिक भाषण विकार जो ~1% आबादी को प्रभावित करता है, स्वचालित भाषण पहचान (ASR) प्रणालियों के लिए अद्वितीय चुनौतियाँ प्रस्तुत करता है। एक अध्ययन में जहां परीक्षण नमूनों में लगभग हर चार शब्दों में हकलाना हुआ, Scribe का प्रदर्शन विशेष रूप से प्रभावशाली है, औसतन 98.7% सटीकता के साथ। यह फिर से साबित करता है कि Scribe उद्योग का नेतृत्व करता है, और सभी एंटरप्राइज आवश्यकताओं के लिए एक मॉडल प्रदान करता है।
(ट्रांसक्रिप्ट बनाने में लिया गया समय: 4.66 सेकंड)सुनो, सुनो। (भीड़ की गड़गड़ाहट)
मुझे खेद है, यह मेरे एंटिपोडियन पृष्ठभूमि से कुछ करना होगा। क्या वह कृपया प्रश्न को दोहरा सकते हैं, क्योंकि मैंने इसे नहीं समझा?(भीड़ हंस रही है) वाह। ओह, वाह। आज बहुत लोकप्रिय। उम, मैं- मैं कह रहा था कि- कि कई
संसदीय सहयोगी जिनके पास विकलांगता है, उन्हें संपत्ति के कुछ हिस्सों के आसपास घूमने में काफी कठिनाई होती है। चूंकि हम यह नवीनीकरण कार्य कर रहे हैं, यह सुनिश्चित करने के लिए क्या किया जा सकता है कि जिनके पास विकलांगता है वे अधिक स्वतंत्र रूप से घूम सकें और स्थान सुलभ हो?श्री पॉल। (भीड़ हंस रही है) मुझे वास्तव में खेद है।
कृपया क्या वह इसे बहुत धीरे-धीरे एंटिपोडियन अंग्रेजी में कर सकते हैं? धन्यवाद। कोई भी पुराना उत्तर दे दो। मुझे लगता है कि उत्तर... मुझे लगता है कि उत्तर मदद कर सकता है
अगर आप लिखित में जवाब दे सकते हैंजब आप पढ़ेंगे, श्री स्पीकर। ठीक है, क्रिस एलमोर। (हंसते हुए)
धन्यवाद, श्री डिप्टी स्पीकर, मैं इसे पहली बार में आजमाऊंगा।(भीड़ की गड़गड़ाहट) ओह, नहीं। तुम वेल्श हो। क्या मैं- क्या मैं- क्या मैं- क्योंकि मैं वेल्श हूँ
, तो भगवान उसकी मदद करें।
एंटरप्राइज के लिए समाधान
Scribe का प्रदर्शन अपने फीचर सेट के साथ जीवंत होता है जो एंटरप्राइज ग्राहकों की आवश्यकताओं को हल करने के लिए तैयार किया गया है।
(ट्रांसक्रिप्ट बनाने में लिया गया समय: 5.01 सेकंड)मुझे खेद है
, यह मेरे एंटिपोडियन पृष्ठभूमि से कुछ करना होगा। क्या वह कृपया प्रश्न को दोहरा सकते हैं, क्योंकि मैंने इसे नहीं समझा?खैर, आज बहुत लोकप्रिय। मैं देख रहा हूँ कि कई
संसदीय सहयोगी जिनके पास विकलांगता है, उन्हें संपत्ति के कुछ हिस्सों के आसपास घूमने में काफी कठिनाई होती है। चूंकि हम यह नवीनीकरण कार्य कर रहे हैं, यह सुनिश्चित करने के लिए क्या किया जा सकता है कि जिनके पास विकलांगता है वे अधिक स्वतंत्र रूप से घूम सकें और स्थान सुलभ हो?मुझे वास्तव में खेद है।
कृपया, क्या आप इसे बहुत धीरे-धीरे एंटिपोडियन अंग्रेजी में कर सकते हैं?मुझे लगता है कि उत्तर मदद कर सकता है
अगर आप लिखित में जवाब दे सकते हैंजब आप इसे पढ़ेंगे।
धन्यवाद, मिस्टर डिप्टी स्पीकर। मैं इसे पहली बार में आजमाऊंगा। क्योंकि
मैं वेल्श हूँ, तो भगवान उसकी मदद करें।
Scribe का प्रदर्शन अपने फीचर सेट के साथ जीवन में आता है जो एंटरप्राइज ग्राहकों की आवश्यकताओं को हल करने के लिए तैयार किया गया है।
आज ही शुरू करें
उद्यम के लिए समाधान
Scribe का प्रदर्शन अपने फीचर सेट के साथ जीवन में आता है जो उद्यम ग्राहकों की जरूरतों को हल करने के लिए तैयार किया गया है।हमारी सेल्स टीम से संपर्क करें, हम आपके व्यवसाय की मदद कैसे कर सकते हैं, यह दिखाने के लिए एक डेमो सेटअप करने में खुशी होगी।
Eleven v3 (alpha), the most expressive text to speech model, is now available in the API for every developer.
Eight seconds of audio from an old VHS tape was all Sarah needed to reclaim her voice with ElevenLabs — and through her Smartbox assistive technology device, finally let her children hear her authentic voice.
ElevenLabs द्वारा संचालित कन्वर्सेशनल AI