कॉन्टेंट पर जाएं

Scribe की तुलना OpenAI के 4o स्पीच टू टेक्स्ट मॉडल से

लॉन्च के एक महीने बाद ही Scribe ने साबित कर दिया है कि यह इंडस्ट्री का सबसे एडवांस्ड स्पीच टू टेक्स्ट मॉडल है।

Introducing iScribe v1, the world's most accurate speech-to-text model.

सिर्फ एक महीने में लॉन्च के बाद, हमारा स्पीच टू टेक्स्ट मॉडल Scribe अपनी इंडस्ट्री लीडिंग सटीकता के साथ हज़ारों कंपनियों को आकर्षित कर चुका है। मीडिया कैप्शन से लेकर कॉल सेंटर्स और मेडिकल ट्रांसक्रिप्शन तक, Scribe डेवलपर्स की पहली पसंद बन गया है।

इंडस्ट्री लीडिंग परफॉर्मेंस

कई थर्ड पार्टी एनालिसिस ने हमारे खुद के सटीकता बेंचमार्क्स को कन्फर्म किया है, जिसमें Scribe ने सभी मॉडल्स को पीछे छोड़ा है, यहां तक कि OpenAI के नए 4o ट्रांसक्राइब मॉडल्स को भी। उदाहरण के लिए, एक बेंचमार्क Artificial Analysis से पता चलता है कि Scribe ने वर्ड एरर रेट में 4o और 4o मिनी ट्रांसक्राइब दोनों को पीछे छोड़ दिया है, औसतन:

  • 4o ट्रांसक्राइब Scribe से 16% ज्यादा गलतियां करता है
  • 4o मिनी ट्रांसक्राइब Scribe से 71% ज्यादा गलतियां करता है
Third party speech to text benchmark from Artificial Analysis
Third party speech to text benchmark from Artificial Analysis shows Scribe is the best model

Scribe ने OpenAI के अपने लॉन्च बेंचमार्क में भी 4o और 4o मिनी ट्रांसक्रिप्शन मॉडल्स के बराबर या बेहतर प्रदर्शन किया है, जिनमें से 15 में से 11 भाषाओं में Scribe आगे है। उदाहरण के लिए, जापानी और हिंदी में Scribe दोनों OpenAI के 4o मॉडल्स से काफी बेहतर है, OpenAI के अपने बेंचमार्क्स के अनुसार:

  • जापानी में OpenAI का 4o स्पीच टू टेक्स्ट मॉडल Scribe से 55% ज्यादा गलतियां करता है, और उनका 4o मिनी मॉडल 105% ज्यादा गलतियां करता है
  • हिंदी में OpenAI का 4o स्पीच टू टेक्स्ट मॉडल Scribe से 18% ज्यादा गलतियां करता है, और उनका 4o मिनी मॉडल 37% ज्यादा गलतियां करता है

हमने Scribe में ऐसे फैसले लिए हैं जिससे यह ग्राहकों के लिए ज्यादा उपयोगी हो, भले ही इससे इंडस्ट्री बेंचमार्क्स में कुछ अंतर आ जाएं। उदाहरण के लिए:

  1. Scribe नंबरों को 'one', 'two', 'three' के रूप में कैप्चर करता है, जो ट्रांसक्रिप्ट्स के लिए ज्यादा उपयोगी है, जबकि FLEURS बेंचमार्क असली नंबर '1', '2', '3' का इस्तेमाल करता है, जिससे गलतियां गिनी जाती हैं
  2. Scribe 'hum', 'ha', 'hey' जैसे शब्द भी पहचान सकता है, जिससे ग्राहकों को ज्यादा संदर्भ मिलता है, लेकिन ये शब्द बेंचमार्क्स में नहीं आते, जिससे फिर से आर्टिफिशियल गलतियां गिनी जाती हैं

इसीलिए परफॉर्मेंस को समझने के लिए फाइनल रिजल्ट्स देखना ज्यादा फायदेमंद है। उदाहरण के लिए, अंग्रेज़ी में OpenAI का 4o स्पीच टू टेक्स्ट मॉडल बेंचमार्क्स में Scribe के बराबर है। लेकिन अंग्रेज़ी ट्रांसक्रिप्ट्स की तुलना करने पर Scribe की एडवांस्ड क्षमताएं साफ दिखती हैं।

ट्रांसक्रिप्ट तुलना

इस ट्रांसक्रिप्ट एनालिसिस में यूके संसदीय सुनवाई की, आप देख सकते हैं कि Scribe ने कोई गलती नहीं की और सही तरीके से उच्चारण, अलग-अलग वॉइस टोन और बैकग्राउंड नॉइज़ व हंसी को भी सही लेबल किया।

ElevenLabs का Scribe (ट्रांसक्रिप्ट बनाने में लगा समय: 4.66 सेकंड)

क्या मैं माननीय सज्जन से पूछ सकता हूँ कि क्या काम हो रहा है जिससे यह जगह और ज्यादा सुलभ हो, खासकर हमारे कुछ सहयोगियों के लिए जो दिव्यांग हैं?सुनिए, सुनिए। (भीड़ में हलचल)माफ़ कीजिए, शायद यह मेरी एंटिपोडियन पृष्ठभूमि की वजह से है। क्या वह कृपया सवाल दोहरा सकते हैं, क्योंकि मैं समझ नहीं पाया?(भीड़ में हंसी) वाह। ओह, वाह। आज बहुत लोकप्रिय। उम, मैं- मैं कह रहा था कि- कि कईसंसदीय सहयोगी जो दिव्यांग हैं, उन्हें एस्टेट के कुछ हिस्सों में घूमना काफी मुश्किल लगता है। जब हम यह मरम्मत का काम कर रहे हैं, तो क्या किया जा सकता है जिससे दिव्यांग लोग आसानी से घूम सकें और यह जगह सुलभ हो?मिस्टर पॉल। (भीड़ में हंसी) मुझे सच में खेद है।क्या वह इसे बहुत धीरे-धीरे एंटिपोडियन इंग्लिश में कह सकते हैं?धन्यवाद। कोई भी जवाब दे दीजिए। मुझे लगता है जवाब... मुझे लगता है जवाब मददगार हो सकता हैअगर आप लिखित में जवाब दें जब आप पढ़ें, मिस्टर स्पीकर। ठीक है, क्रिस एलमोर। (हंसी)धन्यवाद, मिस्टर डिप्टी स्पीकर, मैं पहली बार में कोशिश करूंगा।(भीड़ में हलचल) ओह, नहीं। आप वेल्श हैं। क्या मैं- क्या मैं- क्या मैं- क्योंकि मैं वेल्श हूँ, तो भगवान उनकी मदद करें।

OpenAI का 4o (ट्रांसक्रिप्ट बनाने में लगा समय: 5.01 सेकंड)

क्या मैं माननीय सज्जन से पूछ सकता हूँकि क्या काम हो रहा है जिससे यह जगह और ज्यादा सुलभ हो, खासकर हमारे कुछ सहयोगियों के लिए जो दिव्यांग हैं?माफ़ कीजिए, शायद यह मेरी एंटिपोडियन पृष्ठभूमि की वजह से है। क्या वह कृपया सवाल दोहरा सकते हैं, क्योंकि मैं समझ नहीं पाया?वाह, आज बहुत लोकप्रिय। मैं देख रहा हूँ कि कईसंसदीय सहयोगी जो दिव्यांग हैं, उन्हें एस्टेट के कुछ हिस्सों में घूमना काफी मुश्किल लगता है। जब हम यह मरम्मत का काम कर रहे हैं, तो क्या किया जा सकता है जिससे दिव्यांग लोग आसानी से घूम सकें और यह जगह सुलभ हो?मुझे सच में खेद है।क्या आप इसे बहुत धीरे-धीरे एंटिपोडियन इंग्लिश में कह सकते हैं?मुझे लगता है जवाब मददगार हो सकता हैअगर आप लिखित में जवाब दें जब आप इसे पढ़ेंगे।धन्यवाद, मिस्टर डिप्टी स्पीकर। मैं पहली बार में कोशिश करूंगा।क्योंकिमैं वेल्श हूँ, तो भगवान उनकी मदद करें।

Scribe के साथ हकलाहट ट्रांसक्रिप्शन में एक्सेसिबिलिटी

AI में हर नई तरक्की के साथ, एक ऐसा समूह है जिसे अक्सर नजरअंदाज कर दिया जाता है: हकलाने वाले लोग। हकलाना एक जेनेटिक स्पीच डिसऑर्डर है, जो लगभग 1% आबादी को प्रभावित करता है और ऑटोमैटिक स्पीच रिकग्निशन (ASR) सिस्टम्स के लिए खास चुनौती पेश करता है। एक स्टडी में, जहां टेस्ट सैंपल्स में लगभग हर चौथे शब्द में हकलाहट थी, Scribe ने औसतन 98.7% सटीकता के साथ शानदार प्रदर्शन किया। यह फिर साबित करता है कि Scribe इंडस्ट्री में सबसे आगे है और हर एंटरप्राइज जरूरत के लिए एक उपयुक्त मॉडल देता है।

एंटरप्राइज के लिए समाधान

Scribe की परफॉर्मेंस उसके फीचर्स के साथ और भी बेहतर हो जाती है, जो खासतौर पर एंटरप्राइज ग्राहकों की जरूरतों को ध्यान में रखकर बनाए गए हैं।

  • सटीक वर्ड लेवल टाइमस्टैम्प्स क्रिएटर्स, मीडिया और एंटरटेनमेंट के लिए जबरदस्त वैल्यू जोड़ते हैं, जिससे आपके ट्रांसक्रिप्ट्स कैप्शन, सर्चेबल एंट्री और सटीक ट्रांसलेशन में बदल जाते हैं
  • स्मार्ट स्पीकर डायराइजेशन से आप मीटिंग्स, सेल्स पिच या कस्टमर सपोर्ट कॉल्स को समरी कर सकते हैं, जिससे आपकी टीम के बीच सहयोग और ट्रेनिंग बढ़ती है और आपको सबसे सटीक व एक्शन योग्य इनसाइट्स मिलती हैं
  • डायनामिक ऑडियो टैगिंग से आपको अपने ऑडियो इनपुट से ज्यादा कंटेंट और संदर्भ मिलता है, जिससे आप सेंटिमेंट एनालिसिस जैसे फीचर्स इस्तेमाल कर सकते हैं
  • 99 भाषाओं का सपोर्ट, एक ही इंटीग्रेशन से पूरी दुनिया तक पहुंचें
  • ये सभी फीचर्स हमारे API में उपलब्ध हैं, जिससे डेवलपर्स बिना किसी समझौते के बना सकते हैं
  • Scribe का एक रियल टाइम स्ट्रीमिंग वर्शन, साथ ही एक लो लेटेंसी वर्शन भी आने वाले हफ्तों में उपलब्ध होगा। इससे Scribe अब तक का सबसे एडवांस्ड स्पीच टू टेक्स्ट मॉडल बन जाएगा, जो आपके सभी बिज़नेस यूज़ केस कवर करेगा और आपको स्पीड, कीमत और सटीकता के बीच ज्यादा विकल्प और लचीलापन देगा।

आज ही शुरू करें

आज ही Scribe आजमाएं, हमारा वेब प्रोडक्ट 9 अप्रैल तक मुफ़्त है। Scribe की कीमतें बहुत प्रतिस्पर्धी हैं, एंटरप्राइज ग्राहकों के लिए $0.22/घंटा से शुरू। बेझिझक हमारी सेल्स टीम से संपर्क करें, हम डेमो सेटअप करने और आपको दिखाने में खुशी महसूस करेंगे कि हम आपके बिज़नेस में कैसे मदद कर सकते हैं।

ElevenLabs टीम के लेखों को देखें

Company
Audi Revolut F1 Team Headset w/ ElevenLabs Logo

We are on the grid

ElevenLabs is an official partner of Audi Revolut F1 Team

ElevenLabs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें