मिलिए Scribe से

दुनिया के सबसे सटीक ASR मॉडल के साथ स्पीच को टेक्स्ट में ट्रांसक्राइब करें

Introducing IIscribe V1, the world's most accurate speech-to-text model.

Scribe, हमारा पहला स्पीच टू टेक्स्टमॉडल, दुनिया का सबसे सटीक ट्रांसक्रिप्शन मॉडल है। वास्तविक दुनिया के ऑडियो की अनिश्चितता को संभालने के लिए बनाया गया, Scribe 99 भाषाओं में स्पीच को ट्रांसक्राइब करता है, जिसमें शब्द-स्तरीय टाइमस्टैम्प, स्पीकर डायराइजेशन, और ऑडियो-इवेंट टैगिंग शामिल हैं—यह सब एक संरचित प्रतिक्रिया में दिया जाता है ताकि इसे आसानी से इंटीग्रेट किया जा सके।

Scribe को सटीकता के लिए डिज़ाइन किया गया है। 99 भाषाओं में FLEURS और Common Voice बेंचमार्क टेस्ट में, यह लगातार Gemini 2.0 Flash, Whisper Large V3 और Deepgram Nova-3 जैसे प्रमुख मॉडलों से बेहतर प्रदर्शन करता है। चाहे वह मीटिंग सारांश हो, मूवी सबटाइटल्स हों, या गाने के बोल, Scribe इटालियन (98.7%), अंग्रेजी (96.7%) और 97 अन्य भाषाओं में सबसे कम स्वचालित ट्रांसक्रिप्शन शब्द त्रुटि दर प्रदान करता है।

Scribe ASR को सार्वभौमिक रूप से सुलभ बनाता है—पारंपरिक रूप से कम सेवा प्राप्त भाषाओं जैसे सर्बियन, कैंटोनीज़, और मलयालम में त्रुटियों को नाटकीय रूप से कम करता है, जहां प्रतिस्पर्धी मॉडल अक्सर 40% शब्द त्रुटि दर से अधिक होते हैं।

The world's most accurate ASR model by IIElevenLabs.

डेवलपर्स आज ही Scribe को हमारे स्पीच टू टेक्स्ट API के माध्यम से इंटीग्रेट कर सकते हैं ताकि स्पीकर डायराइजेशन और शब्द-स्तरीय टाइमस्टैम्प्स और गैर-भाषण इवेंट मार्कर्स (जैसे हंसी) के साथ संरचित JSON ट्रांसक्रिप्ट्स प्राप्त कर सकें। रियल-टाइम एप्लिकेशन्स के लिए एक लो-लेटेंसी संस्करण जल्द ही जारी किया जाएगा।

क्रिएटर्स और व्यवसाय Scribe का सीधे ElevenLabs डैशबोर्ड के माध्यम से उपयोग कर सकते हैं ताकि ऑडियो या वीडियो फाइल्स अपलोड कर सकें और फॉर्मेटेड ट्रांसक्रिप्ट्स जनरेट कर सकें।

Scribe के साथ निर्माण शुरू करें:

API डॉक्यूमेंटेशन | ElevenLabs डैशबोर्ड में आजमाएं

बेंचमार्क्स

FLEURS - शब्द त्रुटि दर % - 102 भाषाएं

Bar chart comparing word error rates for different languages and speech recognition models.

Common Voice - शब्द त्रुटि दर % - 102 भाषाएं

Bar chart comparing word error rates for different voice recognition models across various countries.

योगदान

अनुसंधान नेतृत्व, प्रशिक्षण, आर्किटेक्चर

फ्लावियो श्नाइडर

प्रोजेक्ट नेतृत्व, प्री-ट्रेनिंग डेटा, फाइन-ट्यूनिंग डेटा

टिम वॉन केनेल

इन्फरेंस, ऑप्टिमाइजेशन

मैक्सिमिलियानो लेवी

अनुसंधान योगदानकर्ता

जोहान नॉर्डबर्ग, पिओत्र डाबकोव्स्की

फ्रंटएंड

ऑस्टिन मलेर्बा

बैकएंड

ह्रिस्तो स्टोयचेव

डेटा अधिग्रहण

एलेक्स जॉर्ज

ElevenLabs टीम के लेखों को देखें

रिसर्च
Text on a gray gradient background introducing IIFlash v2.5, highlighting 75ms model latency and support for 32 languages.

फ्लैश से मिलिए

आपने कभी भी इतनी तेजी से मानव-जैसी TTS का अनुभव नहीं किया होगा

प्रोडक्ट
Conversational AI SEO Image

कन्वर्सेशनल AI का परिचय

हमारा ऑल इन वन प्लेटफॉर्म जो कस्टमाइज़ेबल, इंटरैक्टिव वॉइस एजेंट्स बनाने के लिए है

ElevenLabs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें