Eleven v3 अल्फा का परिचय

v3 आजमाएं

मुफ़्त कैटलन स्पीच टू टेक्स्ट ट्रांसक्रिप्शन

हमारे उन्नत AI ट्रांसक्रिप्शन टूल, Scribe का उपयोग करके मुफ़्त कैटलन स्पीच टू टेक्स्ट। कैटलन वॉइस, ऑडियो, और स्पीच को उच्चतम सटीकता के साथ ट्रांसक्राइब करें—Scribe, Google Gemini और OpenAI Whisper से बेहतर प्रदर्शन करता है, FLEURS बेंचमार्क पर केवल 3.1% और Common Voice पर 5.5% वर्ड एरर रेट के साथ। फिल्मों, पॉडकास्ट, बिजनेस मीटिंग्स, मेडिकल डिक्टेशन और अधिक के लिए सटीक कैटलन ट्रांसक्रिप्शन प्राप्त करें।

पूरे ऑडियो AI प्लेटफ़ॉर्म का अनुभव करें

हर शब्द, पूरी तरह से कैप्चर

Scribe हर बारीकी को सुनता है, प्रत्येक कैटलन शब्द को अद्वितीय सटीकता के साथ कैप्चर करता है। 99 भाषाओं में ऑडियो ट्रांसक्रिप्शन प्रदान करता है—कैरेक्टर-लेवल टाइमस्टैम्प्स, स्पीकर डायराइजेशन, और ऑडियो-इवेंट टैगिंग के साथ, यह सहज इंटीग्रेशन के लिए संरचित परिणाम लौटाता है।

कैटलन ट्रांसक्रिप्शन बेंचमार्क

मॉडलफ्लेयर्स
Scribe v1
2.5% WER
Deepgram Nova 2
6.3% WER
Gemini Flash 2
3.8% WER
Whisper Large v3
6.2% WER

आपके ऐप के लिए शक्तिशाली कैटलन ऑडियो टू टेक्स्ट फीचर्स

Scribe के साथ अपने कैटलन ऑडियो को त्रुटिरहित टेक्स्ट में बदलें, जो दुनिया का सबसे उन्नत ASR (ऑटोमैटिक स्पीच रिकग्निशन) मॉडल है, जिसमें सबसे सरल स्पीच टू टेक्स्ट API इंटीग्रेशन है।

Progress bar with a gradient from black to purple, labeled "II Scribe V1," "Gemini 2.0 Flash," and "Whisper Large v3" on a black background.

उद्योग-अग्रणी सटीकता

अभूतपूर्व सटीकता प्राप्त करें—Scribe कैटलन ट्रांसक्रिप्शन के लिए उद्योग का सबसे कम वर्ड एरर रेट प्रदान करता है।

Three colorful, glowing circles with radial patterns on a black background.

स्मार्ट स्पीकर डायराइजेशन

किसी भी बातचीत में, यहां तक कि सबसे व्यस्त में भी, Scribe सहजता से प्रत्येक स्पीकर को पहचानता और लेबल करता है, स्पष्ट और संगठित ट्रांसक्रिप्ट्स के लिए।

Audio level meter with red peaks at 1:00, T4 and T5 markers, and time stamps at 0:58 and 1:02.

सटीक शब्द-स्तरीय टाइमस्टैम्प्स

प्रत्येक शब्द बोले जाने का सटीक क्षण कैप्चर करें। Scribe के विस्तृत टाइमस्टैम्प्स सहज सबटाइटल सिंकिंग और इंटरैक्टिव ऑडियो अनुभवों को सक्षम करते हैं।

'It that funny? (laughter)

डायनामिक ऑडियो टैगिंग

हंसी से लेकर कदमों तक, Scribe का ट्रांसक्रिप्शन मॉडल प्रत्येक ध्वनि घटना को टैग करता है, आपके कैटलन ट्रांसक्रिप्ट्स को आपके ऑडियो के पूर्ण संदर्भ के साथ समृद्ध करता है।

Multilingual text with the word "Multilingual" highlighted in blue and pink on a black background.

वैश्विक भाषा समर्थन

कैटलन और 98 अन्य भाषाओं के समर्थन के साथ भाषा बाधाओं को तोड़ें—Scribe उन भाषाओं के लिए AI ट्रांसक्रिप्शन क्षमताओं को अनलॉक करता है जो पहले पहुंच से बाहर थीं।

भाषा का अवलोकन

कैटलन भाषा की जानकारी

स्पीकर्स: 10 मिलियन उच्चारण: सेंट्रल (बार्सिलोना), वेलेंसियन, बैलेरिक, नॉर्थवेस्टर्न आधिकारिक भाषा: अंडोरा (एकमात्र आधिकारिक), स्पेन (कैटालोनिया, वेलेंसिया, और बैलेरिक द्वीपों में सह-आधिकारिक) बोली जाती है: उत्तरपूर्वी स्पेन (कैटालोनिया, वेलेंसिया, बैलेरिक द्वीप), अंडोरा, और फ्रांस और इटली के कुछ हिस्सों में एक रोमांस भाषा जिसमें इबेरियन और गैलो-रोमांस भाषाओं की विशेषताएं हैं। इसकी अनूठी ध्वन्यात्मकता और मध्य युग से महत्वपूर्ण साहित्यिक परंपरा के लिए जाना जाता है।

डेवलपर्स

ElevenLabs Scribe को इंटीग्रेट करें

दुनिया के सबसे सटीक स्पीच टू टेक्स्ट मॉडल को अपने एप्लिकेशन में सहजता से इंटीग्रेट करें। हमारे डेवलपर-फ्रेंडली उदाहरणों के साथ शुरुआत करें जो डायराइजेशन, कैरेक्टर-लेवल टाइमस्टैम्प्स, और ऑडियो-इवेंट टैगिंग जैसी विशेषताओं को दिखाते हैं।

99 भाषाओं में AI स्पीच टू टेक्स्ट ट्रांसक्रिप्शन

हमारा AI स्पीच टू टेक्स्ट ट्रांसक्रिप्शन 99 भाषाओं का समर्थन करता है, बस भाषा चुनें और अपनी ऑडियो फ़ाइल अपलोड करें।

अफ्रीकान्स
अम्हारिक
अरबी
आर्मेनियाई
असमिया
अस्तूरियन
अज़रबैजानी
बेलारूसी
बंगाली
बोस्नियाई
बुल्गारियाई
बर्मी
कैंटोनीज़
कैटलन
सेंट्रल कुर्दिश
चिचेवा
चीनी
क्रोएशियाई
चेक
डेनिश
डच
अंग्रेज़ी
एस्टोनियाई
फिलिपिनो
फिनिश
फ्रेंच
फुलाह
गैलिशियन
गांडा
जॉर्जियाई
जर्मन
यूनानी
गुजराती
हौसा
हिब्रू
हिंदी
हंगेरियन
आइसलैंडिक
इग्बो
इंडोनेशियाई
आयरिश
इतालवी
जापानी
जावानीज़
काबुवेर्दियानु
कन्नड़
कज़ाख
खमेर
किर्गिज़
कोरियाई
लाओ
लातवियाई
लिंगाला
लिथुआनियाई
लुओ
लक्समबर्गी
मैसिडोनियाई
मलय
मलयालम
माल्टीज़
माओरी
मराठी
मंगोलियाई
नेपाली
नॉर्दर्न सोथो
नॉर्वेजियन
ऑक्सिटन
उड़िया
पश्तो
पेडी
फारसी
पोलिश
पुर्तगाली
पंजाबी
रोमानियाई
रूसी
सर्बियाई
शोना
सिंधी
स्लोवाक
स्लोवेनियाई
सोमाली
स्पेनिश
स्वाहिली
स्वीडिश
ताजिक
तमिल
तेलुगु
थाई
तुर्की
यूक्रेनी
उम्बुंडु
उर्दू
उज़्बेक
वियतनामी
वेल्श
वोलोफ
खोसा
ज़ुलु

अक्सर पूछे जाने वाले प्रश्न

उत्कृष्ट सटीकता (≤ 5% वर्ड एरर रेट - WER)
बुल्गारियन, कैटलन, चेक, डेनिश, डच, अंग्रेजी, फिनिश, फ्रेंच, गैलिशियन, जर्मन, ग्रीक, हिंदी, इंडोनेशियाई, इतालवी, जापानी, कन्नड़, मलय, मलयालम, मैसिडोनियन, नॉर्वेजियन, पोलिश, पुर्तगाली, रोमानियाई, रूसी, सर्बियाई, स्लोवाक, स्पेनिश, स्वीडिश, तुर्की, यूक्रेनी, वियतनामी

उच्च सटीकता (>5% से ≤10% WER)
बंगाली, बेलारूसी, बोस्नियाई, कैंटोनीज़, एस्टोनियन, फिलिपिनो, गुजराती, हंगेरियन, कज़ाख, लातवियाई, लिथुआनियाई, मंदारिन, मराठी, नेपाली, ओडिया, फारसी, स्लोवेनियाई, तमिल, तेलुगु

अच्छा (>10% से ≤25% WER)
अफ्रीकी, अरबी, अर्मेनियाई, असमिया, अस्तुरियन, अज़रबैजानी, बर्मी, सेबुआनो, क्रोएशियाई, जॉर्जियन, हौसा, हिब्रू, आइसलैंडिक, जावानीस, कबुवेर्दियानु, कोरियाई, किर्गिज़, लिंगाला, माल्टीज़, मंगोलियाई, माओरी, ऑक्सिटन, पंजाबी, सिंधी, स्वाहिली, ताजिक, थाई, उर्दू, उज़्बेक, वेल्श

मध्यम (>25% से ≤50% WER)
अम्हारिक, चिचेवा, फुलाह, गंडा, इग्बो, आयरिश, खमेर, कुर्दिश, लाओ, लक्ज़मबर्गिश, लुओ, उत्तरी सोथो, पश्तो, शोना, सोमाली, उम्बुंडु, वोलोफ, खोसा, ज़ुलु

स्पीच टू टेक्स्ट एक तकनीक है जो बोले गए कैटलन को स्वचालित स्पीच रिकग्निशन (ASR) का उपयोग करके लिखित टेक्स्ट में ट्रांसक्राइब करती है। यह ऑडियो सिग्नल्स को प्रोसेस करता है, स्पीच पैटर्न्स की पहचान करता है, और उन्हें उच्च सटीकता के साथ टेक्स्ट में ट्रांसक्राइब करता है। ElevenLabs का AI-संचालित स्पीच टू टेक्स्ट सॉफ़्टवेयर ऑडियो और वीडियो सामग्री को मानव जैसी सटीकता के साथ ट्रांसक्राइब करने के लिए डिज़ाइन किया गया है, जो वॉइस-टू-टेक्स्ट कन्वर्ज़न, ऑडियो ट्रांसक्रिप्शन, और रियल-टाइम स्पीच रिकग्निशन के लिए आदर्श है। स्पीच टू टेक्स्ट तकनीक का उपयोग होता है: ✔ पॉडकास्ट, मीटिंग्स, और इंटरव्यू के लिए ऑडियो-टू-टेक्स्ट ट्रांसक्रिप्शन। ✔ वीडियो सामग्री में कैप्शन और सबटाइटल्स। ✔ हैंड्स-फ्री टाइपिंग और एक्सेसिबिलिटी टूल्स के लिए वॉइस-टू-टेक्स्ट सॉफ़्टवेयर। ElevenLabs ASR कई भाषाओं और उच्चारणों के लिए तेज़, विश्वसनीय, और अत्यधिक सटीक स्पीच टू टेक्स्ट कन्वर्ज़न प्रदान करता है।

ElevenLabs वीडियो ट्रांसक्रिप्शन प्रदान करता है जो बोले गए कैटलन संवाद को टेक्स्ट प्रारूप में ट्रांसक्राइब करता है, जिससे सबटाइटल्स, कैप्शन, और खोजने योग्य ट्रांसक्रिप्ट्स बनाना आसान हो जाता है। वीडियो को टेक्स्ट में ट्रांसक्राइब करने के चरण: 1. अपनी वीडियो फ़ाइल को ElevenLabs ASR में अपलोड करें 2. स्पीच रिकग्निशन तकनीक ऑडियो को प्रोसेस करती है 3. एक ट्रांसक्रिप्ट स्वचालित रूप से उत्पन्न होता है, टाइमस्टैम्प्स के साथ 4. टेक्स्ट फ़ाइल डाउनलोड करें या संपादन के लिए सबटाइटल्स निर्यात करें। यह AI-संचालित वीडियो ट्रांसक्रिप्शन मॉडल सामग्री निर्माताओं, व्यवसायों, और शिक्षकों को वीडियो स्पीच को सटीक टेक्स्ट में जल्दी से ट्रांसक्राइब करने में मदद करता है, एक्सेसिबिलिटी और सामग्री पुन: उपयोग के लिए।

Scribe वर्तमान में उन उपयोग मामलों के लिए अच्छी तरह से काम करता है जहां इनपुट ऑडियो पहले से उपलब्ध है। एक कम-विलंबता, रियल-टाइम संस्करण जल्द ही जारी किया जाएगा।

$0.40 प्रति घंटे ट्रांसक्राइब किए गए ऑडियो की लागत, एंटरप्राइज योजनाओं के साथ बड़े पैमाने पर इससे भी कम।
ElevenLabs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें