Question 1

Scribe किन भाषाओं का समर्थन करता है?

Accepted Answer

उत्कृष्ट सटीकता (≤ 5% वर्ड एरर रेट - WER)
बुल्गारियन, कैटलन, चेक, डेनिश, डच, अंग्रेजी, फिनिश, फ्रेंच, गैलिशियन, जर्मन, ग्रीक, हिंदी, इंडोनेशियाई, इतालवी, जापानी, कन्नड़, मलय, मलयालम, मैसिडोनियन, नॉर्वेजियन, पोलिश, पुर्तगाली, रोमानियाई, रूसी, सर्बियाई, स्लोवाक, स्पेनिश, स्वीडिश, तुर्की, यूक्रेनी, वियतनामी

उच्च सटीकता (>5% से ≤10% WER)
बंगाली, बेलारूसी, बोस्नियाई, कैंटोनीज़, एस्टोनियन, फिलिपिनो, गुजराती, हंगेरियन, कज़ाख, लातवियाई, लिथुआनियाई, मंदारिन, मराठी, नेपाली, ओडिया, फारसी, स्लोवेनियाई, तमिल, तेलुगु

अच्छा (>10% से ≤25% WER)
अफ्रीकी, अरबी, अर्मेनियाई, असमिया, अस्तुरियन, अज़रबैजानी, बर्मी, सेबुआनो, क्रोएशियाई, जॉर्जियन, हौसा, हिब्रू, आइसलैंडिक, जावानीस, कबुवेर्दियानु, कोरियाई, किर्गिज़, लिंगाला, माल्टीज़, मंगोलियाई, माओरी, ऑक्सिटन, पंजाबी, सिंधी, स्वाहिली, ताजिक, थाई, उर्दू, उज़्बेक, वेल्श

मध्यम (>25% से ≤50% WER)
अम्हारिक, चिचेवा, फुलाह, गंडा, इग्बो, आयरिश, खमेर, कुर्दिश, लाओ, लक्ज़मबर्गिश, लुओ, उत्तरी सोथो, पश्तो, शोना, सोमाली, उम्बुंडु, वोलोफ, खोसा, ज़ुलु

Question 2

कैटलन स्पीच टू टेक्स्ट क्या है और यह कैसे काम करता है?

Accepted Answer

स्पीच टू टेक्स्ट एक तकनीक है जो बोले गए कैटलन को स्वचालित स्पीच रिकग्निशन (ASR) का उपयोग करके लिखित टेक्स्ट में ट्रांसक्राइब करती है। यह ऑडियो सिग्नल्स को प्रोसेस करता है, स्पीच पैटर्न्स की पहचान करता है, और उन्हें उच्च सटीकता के साथ टेक्स्ट में ट्रांसक्राइब करता है।

ElevenLabs का AI-संचालित स्पीच टू टेक्स्ट सॉफ़्टवेयर ऑडियो और वीडियो सामग्री को मानव जैसी सटीकता के साथ ट्रांसक्राइब करने के लिए डिज़ाइन किया गया है, जो वॉइस-टू-टेक्स्ट कन्वर्ज़न, ऑडियो ट्रांसक्रिप्शन, और रियल-टाइम स्पीच रिकग्निशन के लिए आदर्श है।

स्पीच टू टेक्स्ट तकनीक का उपयोग होता है:
 ✔ पॉडकास्ट, मीटिंग्स, और इंटरव्यू के लिए ऑडियो-टू-टेक्स्ट ट्रांसक्रिप्शन।
 ✔ वीडियो सामग्री में कैप्शन और सबटाइटल्स।
 ✔ हैंड्स-फ्री टाइपिंग और एक्सेसिबिलिटी टूल्स के लिए वॉइस-टू-टेक्स्ट सॉफ़्टवेयर।

ElevenLabs ASR कई भाषाओं और उच्चारणों के लिए तेज़, विश्वसनीय, और अत्यधिक सटीक स्पीच टू टेक्स्ट कन्वर्ज़न प्रदान करता है।

Question 3

कैटलन वीडियो को टेक्स्ट में कैसे ट्रांसक्राइब करें?

Accepted Answer

ElevenLabs वीडियो ट्रांसक्रिप्शन प्रदान करता है जो बोले गए कैटलन संवाद को टेक्स्ट प्रारूप में ट्रांसक्राइब करता है, जिससे सबटाइटल्स, कैप्शन, और खोजने योग्य ट्रांसक्रिप्ट्स बनाना आसान हो जाता है।

वीडियो को टेक्स्ट में ट्रांसक्राइब करने के चरण:
1. अपनी वीडियो फ़ाइल को ElevenLabs ASR में अपलोड करें
2. स्पीच रिकग्निशन तकनीक ऑडियो को प्रोसेस करती है
3. एक ट्रांसक्रिप्ट स्वचालित रूप से उत्पन्न होता है, टाइमस्टैम्प्स के साथ
4. टेक्स्ट फ़ाइल डाउनलोड करें या संपादन के लिए सबटाइटल्स निर्यात करें।

यह AI-संचालित वीडियो ट्रांसक्रिप्शन मॉडल सामग्री निर्माताओं, व्यवसायों, और शिक्षकों को वीडियो स्पीच को सटीक टेक्स्ट में जल्दी से ट्रांसक्राइब करने में मदद करता है, एक्सेसिबिलिटी और सामग्री पुन: उपयोग के लिए।

Question 4

क्या ElevenLabs रियल-टाइम स्पीच-टू-टेक्स्ट कन्वर्ज़न का समर्थन करता है?

Accepted Answer

Scribe वर्तमान में उन उपयोग मामलों के लिए अच्छी तरह से काम करता है जहां इनपुट ऑडियो पहले से उपलब्ध है। एक कम-विलंबता, रियल-टाइम संस्करण जल्द ही जारी किया जाएगा।

Question 5

Scribe की लागत कितनी है?

Accepted Answer

$0.40 प्रति घंटे ट्रांसक्राइब किए गए ऑडियो की लागत, एंटरप्राइज योजनाओं के साथ बड़े पैमाने पर इससे भी कम।

मॉडल	फ्लेयर्स
Scribe v1	2.5% WER
Deepgram Nova 2	6.3% WER
Gemini Flash 2	3.8% WER
Whisper Large v3	6.2% WER

मुफ़्त कैटलन स्पीच टू टेक्स्ट ट्रांसक्रिप्शन

हर शब्द, पूरी तरह से कैप्चर

कैटलन ट्रांसक्रिप्शन बेंचमार्क

आपके ऐप के लिए शक्तिशाली कैटलन ऑडियो टू टेक्स्ट फीचर्स

उद्योग-अग्रणी सटीकता

स्मार्ट स्पीकर डायराइजेशन

सटीक शब्द-स्तरीय टाइमस्टैम्प्स

डायनामिक ऑडियो टैगिंग

वैश्विक भाषा समर्थन

भाषा का अवलोकन

कैटलन भाषा की जानकारी

डेवलपर्स

ElevenLabs Scribe को इंटीग्रेट करें

99 भाषाओं में AI स्पीच टू टेक्स्ट ट्रांसक्रिप्शन

अक्सर पूछे जाने वाले प्रश्न