कॉन्टेंट पर जाएं

Scribe v2 को मिला नया अपग्रेड

लेखक
Joe Reeve
Scribe v2 Upgrade 1 1

हम इनबिल्ट एंटिटी रीडैक्शन, बेहतर इंडिक-इंग्लिश ट्रांसक्रिप्शन, नया नो वर्बेटिम मोड, और 1,000 कीवर्ड्स तक बढ़ा हुआ कीटर्म प्रॉम्प्टिंग ला रहे हैं।

इन सुधारों से डेवलपर्स को प्राइवेसी, मल्टी-लैंग्वेज एक्युरेसी, ट्रांसक्रिप्ट क्वालिटी और डोमेन-स्पेसिफिक प्रिसीजन पर ज्यादा कंट्रोल मिलता है।

Scribe v2 में नया एंटिटी रीडैक्शन

अब Scribe v2 ट्रांसक्रिप्ट में से नाम, क्रेडिट कार्ड नंबर, सोशल सिक्योरिटी नंबर और दूसरी पर्सनली आइडेंटिफाएबल जानकारी जैसी संवेदनशील एंटिटीज़ को खुद पहचानकर हटा सकता है।

रीडैक्शन ट्रांसक्रिप्शन के दौरान ही हो जाता है। संवेदनशील डेटा आपके स्टोरेज या आगे के सिस्टम्स तक पहुँचने से पहले ही हटा दिया जाता है।

  • कम्प्लीट रीडैक्शन: एंटिटीज़ को [REDACTED] से बदलता है;
  • कैटेगराइज़्ड: एंटिटी टाइप से बदलता है, जैसे [CREDIT_CARD];
  • एन्यूमरेटेड: कैटेगराइज़्ड और नंबर वाले लेबल से बदलता है, जैसे [CREDIT_CARD_1]।

यह खासतौर पर हेल्थकेयर, फाइनेंस और कस्टमर सपोर्ट टीम्स के लिए जरूरी है, जहाँ कंप्लायंस के लिए PII को स्टोर या शेयर करने से पहले संभालना जरूरी होता है।

सटीक इंडिक-इंग्लिश कोड-स्विचिंग

भारत में लोग अक्सर इंग्लिश को हिंदी, तेलुगु, कन्नड़ और दूसरी इंडिक भाषाओं के साथ मिलाकर बोलते हैं। कई ट्रांसक्रिप्शन सिस्टम इंग्लिश शब्दों को इंडिक लिपि में लिख देते हैं, जिससे ट्रांसक्रिप्ट असली बातचीत जैसा नहीं लगता।

Scribe v2 इंग्लिश शब्दों को इंग्लिश में ही ट्रांसक्राइब करता है, चाहे आसपास कोई भी भाषा हो। यह अपने आप होता है, किसी लैंग्वेज सेटिंग की जरूरत नहीं। आप इंग्लिश, हिंदी या कोई लैंग्वेज कोड न भी दें, इंग्लिश शब्द लैटिन स्क्रिप्ट में ही रहेंगे।

यह सभी इंडिक भाषाओं पर लागू होता है, सिर्फ हिंदी-इंग्लिश पर नहीं। अगर कोई तेलुगु और इंग्लिश या कन्नड़ और इंग्लिश के बीच स्विच करता है, तो इंग्लिश हिस्से सही ट्रांसक्राइब होते हैं।

क्लीन ट्रांसक्रिप्ट के लिए नो वर्बेटिम मोड

हम नो वर्बेटिम मोड ला रहे हैं, जिसमें ट्रांसक्रिप्शन अपने आप "उम्", "अह" जैसे फिलर शब्द, दोहराए गए वाक्यांश और हकलाना हटा देता है।

इससे आपको बिना मैन्युअल एडिटिंग या पोस्ट-प्रोसेसिंग के क्लीन और पढ़ने लायक ट्रांसक्रिप्ट मिलता है।

नो वर्बेटिम मोड मीटिंग नोट्स, सबटाइटल्स और उन सभी वर्कफ़्लो के लिए बढ़िया है, जहाँ आपको हर आवाज़ की कच्ची रिकॉर्डिंग नहीं, बल्कि एक साफ-सुथरा लिखा हुआ रिकॉर्ड चाहिए।

कीटर्म प्रॉम्प्टिंग अब 1,000 तक

अब कीटर्म प्रॉम्प्टिंग हर ट्रांसक्रिप्ट में 1,000 शब्दों और वाक्यांशों तक सपोर्ट करता है, पहले यह लिमिट 100 थी।

इससे बड़ी टेक्निकल शब्दावली, प्रोडक्ट कैटलॉग या डोमेन-स्पेसिफिक टर्मिनोलॉजी के साथ काम करने वाली टीम्स को मॉडल को सही ट्रांसक्रिप्शन की ओर गाइड करने के लिए ज्यादा जगह मिलती है।

कीटर्म प्रॉम्प्टिंग अब भी कॉन्टेक्स्ट-अवेयर है। मॉडल आसपास के ऑडियो को देखकर तय करता है कि कीटर्म लगाना है या नहीं, सीधे-सीधे शब्द नहीं जोड़ता। 1,000 टर्म्स पर यह पहले से 10 गुना ज्यादा कैपेसिटी है।

नोट: 100 से ज्यादा कीटर्म वाले रिक्वेस्ट्स के लिए कम से कम 20 सेकंड का बिलिंग यूनिट है।

अब उपलब्ध

ये सभी फीचर्स आज ही Scribe v2 API और UI में उपलब्ध हैं।

डॉक्युमेंटेशन पढ़ें:
https://elevenlabs.io/docs/cookbooks/speech-to-text/quickstart

ऐप में आज़माएं:
https://elevenlabs.io/app/speech-to-text

ElevenLabs टीम के लेखों को देखें

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं