.webp&w=3840&q=80)
वाइब ड्रॉ बनाना: वॉइस-पावर्ड इमेज क्रिएशन के लिए ElevenLabs को FLUX Kontext के साथ जोड़ना
- श्रेणी
- डेवलपर
- तारीख
हम इनबिल्ट एंटिटी रीडैक्शन, बेहतर इंडिक-इंग्लिश ट्रांसक्रिप्शन, नया नो वर्बेटिम मोड, और 1,000 कीवर्ड्स तक बढ़ा हुआ कीटर्म प्रॉम्प्टिंग ला रहे हैं।
इन सुधारों से डेवलपर्स को प्राइवेसी, मल्टी-लैंग्वेज एक्युरेसी, ट्रांसक्रिप्ट क्वालिटी और डोमेन-स्पेसिफिक प्रिसीजन पर ज्यादा कंट्रोल मिलता है।
अब Scribe v2 ट्रांसक्रिप्ट में से नाम, क्रेडिट कार्ड नंबर, सोशल सिक्योरिटी नंबर और दूसरी पर्सनली आइडेंटिफाएबल जानकारी जैसी संवेदनशील एंटिटीज़ को खुद पहचानकर हटा सकता है।
रीडैक्शन ट्रांसक्रिप्शन के दौरान ही हो जाता है। संवेदनशील डेटा आपके स्टोरेज या आगे के सिस्टम्स तक पहुँचने से पहले ही हटा दिया जाता है।
यह खासतौर पर हेल्थकेयर, फाइनेंस और कस्टमर सपोर्ट टीम्स के लिए जरूरी है, जहाँ कंप्लायंस के लिए PII को स्टोर या शेयर करने से पहले संभालना जरूरी होता है।
भारत में लोग अक्सर इंग्लिश को हिंदी, तेलुगु, कन्नड़ और दूसरी इंडिक भाषाओं के साथ मिलाकर बोलते हैं। कई ट्रांसक्रिप्शन सिस्टम इंग्लिश शब्दों को इंडिक लिपि में लिख देते हैं, जिससे ट्रांसक्रिप्ट असली बातचीत जैसा नहीं लगता।
Scribe v2 इंग्लिश शब्दों को इंग्लिश में ही ट्रांसक्राइब करता है, चाहे आसपास कोई भी भाषा हो। यह अपने आप होता है, किसी लैंग्वेज सेटिंग की जरूरत नहीं। आप इंग्लिश, हिंदी या कोई लैंग्वेज कोड न भी दें, इंग्लिश शब्द लैटिन स्क्रिप्ट में ही रहेंगे।
यह सभी इंडिक भाषाओं पर लागू होता है, सिर्फ हिंदी-इंग्लिश पर नहीं। अगर कोई तेलुगु और इंग्लिश या कन्नड़ और इंग्लिश के बीच स्विच करता है, तो इंग्लिश हिस्से सही ट्रांसक्राइब होते हैं।
हम नो वर्बेटिम मोड ला रहे हैं, जिसमें ट्रांसक्रिप्शन अपने आप "उम्", "अह" जैसे फिलर शब्द, दोहराए गए वाक्यांश और हकलाना हटा देता है।
इससे आपको बिना मैन्युअल एडिटिंग या पोस्ट-प्रोसेसिंग के क्लीन और पढ़ने लायक ट्रांसक्रिप्ट मिलता है।
नो वर्बेटिम मोड मीटिंग नोट्स, सबटाइटल्स और उन सभी वर्कफ़्लो के लिए बढ़िया है, जहाँ आपको हर आवाज़ की कच्ची रिकॉर्डिंग नहीं, बल्कि एक साफ-सुथरा लिखा हुआ रिकॉर्ड चाहिए।
अब कीटर्म प्रॉम्प्टिंग हर ट्रांसक्रिप्ट में 1,000 शब्दों और वाक्यांशों तक सपोर्ट करता है, पहले यह लिमिट 100 थी।
इससे बड़ी टेक्निकल शब्दावली, प्रोडक्ट कैटलॉग या डोमेन-स्पेसिफिक टर्मिनोलॉजी के साथ काम करने वाली टीम्स को मॉडल को सही ट्रांसक्रिप्शन की ओर गाइड करने के लिए ज्यादा जगह मिलती है।
कीटर्म प्रॉम्प्टिंग अब भी कॉन्टेक्स्ट-अवेयर है। मॉडल आसपास के ऑडियो को देखकर तय करता है कि कीटर्म लगाना है या नहीं, सीधे-सीधे शब्द नहीं जोड़ता। 1,000 टर्म्स पर यह पहले से 10 गुना ज्यादा कैपेसिटी है।
नोट: 100 से ज्यादा कीटर्म वाले रिक्वेस्ट्स के लिए कम से कम 20 सेकंड का बिलिंग यूनिट है।
ये सभी फीचर्स आज ही Scribe v2 API और UI में उपलब्ध हैं।
डॉक्युमेंटेशन पढ़ें:
https://elevenlabs.io/docs/cookbooks/speech-to-text/quickstart
ऐप में आज़माएं:
https://elevenlabs.io/app/speech-to-text
.webp&w=3840&q=80)
.webp&w=3840&q=80)
.webp&w=3840&q=80)
.webp&w=3840&q=80)