Scribe v2 Realtime से मिलिए
- प्रकाशित
सुनेंइस आर्टिकल को सुनें
Scribe v2 Realtime: लाइव ट्रांसक्रिप्शन के लिए सबसे सटीक मॉडल

Scribe v2 Realtime कम लेटेंसी वाले स्पीच टू टेक्स्ट के लिए नया स्टैंडर्ड सेट करता है।
लाइव इस्तेमाल के लिए बनाया गया—वॉइस एजेंट्स, मीटिंग असिस्टेंट्स और रियल-टाइम कैप्शनिंग—यह इंग्लिश, फ्रेंच, जर्मन, इटालियन, स्पैनिश, पुर्तगाली और 90 भाषाओं में 150 ms से भी कम समय में स्पीच ट्रांसक्राइब करता है।

Scribe v2 Realtime खास तौर पर एजेंटिक यूज़ केस के लिए बनाया गया है। 500 मुश्किल सैंपल्स (जिनमें बैकग्राउंड नॉइज़ और जटिल जानकारी थी) पर, इसने बाकी सभी मॉडलों से बेहतर प्रदर्शन किया।
मुख्य फीचर्स
- नेगेटिव लेटेंसी: अगले शब्द और पंक्चुएशन की प्रेडिक्शन
- ऑटोमैटिक लैंग्वेज डिटेक्शन: किसी भी भाषा में बोलें, बातचीत के बीच में भाषा बदलें
- टेक्स्ट कंडीशनिंग: Scribe v2 Realtime पिछली बैच के आधार पर ट्रांसक्रिप्शन जारी रखता है, जो कनेक्शन रीस्टार्ट होने पर काम आता है
- वॉइस एक्टिविटी डिटेक्शन (VAD)
- मैन्युअल कमिट: ट्रांसक्रिप्ट सेगमेंट्स को फाइनल करने का पूरा कंट्रोल
- कई ऑडियो फॉर्मेट्स: PCM (48kHz) और μ-law एन्कोडिंग का सपोर्ट
- एंटरप्राइज के लिए तैयार SOC 2, ISO 27001, PCI DSS L1, HIPAA, और GDPR कंप्लायंस, EU और इंडिया डेटा रेजिडेंसी ऑप्शंस और संवेदनशील वर्कलोड्स के लिए ज़ीरो रिटेंशन मोड के साथ
Scribe v2 Realtime रियल टाइम में इंसानों जैसी समझ देता है, जिससे लाइव एनवायरनमेंट्स में नेचुरल बातचीत और तुरंत रिस्पॉन्स संभव होता है। Scribe v2 Realtime 30 आम यूरोपीय और एशियाई भाषाओं में 93.5% एक्युरेसी हासिल करता है।
API के साथ बनाएं
Scribe v2 Realtime आज ElevenLabs API के ज़रिए उपलब्ध है।
डॉक्युमेंटेशन देखें: https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

ElevenLabs Agents में Scribe v2 Realtime का इस्तेमाल करें
Scribe v2 Realtime से चलने वाले नेचुरल, इंसानों जैसे एजेंट्स डिप्लॉय करें। सपोर्ट, सेल्स या प्रोडक्ट एक्सपीरियंस के लिए ऐसे वॉइस असिस्टेंट्स बनाएं जो रियल टाइम में समझ सकें और जवाब दे सकें।
और जानें: https://elevenlabs.io/agents

आज ही शुरू करें
हमारे API या सीधे ElevenLabs Agents में Scribe v2 Realtime का इस्तेमाल करें।
यहाँ साइन अप करें: https://elevenlabs.io/app/sign-up




