
Scribe v2 को मिला नया अपग्रेड
- श्रेणी
- डेवलपर
- तारीख
Scribe v2 Realtime सबसे सटीक रियल-टाइम STT है, जिसमें 150ms लेटेंसी और 90+ भाषाओं का सपोर्ट मिलता है। यह API के ज़रिए उपलब्ध है।
बहुत तेज़, बेहद सटीक, और लाइव स्पीच के लिए बना। Scribe v2 Realtime रीयलटाइम यूज़ केस के लिए तुरंत ट्रांसक्रिप्शन देता है।
Scribe v2 Realtime इंडस्ट्री-लीडिंग ट्रांसक्रिप्शन एक्युरेसी देता है, लगभग 150ms लेटेंसी के साथ—even मुश्किल ऑडियो या अलग-अलग एक्सेंट्स में भी।
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
शोर-शराबे, बैकग्राउंड म्यूजिक, भारी एक्सेंट्स और कम क्वालिटी ऑडियो में भी ट्रांसक्रिप्शन काम करता है।
Scribe v1 की नींव पर बना Scribe v2 Realtime लगभग 150ms लेटेंसी के साथ एक्सेंट, टोन और अलग-अलग माहौल में शानदार एक्युरेसी देता है।

Scribe v2 Realtime खासतौर पर डेवलपर्स के लिए है जो कन्वर्सेशनल एजेंट्स, मीटिंग असिस्टेंट्स और वॉइस ऐप्लिकेशन्स बना रहे हैं, जहां स्पीड और एक्युरेसी ज़रूरी है।
Scribe v2 Realtime प्रेडिक्टिव ट्रांसक्रिप्शन का इस्तेमाल करता है, जिससे अगले संभावित शब्द और पंक्चुएशन पहले ही अनुमानित हो जाते हैं—इससे रीयलटाइम एक्युरेसी मिलती है।
स्पीच कब शुरू और बंद होती है, यह पहचानता है, जिससे ऑडियो को सटीक तरीके से सेगमेंट किया जाता है और रीयलटाइम ट्रांसक्रिप्शन स्मूद और एफिशिएंट बनता है।
डेवलपर्स को कंट्रोल मिलता है कि ट्रांसक्रिप्ट कब फाइनल करना है—कस्टम स्ट्रीमिंग और फाइन-ट्यून एक्युरेसी के लिए बढ़िया।
PCM (8–48 kHz) और μ-law एनकोडिंग सपोर्ट करता है, जिससे टेलीफोनी, ब्राउज़र और स्टूडियो सेटअप्स में कम्पैटिबिलिटी मिलती है।
बड़े इस्तेमाल के लिए Scribe v2, और कम लेटेंसी के लिए Scribe v2 Realtime

सबसे ज़्यादा सटीकता, बैच वर्कलोड्स के लिए डिज़ाइन किया गया।

सबसे कम लेटेंसी, रीयलटाइम वर्कलोड्स के लिए।
हर तरह की बोलियों, डायलैक्ट्स और रिकॉर्डिंग कंडीशन्स में बेहतरीन सटीकता देता है।
भाषा देखने के लिए languageCode बदलें
import { useScribe } from "@elevenlabs/react";
const scribe = useScribe({
modelId: "scribe_v2_realtime",
languageCode: , // भाषा सेट करें
onSessionStarted: () =>
console.log("Session started"),
onPartialTranscript: (data) =>
console.log("Partial:", data.text)
});“रील्स को लोकल भाषाओं में डब करने से लेकर Horizon में म्यूज़िक और कैरेक्टर वॉइस जनरेट करने तक, ElevenLabs प्लेटफ़ॉर्म ग्लोबल क्रिएटर्स, बिज़नेस और एंटरप्राइज़ को वॉइस, म्यूज़िक और साउंड के साथ बड़े पैमाने पर काम करने की सुविधा देता है।”
“Scribe की इतनी सारी भाषाओं में बेजोड़ सटीकता की वजह से Fieldy हर रोज़ की बातचीत को समझ पाता है और आसानी से अलग-अलग देशों में स्केल कर पाया है। ElevenLabs Scribe पर आने के बाद Fieldy ने यूज़र रिटेंशन 50% बढ़ा लिया है।”
“ElevenLabs ने हमें अपने SDK में तेज़ी से पावरफुल टेक्स्ट टू स्पीच जोड़ना आसान बना दिया, जिससे Agents यूज़र के सवालों का या जो वो देख रहे हैं, उसका फीडबैक रीयलटाइम में एक्सप्रेसिव वॉइस में दे सकते हैं।”

“Twilio ने ElevenLabs की जनरेटिव AI वॉइस टेक्नोलॉजी को अपने CPaaS में इंटीग्रेट किया है, जिससे ConversationRelay बेहतर हुआ है। इस इंटीग्रेशन से बिज़नेस और डेवलपर्स सीधे Twilio CPaaS प्लेटफ़ॉर्म से इंसानों जैसी, एक्सप्रेसिव और रीयलटाइम में रिस्पॉन्ड करने वाली कन्वर्सेशनल AI वॉइस इंटरैक्शन बना सकते हैं। हम ElevenLabs में बहुत उत्साहित हैं कि Twilio ने ConversationRelay को सबसे एक्सप्रेसिव, इंसानों जैसी वॉइस से बेहतर बनाने के लिए ElevenLabs को चुना।”

स्टार्टअप्स से लेकर एंटरप्राइज़ टीम्स तक के लिए स्केलेबल प्राइसिंग के साथ बेस्ट-इन-क्लास सटीकता और रिस्पॉन्सिवनेस का अनुभव करें।
$0.28 प्रति घंटा और उससे कम
सालाना बिज़नेस प्लान्स पर









