रीयलटाइम स्पीच टू टेक्स्ट API

Scribe v2 Realtime के साथ लाइव स्पीच ट्रांसक्राइब करें

Scribe v2 Realtime सबसे सटीक रीयलटाइम ट्रांसक्रिप्शन मॉडल है, 150ms लेटेंसी के साथ और 90+ भाषाओं में उपलब्ध है। API के ज़रिए इस्तेमाल करें।

  • Lovable
  • Veed model
  • Synthesia
  • Stripe
  • Perplexity
  • Twilio

स्पीड और एक्युरेसी के लिए बनाया गया

बहुत तेज़, बेहद सटीक, और लाइव स्पीच के लिए बना। Scribe v2 Realtime रीयलटाइम यूज़ केस के लिए तुरंत ट्रांसक्रिप्शन देता है।

Scribe v2 Realtime इंडस्ट्री-लीडिंग ट्रांसक्रिप्शन एक्युरेसी देता है, लगभग 150ms लेटेंसी के साथ—even मुश्किल ऑडियो या अलग-अलग एक्सेंट्स में भी।

सबसे सटीक रीयलटाइम ट्रांसक्रिप्शन

Scribe v2 Realtime इंडस्ट्री-लीडिंग ट्रांसक्रिप्शन एक्युरेसी देता है, लगभग 150ms लेटेंसी के साथ—even मुश्किल ऑडियो या अलग-अलग एक्सेंट्स में भी।

Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!

हर स्थिति के लिए डिज़ाइन किया गया

शोर-शराबे, बैकग्राउंड म्यूजिक, भारी एक्सेंट्स और कम क्वालिटी ऑडियो में भी ट्रांसक्रिप्शन काम करता है।

रीयलटाइम परफॉर्मेंस के लिए तैयार स्पीच रिकग्निशन

Scribe v1 की नींव पर बना Scribe v2 Realtime लगभग 150ms लेटेंसी के साथ एक्सेंट, टोन और अलग-अलग माहौल में शानदार एक्युरेसी देता है।

क्या मुझे रिफंड मिल सकता है?
ज़रूर। क्या आप अपना ऑर्डर नंबर साझा कर सकते हैं?
यह EL4543490 है
धन्यवाद। मैंने ऑर्डर रिफंड प्रक्रिया शुरू कर दी है।
रिफंड पूरा हो गया

Agents और वॉइस ऐप्स के लिए खासतौर पर बनाया गया

Scribe v2 Realtime खासतौर पर डेवलपर्स के लिए है जो कन्वर्सेशनल एजेंट्स, मीटिंग असिस्टेंट्स और वॉइस ऐप्लिकेशन्स बना रहे हैं, जहां स्पीड और एक्युरेसी ज़रूरी है।

Scribe
makes
uses
is
has
new

लो लेटेंसी के लिए प्रेडिक्टिव ट्रांसक्रिप्शन

Scribe v2 Realtime प्रेडिक्टिव ट्रांसक्रिप्शन का इस्तेमाल करता है, जिससे अगले संभावित शब्द और पंक्चुएशन पहले ही अनुमानित हो जाते हैं—इससे रीयलटाइम एक्युरेसी मिलती है।

वॉइस एक्टिविटी डिटेक्शन

स्पीच कब शुरू और बंद होती है, यह पहचानता है, जिससे ऑडियो को सटीक तरीके से सेगमेंट किया जाता है और रीयलटाइम ट्रांसक्रिप्शन स्मूद और एफिशिएंट बनता है।

मैन्युअल कमिट कंट्रोल

डेवलपर्स को कंट्रोल मिलता है कि ट्रांसक्रिप्ट कब फाइनल करना है—कस्टम स्ट्रीमिंग और फाइन-ट्यून एक्युरेसी के लिए बढ़िया।

मल्टीपल ऑडियो फॉर्मेट्स

PCM (8–48 kHz) और μ-law एनकोडिंग सपोर्ट करता है, जिससे टेलीफोनी, ब्राउज़र और स्टूडियो सेटअप्स में कम्पैटिबिलिटी मिलती है।

हर इस्तेमाल के लिए ऑप्टिमाइज़ किए गए मॉडल

बड़े इस्तेमाल के लिए Scribe v2, और कम लेटेंसी के लिए Scribe v2 Realtime

Black Mountain

Scribe v2

सबसे ज़्यादा सटीकता, बैच वर्कलोड्स के लिए डिज़ाइन किया गया।

  • >95% सटीकता
  • 90+ भाषाएं
  • नॉन-स्पीच इवेंट डिटेक्शन
  • एंटिटी डिटेक्शन
  • कीटर्म प्रॉम्प्टिंग
Mountains

Scribe v2 रियलटाइम

सबसे कम लेटेंसी, रीयलटाइम वर्कलोड्स के लिए।

  • 150ms से कम लेटेंसी
  • 90+ भाषाएं
  • ट्रांसक्रिप्शन स्ट्रीमिंग
  • वॉइस एक्टिविटी डिटेक्शन
  • ऑटोमैटिक लैंग्वेज रिकग्निशन

90+ भाषाओं और कई तरह की बोलियों में स्पीच ट्रांसक्राइब करें

हर तरह की बोलियों, डायलैक्ट्स और रिकॉर्डिंग कंडीशन्स में बेहतरीन सटीकता देता है।

भाषा देखने के लिए languageCode बदलें

import { useScribe } from "@elevenlabs/react";

const scribe = useScribe({
  modelId: "scribe_v2_realtime",

  languageCode: 
, // भाषा सेट करें onSessionStarted: () => console.log("Session started"), onPartialTranscript: (data) => console.log("Partial:", data.text) });
Flag for en
अंग्रेज़ी
Flag for zh
चीनी
Flag for es
स्पेनिश
Flag for fr
फ्रेंच
Flag for pt
पुर्तगाली
Flag for de
जर्मन
Flag for ja
जापानी
Flag for it
इतालवी
Flag for hi
हिंदी
Flag for en
अंग्रेज़ीपूर्वावलोकन के लिए क्लिक करें

दुनिया की अग्रणी कंपनियों और ब्रांड्स को पावर दे रहे हैं

  • रील्स को लोकल भाषाओं में डब करने से लेकर Horizon में म्यूज़िक और कैरेक्टर वॉइस जनरेट करने तक, ElevenLabs प्लेटफ़ॉर्म ग्लोबल क्रिएटर्स, बिज़नेस और एंटरप्राइज़ को वॉइस, म्यूज़िक और साउंड के साथ बड़े पैमाने पर काम करने की सुविधा देता है।
    Meta Color Logo
  • Scribe की इतनी सारी भाषाओं में बेजोड़ सटीकता की वजह से Fieldy हर रोज़ की बातचीत को समझ पाता है और आसानी से अलग-अलग देशों में स्केल कर पाया है। ElevenLabs Scribe पर आने के बाद Fieldy ने यूज़र रिटेंशन 50% बढ़ा लिया है।
    Fieldy logo
  • ElevenLabs ने हमें अपने SDK में तेज़ी से पावरफुल टेक्स्ट टू स्पीच जोड़ना आसान बना दिया, जिससे Agents यूज़र के सवालों का या जो वो देख रहे हैं, उसका फीडबैक रीयलटाइम में एक्सप्रेसिव वॉइस में दे सकते हैं।
    Stream Color Logo
  • Twilio ने ElevenLabs की जनरेटिव AI वॉइस टेक्नोलॉजी को अपने CPaaS में इंटीग्रेट किया है, जिससे ConversationRelay बेहतर हुआ है। इस इंटीग्रेशन से बिज़नेस और डेवलपर्स सीधे Twilio CPaaS प्लेटफ़ॉर्म से इंसानों जैसी, एक्सप्रेसिव और रीयलटाइम में रिस्पॉन्ड करने वाली कन्वर्सेशनल AI वॉइस इंटरैक्शन बना सकते हैं। हम ElevenLabs में बहुत उत्साहित हैं कि Twilio ने ConversationRelay को सबसे एक्सप्रेसिव, इंसानों जैसी वॉइस से बेहतर बनाने के लिए ElevenLabs को चुना।
    Twilio logo

प्रोडक्शन के लिए बनाए गए API

Foreground

आपकी ज़रूरत के हिसाब से लचीला प्राइसिंग

स्टार्टअप्स से लेकर एंटरप्राइज़ टीम्स तक के लिए स्केलेबल प्राइसिंग के साथ बेस्ट-इन-क्लास सटीकता और रिस्पॉन्सिवनेस का अनुभव करें।

$0.28 प्रति घंटा और उससे कम

सालाना बिज़नेस प्लान्स पर

UI Screenshot

अक्सर पूछे जाने वाले प्रश्न

लेटेस्ट अपडेट्स

सबसे रियलिस्टिक ऑडियो AI प्लेटफॉर्म