कॉन्टेंट पर जाएं

Speech Engine से मिलिए

अपने चैट एजेंट को वॉइस एजेंट में बदलें

सिर्फ एक प्रॉम्प्ट से अपने मौजूदा चैट एजेंट में इंसानों जैसी वॉइस जोड़ें। वॉइस की जिम्मेदारी हमारी है। आपके एजेंट का LLM, RAG और आर्किटेक्चर वैसा ही रहेगा।

अपने मौजूदा स्टैक में वॉइस लेयर जोड़ें

शुरू करें

स्पीच इंजन आपके मौजूदा स्टैक के ऊपर आसानी से जुड़ जाता है। कुछ भी दोबारा बनाना नहीं पड़ता और आपका टेक्स्ट-बेस्ड एजेंट वैसा ही रहता है।

पूरी वॉइस लेयर, एक ही इंटीग्रेशन में

स्पीच इंजन हमारे बेहतरीन स्पीच, ट्रांसक्रिप्शन और वॉइस ऑर्केस्ट्रेशन मॉडल्स को एक ही पाइपलाइन में जोड़ता है - सब कुछ खास तौर पर एक साथ बेहतर काम करने के लिए बनाया गया है।

Speech Engine
Speech to Text
Turn Detection
Interrupt Detection
Text to Speech
Audio Orchestration

अपने चैटबॉट को वॉइस के साथ बेहतर बनाएं

वॉइस सबसे तेज़ और असरदार तरीका है जानकारी साझा करने का, जिससे प्रोडक्ट्स और सर्विसेज़ ग्राहकों के लिए और भी आसान हो जाते हैं।

बिना रुके बातचीत का अनुभव

हमारे वॉइस मॉडल बातचीत के लिए ऑप्टिमाइज़ किए गए हैं, जो असली माहौल में अल्ट्रा-लो लेटेंसी देते हैं।

टर्न-टेकिंग और इंटरप्शन हैंडलिंग

डेडिकेटेड मॉडल्स ओवरलैपिंग स्पीच और बीच में बदलाव को बिना किसी कस्टम लॉजिक के संभाल लेते हैं।

70+ भाषाओं में ग्लोबल कवरेज

व्यक्तिगत, इंसानों जैसी आवाज़ें पाएं जो कई भाषाओं में हर तरह की भावनाओं को सपोर्ट करती हैं।

मिलियनों असली बातचीतों में आज़माया गया वॉइस स्टैक

हर कंपोनेंट को साथ में सबसे अच्छा काम करने के लिए बनाया और ऑप्टिमाइज़ किया गया है।

स्पीच टू टेक्स्ट

हमारा ट्रांसक्रिप्शन मॉडल बातचीत की सटीकता के लिए ऑप्टिमाइज़ किया गया है, जो यूज़र की स्पीच को सिर्फ 80ms की अल्ट्रा-लो लेटेंसी पर ट्रांसक्राइब करता है।

टेक्स्ट टू स्पीच

70+ भाषाओं में एक्सप्रेसिव, इंसान जैसे वॉइस। हमारी 11,000+ वॉइस लाइब्रेरी से चुनें या वॉइस क्लोनिंग से खुद की वॉइस बनाएं।

टर्न डिटेक्शन

जानता है कि यूज़र ने बोलना कब खत्म किया है और कब सिर्फ पॉज़ किया है - जिससे ट्रांसक्रिप्ट आपके LLM को सही समय पर भेजा जाता है।

इंटरप्शन हैंडलिंग

एजेंट के बोलते समय यूज़र की स्पीच को मॉनिटर करता है। जैसे ही यूज़र बोलता है, प्लेबैक तुरंत रुक जाता है और वापस लूप हो जाता है।

वॉइस एक्टिविटी डिटेक्शन

इनपुट लेवल पर बैकग्राउंड नॉइज़ से स्पीच को फिल्टर करता है, ताकि ट्रांसक्रिप्शन मॉडल तक सिर्फ साफ ऑडियो पहुंचे।

ऑडियो ऑर्केस्ट्रेशन

पूरे वॉइस लाइफसाइकल को मैनेज करता है - यूज़र ऑडियो कैप्चर करने से लेकर एजेंट की स्पोकन रिस्पॉन्स देने तक।

सिर्फ एक प्रॉम्प्ट से अपने एजेंट में स्पीच इंजन जोड़ें

हमारे स्किल के साथ एक कमांड में इंस्टॉल करें। यह स्किल सब कुछ सेटअप कर देता है, जिससे आप एक ही प्रॉम्प्ट में चैट से वॉइस पर जा सकते हैं।

सर्वर SDK

स्पीच इंजन को अपने सर्वर से जोड़ें। ट्रांसक्रिप्ट्स पाएं, उन्हें अपने LLM को भेजें, और रिस्पॉन्स वापस भेजें - ये सब कुछ ही लाइनों में।

import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
import "dotenv/config";
const elevenlabs = new ElevenLabsClient({
  apiKey: process.env.ELEVENLABS_API_KEY,
});
const engine = await elevenlabs.speechEngine.create({
  name: "My Speech Engine",
  speechEngine: {
    // Note we use the wss protocol instead of https
    wsUrl: "wss://abc123.ngrok.io/ws",
  },
});
console.log("Speech Engine ID:", engine.engineId);

ElevenLabs UI

पहले से बने UI कंपोनेंट्स - एजेंट ऑर्ब्स, वेवफॉर्म्स और चैट विजेट्स - जोड़ें या इसी SDK पर अपना खुद का UI बनाएं।

ElevenLabs UI देखें
Chat interface with options for customer support and text input field. "Yes, for John Johnson please" visible.

क्लाइंट SDK

ब्राउज़र या मोबाइल ऐप से सिर्फ तीन लाइनों में कन्वर्सेशन सेशन शुरू करें। वही क्लाइंट इंटीग्रेशन जो ElevenAgents में है, इसलिए बाद में अपग्रेड करने के लिए कोई बदलाव नहीं करना पड़ेगा।

import express from "express";
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
import "dotenv/config";

const app = express();
const elevenlabs = new ElevenLabsClient({ apiKey: process.env.ELEVENLABS_API_KEY });
const speechEngineId = "seng_8k3m9xr4hjnfg983brhmhkd98n6";

app.get("/api/token", async (req, res) => {
  const { token } = await elevenlabs.conversationalAi.conversations.getWebrtcToken({ agentId: speechEngineId });
  res.json({ token });
});

app.listen(3002, () => console.log("Token server listening on port 3002"));

एंटरप्राइज़-ग्रेड सुरक्षा

हमारा प्लेटफॉर्म बड़े पैमाने पर डिप्लॉयमेंट के लिए डिज़ाइन किया गया है, जिसमें एंटरप्राइज-लेवल डेटा प्रोटेक्शन है, जैसे SOC 2, HIPAA और GDPR कंप्लायंस। EU डेटा रेजिडेंसी और ज़ीरो रिटेंशन मोड भी उपलब्ध हैं, ताकि डेटा पर और ज्यादा कंट्रोल मिल सके।

Illustration of a product lifecycle: creation, use, maintenance, and disposal.

हर चैनल पर अनुभवों के लिए एक ही प्लेटफॉर्म

Speech Engine Cover

स्पीच इंजन

मैक्सिमम फ्लेक्सिबिलिटी

  • आपका खुद का LLM और ऑर्केस्ट्रेशन
  • वही कन्वर्सेशन SDK
  • कस्टम RAG और बिज़नेस लॉजिक
Agents Cover

ElevenAgents

मैक्सिमम परफॉर्मेंस

  • फुली-मैनेज्ड LLM
  • इनबिल्ट टूल्स और नॉलेज बेस
  • नॉन-डेवलपर्स के लिए डैशबोर्ड
  • बॉक्स से ही टेलीफोनी
  • सबसे कम संभव लेटेंसी

अक्सर पूछे जाने वाले प्रश्न

लेटेस्ट स्टोरीज़

AI कम्युनिकेशन प्लेटफ़ॉर्म