Eleven v3 अल्फा का परिचय

v3 आजमाएं

वेवफॉर्म्स एआई ने स्पीच ट्यूरिंग टेस्ट पास करने के मिशन की घोषणा की

ओपनएआई और गूगल के दिग्गजों का नया स्टार्टअप ऑडियो एआई के लिए महत्वाकांक्षी योजनाएं साझा कर रहा है, उत्पाद अभी भी विकास के चरण में हैं

A dark blue background with a wavy line of small, multicolored dots in shades of blue and white.

आज, पूर्व ओपनएआई और गूगल के दिग्गजों द्वारा स्थापित वेवफॉर्म्स एआई ने ऑडियो एआई सिस्टम विकसित करने के अपने मिशन की घोषणा की, जो मानव भाषण का अनुकरण कर सके। सीईओ एलेक्सिस कोन्यू पर बल दिया उनका लक्ष्य "स्पीच ट्यूरिंग टेस्ट" पास करना है, जिसमें 50% वरीयता स्कोर प्राप्त करना है, जहां उपयोगकर्ता मानव और एआई-जनित भाषण के बीच अंतर नहीं कर सकते। कंपनी फिलहाल विकास के चरण में है और अगले साल विशिष्ट उत्पादों को पेश करने की योजना है।

स्पीच ट्यूरिंग टेस्ट क्या है?

स्पीच ट्यूरिंग टेस्ट एआई ऑडियो सिस्टम के लिए एक बेंचमार्क है, जो यह मापता है कि क्या मनुष्य एआई-जनित और मानवीय भाषण के बीच अंतर कर सकते हैं। कोई भी सिस्टम इस परीक्षण में तभी सफल होता है जब उसे 50% वरीयता स्कोर प्राप्त हो जाता है, जिसका अर्थ है कि श्रोता यह नहीं बता सकते कि वे किसी व्यक्ति की बात सुन रहे हैं या किसी AI की। इलेवनलैब्स ने पहले ही इस स्तर की अविभाज्यता को प्राप्त करने में महत्वपूर्ण प्रगति की है, तथा उनकी आवाजें व्यापक रूप से उनकी मानवीय यथार्थवादिता के लिए पहचानी जाती हैं।

वेवफॉर्म्स एआई स्पीच ट्यूरिंग टेस्ट से कैसे निपट रहा है

पूर्व ओपनएआई और गूगल के दिग्गजों द्वारा स्थापित वेवफॉर्म्स एआई का लक्ष्य ऐसे ऑडियो एआई सिस्टम बनाना है जो निर्बाध, मानव-सदृश संचार में सक्षम हों। एलेक्सिस कोन्यू के नेतृत्व में यह स्टार्टअप ऐसे मॉडल विकसित करने पर ध्यान केंद्रित करता है जो न केवल मानवीय भाषण की नकल करते हैं बल्कि भावनात्मक बारीकियों को भी पकड़ते हैं, जिससे बातचीत अधिक स्वाभाविक और आकर्षक लगती है। इलेवनलैब्स के टेक्स्ट-टू-स्पीच मॉडल ने गति और अभिव्यक्ति के संयोजन के लिए मानक स्थापित कर दिया है, तथा पहले से ही बड़े पैमाने पर सूक्ष्म और संदर्भपरक रूप से जागरूक भाषण प्रदान कर रहा है।

A blue sphere with a black arrow pointing to the right, next to a white card with a blue and black abstract wave design.

हमारी AI टेक्स्ट टू स्पीच टेक्नोलॉजी 32 भाषाओं में हजारों हाई क्वालिटी, इंसान जैसी आवाज़ें प्रदान करती है। चाहे आप एक मुफ़्त टेक्स्ट टू स्पीच समाधान खोज रहे हों या व्यावसायिक प्रोजेक्ट्स के लिए प्रीमियम वॉइस AI सेवा, हमारे टूल आपकी ज़रूरतों को पूरा कर सकते हैं

एआई स्पीच सिस्टम में वरीयता स्कोर क्या है?

वरीयता स्कोर एआई द्वारा उत्पन्न भाषण को मानवीय भाषण से अलग न किए जाने का आकलन करता है। 50% अंक यह दर्शाता है कि श्रोता कोई स्पष्ट पसंद नहीं दिखाते, जो प्रभावी रूप से दोनों के बीच समानता को दर्शाता है। इलेवनलैब्स ने लगातार उच्च वरीयता स्कोर हासिल किया है, जिसमें उद्योग में अग्रणी स्वीकृति शामिल है क्रिएटर्स, मिडिया, और पहुँच संगठनहैं।

एआई ऑडियो में भावनात्मक बारीकियों का महत्व क्यों है?

वर्तमान एआई वॉयस प्रणालियां अक्सर भावनात्मक सूक्ष्मताएं खो देती हैं, जिससे सहानुभूति व्यक्त करने या सार्थक रूप से संलग्न होने की उनकी क्षमता सीमित हो जाती है। वेवफॉर्म्स एआई अपने ऑडियो एलएलएम के साथ इस समस्या का समाधान करने का दावा करता है, जो संदर्भ और भावना को पकड़ने के लिए ऑडियो को मूल रूप से संसाधित करता है, जिससे बेहतर संचार संभव होता है। इलेवनलैब्स ने पहले ही भावनात्मक बारीकियों के महत्व को प्रदर्शित किया है, तथा ऐसे उपकरण प्रस्तुत किए हैं जो उपयोगकर्ताओं को किसी भी संदर्भ के अनुरूप स्वर, अभिव्यक्ति और गति को समायोजित करने की अनुमति देते हैं।

Screenshot of an audiobook editing interface with highlighted text and two book cover images titled "Discover Daily" and "Dune."

किताबों को ऑडियोबुक और स्क्रिप्ट को पॉडकास्ट में बदलने के लिए आपका पूरा वर्कफ़्लो

वेवफॉर्म्स एआई मौजूदा एआई ऑडियो सिस्टम से किस प्रकार भिन्न है?

पारंपरिक टेक्स्ट-टू-स्पीच प्रणालियों के विपरीत, वेवफॉर्म्स एआई के एंड-टू-एंड ऑडियो एलएलएम का लक्ष्य मानव अंतःक्रिया की गहराई और जटिलता को पकड़ना है। भावनात्मक सामान्य बुद्धिमत्ता (ईजीआई) पर उनका ध्यान एआई में एक सामाजिक-भावनात्मक परत प्रस्तुत करता है, जो बुनियादी कार्यक्षमता पर कनेक्शन और सहानुभूति को प्राथमिकता देता है। इलेवनलैब्स ने सफलताओं में अग्रणी भूमिका निभाई है भावनात्मक गहराई और लचीलापन, जटिल, वास्तविक दुनिया के परिदृश्यों को संभालने के लिए डिज़ाइन किए गए उपकरण आज सुलभ और उपलब्ध हैं।

स्पीच ट्यूरिंग टेस्ट में सफलता प्राप्त करने में क्या चुनौतियाँ आती हैं?

अविभाज्य एआई वाक् प्रणालियों का विकास करना तकनीकी और नैतिक दोनों चुनौतियों को जन्म देता है। कोन्यू ने उपयोगकर्ताओं द्वारा एआई पात्रों के प्रति लगाव विकसित करने जैसे जोखिमों और एआई की बढ़ती यथार्थवादिता के व्यापक सामाजिक निहितार्थों पर प्रकाश डाला है। इन मुद्दों को जिम्मेदारी से संबोधित करना वेवफॉर्म्स एआई का मुख्य फोकस है। इलेवनलैब्स ने अत्याधुनिक प्रौद्योगिकी प्रदान करते हुए इन चुनौतियों का जिम्मेदारी से सामना करने के लिए "नो-गो" वॉयस नीतियां और कठोर सामग्री मॉडरेशन जैसी सुरक्षा उपाय बनाए हैं।

स्पीच ट्यूरिंग टेस्ट पास करने के लिए डिज़ाइन किए गए AI सिस्टम के अनुप्रयोग

वेवफॉर्म्स एआई का लक्ष्य है कि उनकी प्रौद्योगिकी का उपयोग शिक्षा, ग्राहक सहायता और मनोरंजन सहित अनुप्रयोगों के व्यापक स्पेक्ट्रम में किया जाएगा। मानव-जैसी आवाज से बातचीत करने की क्षमता इन क्षेत्रों में अधिक गहन, सहानुभूतिपूर्ण अनुभवों की संभावनाएं खोलती है। इलेवनलैब्स पहले से ही इन क्षेत्रों में अनुप्रयोगों को सशक्त बना रहा है, सुलभ शिक्षा उपकरणों से लेकर बहुभाषी मीडिया स्थानीयकरण तक, तथा यह दर्शाता है कि आज की प्रौद्योगिकी के साथ क्या संभव है।

Two men speaking into microphones during a recording session, with audio editing software displayed on a screen in the background.

हर स्पीकर की भावना, समय, टोन और अनोखी विशेषताओं को बनाए रखते हुए ऑडियो और वीडियो का अनुवाद करें

एआई ऑडियो सिस्टम का भविष्य

जबकि वेवफॉर्म्स एआई के उत्पाद अभी भी विकास के चरण में हैं, एआई ऑडियो इंटरैक्शन को पुनः परिभाषित करने की उनकी महत्वाकांक्षा ने महत्वपूर्ण ध्यान आकर्षित किया है, जिसमें आंद्रेसेन होरोविट्ज़ के नेतृत्व में 40 मिलियन डॉलर की सीड फंडिंग भी शामिल है। चूंकि कंपनी स्पीच ट्यूरिंग टेस्ट को हल करने की दिशा में काम कर रही है, इसलिए प्रौद्योगिकी के साथ हमारी बातचीत को नया रूप देने की इसकी क्षमता बहुत अधिक है। इलेवनलैब्स ऑडियो एआई के भविष्य को आकार देने में अग्रणी बना हुआ है, तथा ऐसे समाधान प्रदान कर रहा है जो उद्योगों को बदल रहे हैं तथा उपयोगकर्ताओं की वर्तमान आवश्यकताओं को पूरा कर रहे हैं।

Flowchart diagram with black and white nodes labeled "USER," "SPEECH TO TEXT," "TEXT TO SPEECH," "AGENT," "LLM," "MONITORING," and "FUNCTION CALLING" connected by curved lines on a blue gradient background.

मिनटों में वेब, मोबाइल या टेलीफोनी पर अपने एजेंटों की आवाज़ जोड़ें। हमारा रियलटाइम API कम लेटेंसी, पूरी तरह से कस्टमाइज़ेबल और आसान स्केलेबिलिटी प्रदान करता है।

वेवफॉर्म्स एआई ऑडियो की तुलना इलेवनलैब्स से कैसे की जाती है

समर्थन की तलाश में ऑडियो उत्पादन के अनेक उपयोग मामले भविष्य में, वेवफॉर्म्स एआई एक अच्छा सामान्य प्रयोजन ऑडियो एआई टूलकिट बन सकता है। फिलहाल, यह एक उत्पाद घोषणा ही है। दूसरी ओर, इलेवनलैब्स आज भी उपलब्ध है, जो उत्पादन-स्तर की गुणवत्ता और अनुकूलन प्रदान करता है।

आइए संक्षेप में मूल्यांकन करें कि वेवफॉर्म्स एआई प्रमुख क्षेत्रों में कैसे तुलना करता है टेक्स्ट टू स्पीच और ध्वनि उत्पादन.

टेक्स्ट टू स्पीच

इलेवनलैब्स टेक्स्ट-टू-स्पीच प्रौद्योगिकी में स्पष्ट उद्योग नेता के रूप में खड़ा है, जो निम्नलिखित पेशकश करता है:

  • प्रामाणिक लहजे और सांस्कृतिक बारीकियों के साथ 32 भाषाओं के लिए समर्थन
  • उन्नत भावनात्मक बुद्धिमत्ता जो पाठ्य संदर्भ पर प्रतिक्रिया करती है
  • आवाज़ की विशेषताओं पर नियंत्रण
  • उच्च गुणवत्ता वाली, मानवीय वाणी जो लंबे प्रारूप वाली विषय-वस्तु में एकरूपता बनाए रखती है
  • प्राकृतिक ध्वनि वाली आवाज़ों का एक व्यापक पुस्तकालय
  • आवाज़ों को क्लोन और अनुकूलित करने की क्षमता

इलेवनलैब्स की तकनीक पहले से ही उपलब्ध है विश्वसनीय, उत्पादन-तैयार आउटपुट जो पेशेवर मानकों को पूरा करता हैहैं। इसका विशेष दृष्टिकोण लगातार अधिक प्राकृतिक ध्वनि वाली आवाजें उत्पन्न करता है जो मानव वाणी की सूक्ष्म बारीकियों को पकड़ लेती हैं।

साउंड इफ़ेक्ट्स

ElevenLabs पहले से ही अधिक सुव्यवस्थित और सटीक दृष्टिकोण प्रदान करता है साउंड इफेक्ट पीढ़ी। इलेवनलैब्स प्रदान करता है:

  • प्रत्येक प्रॉम्प्ट के लिए चार अलग-अलग नमूनों का त्वरित निर्माण
  • विस्तृत पाठ विवरण के माध्यम से सटीक नियंत्रण
  • व्यावसायिक परियोजनाओं के लिए उपयुक्त उच्च गुणवत्ता वाला आउटपुट
  • सामान्य ध्वनि प्रभावों का एक व्यापक पुस्तकालय
  • पाठ्य विवरण से सीधे विशिष्ट प्रभाव बनाने की क्षमता

इलेवनलैब्स आवाज और ध्वनि प्रभाव निर्माण दोनों में विशिष्ट उत्कृष्टता प्रदान करता है। सर्वश्रेष्ठ एआई ध्वनि प्रभाव जनरेटरों में से एक के रूप में, यह विश्वसनीय, उत्पादन-तैयार आउटपुट उत्पन्न करता है जो पेशेवर सामग्री रचनाकारों की आवश्यकताओं को बेहतर ढंग से पूरा करता है।

टेक्स्ट-टू-स्पीच के लिए ElevenLabs का उपयोग कैसे करें

इन सरल चरणों का पालन करके अपनी सामग्री को पेशेवर-गुणवत्ता वाले वॉयसओवर में बदलें:

  1. साइन अप करें: निःशुल्क या सशुल्क खाता बनाएं ElevenLabs के साथ
  2. अपनी आवाज़ चुनें: प्राकृतिक ध्वनि वाली आवाज़ों की विविध लाइब्रेरी से चयन करें
  3. अपना पाठ इनपुट करें: अपनी स्क्रिप्ट को इंटरफ़ेस में पेस्ट या टाइप करें
  4. सेटिंग्स अनुकूलित करें: अपनी आवश्यकताओं के अनुरूप गति, स्वर और जोर को समायोजित करें
  5. पूर्वावलोकन करें और उत्पन्न करें: एक नमूना सुनें और अपना अंतिम ऑडियो आउटपुट तैयार करें
  6. डाउनलोड करना: अपना उच्च-गुणवत्ता वाला वॉयसओवर डाउनलोड करें

अंतिम विचार

वेफफॉर्म्स और इलेवनलैब्स जैसे एआई ऑडियो टूल्स का उद्भव सामग्री निर्माण में एक रोमांचक विकास को दर्शाता है। हालाँकि, वेवफॉर्म्स एआई ने प्रायोगिक ध्वनि उत्पादन और ऑडियो हेरफेर में प्रभावशाली महत्वाकांक्षाओं की घोषणा की है, लेकिन यह अभी तक उपयोग के लिए उपलब्ध नहीं है।

दूसरी ओर, ElevenLabs उपलब्ध है और उत्पादन-स्तर पर है। यह वर्तमान में AI टेक्स्ट-टू-स्पीच आवाज और ध्वनि प्रभाव निर्माण के लिए बाजार में अग्रणी समाधान है।

क्या आप ElevenLabs की AI तकनीक का परीक्षण करने के लिए तैयार हैं? साइन अप करें आज ही शुरू करें।

A blue sphere with a black arrow pointing to the right, next to a white card with a blue and black abstract wave design.

हमारी AI टेक्स्ट टू स्पीच टेक्नोलॉजी 32 भाषाओं में हजारों हाई क्वालिटी, इंसान जैसी आवाज़ें प्रदान करती है। चाहे आप एक मुफ़्त टेक्स्ट टू स्पीच समाधान खोज रहे हों या व्यावसायिक प्रोजेक्ट्स के लिए प्रीमियम वॉइस AI सेवा, हमारे टूल आपकी ज़रूरतों को पूरा कर सकते हैं

अक्सर पूछे जाने वाले प्रश्न

Not yet. WaveForms AI is still in the development phase, focusing on creating advanced audio models capable of real-time, emotionally resonant interactions.

The Speech Turing Test measures whether users can distinguish between human speech and AI-generated speech. WaveForms AI aims to pass this test by creating a system that matches human intonation, emotion, and nuance.

The company’s mission is to solve the Speech Turing Test and develop Emotional General Intelligence (EGI), enabling AI to understand and respond to human emotions in natural and meaningful ways.

Unlike traditional Text-to-Speech systems, WaveForms AI is building end-to-end audio models that process sound natively. This approach aims to capture the full emotional and contextual depth of human conversations. ElevenLabs' contextual audio AI has been live since January 2023.

WaveForms AI was co-founded by Alexis Conneau, a former OpenAI engineer, and Coralie Lemaitre, who previously worked in product strategy at Google. Together, they bring expertise in AI and product development to the company.

और जानें

ElevenLabs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें