वेवफॉर्म्स एआई ने स्पीच ट्यूरिंग टेस्ट पास करने के मिशन की घोषणा की

ओपनएआई और गूगल के दिग्गजों का नया स्टार्टअप ऑडियो एआई के लिए महत्वाकांक्षी योजनाएं साझा कर रहा है, उत्पाद अभी भी विकास के चरण में हैं

A dark blue background with a wavy line of small, multicolored dots in shades of blue and white.

आज, पूर्व ओपनएआई और गूगल के दिग्गजों द्वारा स्थापित वेवफॉर्म्स एआई ने ऑडियो एआई सिस्टम विकसित करने के अपने मिशन की घोषणा की, जो मानव भाषण का अनुकरण कर सके। सीईओ एलेक्सिस कोन्यू पर बल दिया उनका लक्ष्य "स्पीच ट्यूरिंग टेस्ट" पास करना है, जिसमें 50% वरीयता स्कोर प्राप्त करना है, जहां उपयोगकर्ता मानव और एआई-जनित भाषण के बीच अंतर नहीं कर सकते। कंपनी फिलहाल विकास के चरण में है और अगले साल विशिष्ट उत्पादों को पेश करने की योजना है।

स्पीच ट्यूरिंग टेस्ट क्या है?

स्पीच ट्यूरिंग टेस्ट एआई ऑडियो सिस्टम के लिए एक बेंचमार्क है, जो यह मापता है कि क्या मनुष्य एआई-जनित और मानवीय भाषण के बीच अंतर कर सकते हैं। कोई भी सिस्टम इस परीक्षण में तभी सफल होता है जब उसे 50% वरीयता स्कोर प्राप्त हो जाता है, जिसका अर्थ है कि श्रोता यह नहीं बता सकते कि वे किसी व्यक्ति की बात सुन रहे हैं या किसी AI की। इलेवनलैब्स ने पहले ही इस स्तर की अविभाज्यता को प्राप्त करने में महत्वपूर्ण प्रगति की है, तथा उनकी आवाजें व्यापक रूप से उनकी मानवीय यथार्थवादिता के लिए पहचानी जाती हैं।

वेवफॉर्म्स एआई स्पीच ट्यूरिंग टेस्ट से कैसे निपट रहा है

पूर्व ओपनएआई और गूगल के दिग्गजों द्वारा स्थापित वेवफॉर्म्स एआई का लक्ष्य ऐसे ऑडियो एआई सिस्टम बनाना है जो निर्बाध, मानव-सदृश संचार में सक्षम हों। एलेक्सिस कोन्यू के नेतृत्व में यह स्टार्टअप ऐसे मॉडल विकसित करने पर ध्यान केंद्रित करता है जो न केवल मानवीय भाषण की नकल करते हैं बल्कि भावनात्मक बारीकियों को भी पकड़ते हैं, जिससे बातचीत अधिक स्वाभाविक और आकर्षक लगती है। इलेवनलैब्स के टेक्स्ट-टू-स्पीच मॉडल ने गति और अभिव्यक्ति के संयोजन के लिए मानक स्थापित कर दिया है, तथा पहले से ही बड़े पैमाने पर सूक्ष्म और संदर्भपरक रूप से जागरूक भाषण प्रदान कर रहा है।

A blue sphere with a black arrow pointing to the right, next to a white card with a blue and black abstract wave design.

हमारी AI टेक्स्ट टू स्पीच टेक्नोलॉजी 32 भाषाओं में हजारों हाई क्वालिटी, इंसान जैसी आवाज़ें प्रदान करती है। चाहे आप एक मुफ़्त टेक्स्ट टू स्पीच समाधान खोज रहे हों या व्यावसायिक प्रोजेक्ट्स के लिए प्रीमियम वॉइस AI सेवा, हमारे टूल आपकी ज़रूरतों को पूरा कर सकते हैं

एआई स्पीच सिस्टम में वरीयता स्कोर क्या है?

वरीयता स्कोर एआई द्वारा उत्पन्न भाषण को मानवीय भाषण से अलग न किए जाने का आकलन करता है। 50% अंक यह दर्शाता है कि श्रोता कोई स्पष्ट पसंद नहीं दिखाते, जो प्रभावी रूप से दोनों के बीच समानता को दर्शाता है। इलेवनलैब्स ने लगातार उच्च वरीयता स्कोर हासिल किया है, जिसमें उद्योग में अग्रणी स्वीकृति शामिल है क्रिएटर्स, मिडिया, और पहुँच संगठनहैं।

एआई ऑडियो में भावनात्मक बारीकियों का महत्व क्यों है?

वर्तमान एआई वॉयस प्रणालियां अक्सर भावनात्मक सूक्ष्मताएं खो देती हैं, जिससे सहानुभूति व्यक्त करने या सार्थक रूप से संलग्न होने की उनकी क्षमता सीमित हो जाती है। वेवफॉर्म्स एआई अपने ऑडियो एलएलएम के साथ इस समस्या का समाधान करने का दावा करता है, जो संदर्भ और भावना को पकड़ने के लिए ऑडियो को मूल रूप से संसाधित करता है, जिससे बेहतर संचार संभव होता है। इलेवनलैब्स ने पहले ही भावनात्मक बारीकियों के महत्व को प्रदर्शित किया है, तथा ऐसे उपकरण प्रस्तुत किए हैं जो उपयोगकर्ताओं को किसी भी संदर्भ के अनुरूप स्वर, अभिव्यक्ति और गति को समायोजित करने की अनुमति देते हैं।

Screenshot of an audiobook editing interface with highlighted text and two book cover images titled "Discover Daily" and "Dune."

किताबों को ऑडियोबुक और स्क्रिप्ट को पॉडकास्ट में बदलने के लिए आपका पूरा वर्कफ़्लो

वेवफॉर्म्स एआई मौजूदा एआई ऑडियो सिस्टम से किस प्रकार भिन्न है?

पारंपरिक टेक्स्ट-टू-स्पीच प्रणालियों के विपरीत, वेवफॉर्म्स एआई के एंड-टू-एंड ऑडियो एलएलएम का लक्ष्य मानव अंतःक्रिया की गहराई और जटिलता को पकड़ना है। भावनात्मक सामान्य बुद्धिमत्ता (ईजीआई) पर उनका ध्यान एआई में एक सामाजिक-भावनात्मक परत प्रस्तुत करता है, जो बुनियादी कार्यक्षमता पर कनेक्शन और सहानुभूति को प्राथमिकता देता है। इलेवनलैब्स ने सफलताओं में अग्रणी भूमिका निभाई है भावनात्मक गहराई और लचीलापन, जटिल, वास्तविक दुनिया के परिदृश्यों को संभालने के लिए डिज़ाइन किए गए उपकरण आज सुलभ और उपलब्ध हैं।

स्पीच ट्यूरिंग टेस्ट में सफलता प्राप्त करने में क्या चुनौतियाँ आती हैं?

अविभाज्य एआई वाक् प्रणालियों का विकास करना तकनीकी और नैतिक दोनों चुनौतियों को जन्म देता है। कोन्यू ने उपयोगकर्ताओं द्वारा एआई पात्रों के प्रति लगाव विकसित करने जैसे जोखिमों और एआई की बढ़ती यथार्थवादिता के व्यापक सामाजिक निहितार्थों पर प्रकाश डाला है। इन मुद्दों को जिम्मेदारी से संबोधित करना वेवफॉर्म्स एआई का मुख्य फोकस है। इलेवनलैब्स ने अत्याधुनिक प्रौद्योगिकी प्रदान करते हुए इन चुनौतियों का जिम्मेदारी से सामना करने के लिए "नो-गो" वॉयस नीतियां और कठोर सामग्री मॉडरेशन जैसी सुरक्षा उपाय बनाए हैं।

स्पीच ट्यूरिंग टेस्ट पास करने के लिए डिज़ाइन किए गए AI सिस्टम के अनुप्रयोग

वेवफॉर्म्स एआई का लक्ष्य है कि उनकी प्रौद्योगिकी का उपयोग शिक्षा, ग्राहक सहायता और मनोरंजन सहित अनुप्रयोगों के व्यापक स्पेक्ट्रम में किया जाएगा। मानव-जैसी आवाज से बातचीत करने की क्षमता इन क्षेत्रों में अधिक गहन, सहानुभूतिपूर्ण अनुभवों की संभावनाएं खोलती है। इलेवनलैब्स पहले से ही इन क्षेत्रों में अनुप्रयोगों को सशक्त बना रहा है, सुलभ शिक्षा उपकरणों से लेकर बहुभाषी मीडिया स्थानीयकरण तक, तथा यह दर्शाता है कि आज की प्रौद्योगिकी के साथ क्या संभव है।

Two men speaking into microphones during a recording session, with audio editing software displayed on a screen in the background.

हर स्पीकर की भावना, समय, टोन और अनोखी विशेषताओं को बनाए रखते हुए ऑडियो और वीडियो का अनुवाद करें

एआई ऑडियो सिस्टम का भविष्य

जबकि वेवफॉर्म्स एआई के उत्पाद अभी भी विकास के चरण में हैं, एआई ऑडियो इंटरैक्शन को पुनः परिभाषित करने की उनकी महत्वाकांक्षा ने महत्वपूर्ण ध्यान आकर्षित किया है, जिसमें आंद्रेसेन होरोविट्ज़ के नेतृत्व में 40 मिलियन डॉलर की सीड फंडिंग भी शामिल है। चूंकि कंपनी स्पीच ट्यूरिंग टेस्ट को हल करने की दिशा में काम कर रही है, इसलिए प्रौद्योगिकी के साथ हमारी बातचीत को नया रूप देने की इसकी क्षमता बहुत अधिक है। इलेवनलैब्स ऑडियो एआई के भविष्य को आकार देने में अग्रणी बना हुआ है, तथा ऐसे समाधान प्रदान कर रहा है जो उद्योगों को बदल रहे हैं तथा उपयोगकर्ताओं की वर्तमान आवश्यकताओं को पूरा कर रहे हैं।

Flowchart diagram with black and white nodes labeled "USER," "SPEECH TO TEXT," "TEXT TO SPEECH," "AGENT," "LLM," "MONITORING," and "FUNCTION CALLING" connected by curved lines on a blue gradient background.

मिनटों में वेब, मोबाइल या टेलीफोनी पर अपने एजेंटों की आवाज़ जोड़ें। हमारा रियलटाइम API कम लेटेंसी, पूरी तरह से कस्टमाइज़ेबल और आसान स्केलेबिलिटी प्रदान करता है।

वेवफॉर्म्स एआई ऑडियो की तुलना इलेवनलैब्स से कैसे की जाती है

समर्थन की तलाश में ऑडियो उत्पादन के अनेक उपयोग मामले भविष्य में, वेवफॉर्म्स एआई एक अच्छा सामान्य प्रयोजन ऑडियो एआई टूलकिट बन सकता है। फिलहाल, यह एक उत्पाद घोषणा ही है। दूसरी ओर, इलेवनलैब्स आज भी उपलब्ध है, जो उत्पादन-स्तर की गुणवत्ता और अनुकूलन प्रदान करता है।

आइए संक्षेप में मूल्यांकन करें कि वेवफॉर्म्स एआई प्रमुख क्षेत्रों में कैसे तुलना करता है टेक्स्ट टू स्पीच और ध्वनि उत्पादन.

टेक्स्ट टू स्पीच

इलेवनलैब्स टेक्स्ट-टू-स्पीच प्रौद्योगिकी में स्पष्ट उद्योग नेता के रूप में खड़ा है, जो निम्नलिखित पेशकश करता है:

  • प्रामाणिक लहजे और सांस्कृतिक बारीकियों के साथ 32 भाषाओं के लिए समर्थन
  • उन्नत भावनात्मक बुद्धिमत्ता जो पाठ्य संदर्भ पर प्रतिक्रिया करती है
  • आवाज़ की विशेषताओं पर नियंत्रण
  • उच्च गुणवत्ता वाली, मानवीय वाणी जो लंबे प्रारूप वाली विषय-वस्तु में एकरूपता बनाए रखती है
  • प्राकृतिक ध्वनि वाली आवाज़ों का एक व्यापक पुस्तकालय
  • आवाज़ों को क्लोन और अनुकूलित करने की क्षमता

इलेवनलैब्स की तकनीक पहले से ही उपलब्ध है विश्वसनीय, उत्पादन-तैयार आउटपुट जो पेशेवर मानकों को पूरा करता हैहैं। इसका विशेष दृष्टिकोण लगातार अधिक प्राकृतिक ध्वनि वाली आवाजें उत्पन्न करता है जो मानव वाणी की सूक्ष्म बारीकियों को पकड़ लेती हैं।

साउंड इफ़ेक्ट्स

ElevenLabs पहले से ही अधिक सुव्यवस्थित और सटीक दृष्टिकोण प्रदान करता है साउंड इफेक्ट पीढ़ी। इलेवनलैब्स प्रदान करता है:

  • प्रत्येक प्रॉम्प्ट के लिए चार अलग-अलग नमूनों का त्वरित निर्माण
  • विस्तृत पाठ विवरण के माध्यम से सटीक नियंत्रण
  • व्यावसायिक परियोजनाओं के लिए उपयुक्त उच्च गुणवत्ता वाला आउटपुट
  • सामान्य ध्वनि प्रभावों का एक व्यापक पुस्तकालय
  • पाठ्य विवरण से सीधे विशिष्ट प्रभाव बनाने की क्षमता

इलेवनलैब्स आवाज और ध्वनि प्रभाव निर्माण दोनों में विशिष्ट उत्कृष्टता प्रदान करता है। सर्वश्रेष्ठ एआई ध्वनि प्रभाव जनरेटरों में से एक के रूप में, यह विश्वसनीय, उत्पादन-तैयार आउटपुट उत्पन्न करता है जो पेशेवर सामग्री रचनाकारों की आवश्यकताओं को बेहतर ढंग से पूरा करता है।

टेक्स्ट-टू-स्पीच के लिए ElevenLabs का उपयोग कैसे करें

इन सरल चरणों का पालन करके अपनी सामग्री को पेशेवर-गुणवत्ता वाले वॉयसओवर में बदलें:

  1. साइन अप करें: निःशुल्क या सशुल्क खाता बनाएं ElevenLabs के साथ
  2. अपनी आवाज़ चुनें: प्राकृतिक ध्वनि वाली आवाज़ों की विविध लाइब्रेरी से चयन करें
  3. अपना पाठ इनपुट करें: अपनी स्क्रिप्ट को इंटरफ़ेस में पेस्ट या टाइप करें
  4. सेटिंग्स अनुकूलित करें: अपनी आवश्यकताओं के अनुरूप गति, स्वर और जोर को समायोजित करें
  5. पूर्वावलोकन करें और उत्पन्न करें: एक नमूना सुनें और अपना अंतिम ऑडियो आउटपुट तैयार करें
  6. डाउनलोड करना: अपना उच्च-गुणवत्ता वाला वॉयसओवर डाउनलोड करें

अंतिम विचार

वेफफॉर्म्स और इलेवनलैब्स जैसे एआई ऑडियो टूल्स का उद्भव सामग्री निर्माण में एक रोमांचक विकास को दर्शाता है। हालाँकि, वेवफॉर्म्स एआई ने प्रायोगिक ध्वनि उत्पादन और ऑडियो हेरफेर में प्रभावशाली महत्वाकांक्षाओं की घोषणा की है, लेकिन यह अभी तक उपयोग के लिए उपलब्ध नहीं है।

दूसरी ओर, ElevenLabs उपलब्ध है और उत्पादन-स्तर पर है। यह वर्तमान में AI टेक्स्ट-टू-स्पीच आवाज और ध्वनि प्रभाव निर्माण के लिए बाजार में अग्रणी समाधान है।

क्या आप ElevenLabs की AI तकनीक का परीक्षण करने के लिए तैयार हैं? साइन अप करें आज ही शुरू करें।

A blue sphere with a black arrow pointing to the right, next to a white card with a blue and black abstract wave design.

हमारी AI टेक्स्ट टू स्पीच टेक्नोलॉजी 32 भाषाओं में हजारों हाई क्वालिटी, इंसान जैसी आवाज़ें प्रदान करती है। चाहे आप एक मुफ़्त टेक्स्ट टू स्पीच समाधान खोज रहे हों या व्यावसायिक प्रोजेक्ट्स के लिए प्रीमियम वॉइस AI सेवा, हमारे टूल आपकी ज़रूरतों को पूरा कर सकते हैं

अक्सर पूछे जाने वाले प्रश्न

और जानें

Impact
A man in a wheelchair performing on stage at the Improv comedy theater, decorated for Christmas with a Christmas tree.

Help someone speak again

Impact Voice Lab connects people who’ve lost their voice with volunteers who clean and prepare audio recordings to help restore it

ElevenLabs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें