SynthID के साथ ElevenLabs द्वारा जनरेटेड ऑडियो की पहचान करें
- लेखक
- Daniel Fletcher
- प्रकाशित
- आखिरी बार अपडेट किया गया
सुनेंइस आर्टिकल को सुनें
लोगों को पता होना चाहिए कि वे कब AI से इंटरैक्ट कर रहे हैं। पहले, AI द्वारा जनरेटेड कंटेंट को पहचानना आसान था – वह रोबोट जैसा लगता था या उसमें छह उंगलियां होती थीं। लेकिन हाल ही में मॉडल्स में सुधार के बाद, अब पहचानना काफी मुश्किल हो गया है।
जैसे-जैसे हमारे वॉइस, म्यूजिक और साउंड इफेक्ट्स मॉडल बेहतर हो रहे हैं, हम चाहते हैं कि लोग बिना किसी खास टूल के भी पहचान सकें कि ऑडियो AI से जनरेट हुआ है या नहीं। इसी वजह से हम Google DeepMind के साथ SynthID: एक डिजिटल वॉटरमार्क जो ElevenLabs द्वारा जनरेट किए गए ऑडियो में सीधे एम्बेड किया जाता है। ये वॉटरमार्क इंसानों को सुनाई नहीं देते, और ऑडियो क्लिप को ट्रिम, तेज, मेटाडेटा हटाने या फाइल टाइप बदलने पर भी बने रहते हैं। इस हफ्ते से हमने मुफ़्त यूज़र्स के लिए टेक्स्ट टू स्पीच जनरेशन में SynthID जोड़ना शुरू किया है, और आने वाले हफ्तों में हम इसे सभी ElevenLabs ऑडियो जनरेशन में शामिल करेंगे। सबसे ज़रूरी बात, ये वॉटरमार्क हमारे नए मुफ़्त
पारदर्शिता और जवाबदेही को मजबूत बनाना
हमने हमेशा अपने टूल्स का इस्तेमाल लोगों को धोखा देने, गुमराह करने या परेशान करने के लिए मना किया है, और हमारी सिस्टम्स पहले से ही कंटेंट को उस यूज़र तक ट्रेस करने के लिए डिज़ाइन की गई हैं जिसने उसे जनरेट किया है, ताकि हम सही कदम उठा सकें। SynthID के साथ वॉटरमार्किंग, पारदर्शिता और जवाबदेही के प्रति हमारी प्रतिबद्धता को आगे बढ़ाती है, जिससे आम लोग भी ऑडियो क्लिप के स्रोत को सत्यापित कर सकते हैं।
कई बार लोग सिर्फ यह जानना चाहेंगे कि कंटेंट AI से जनरेट हुआ है या नहीं। कभी-कभी यह जानना जरूरी होगा कि वह किस AI प्लेटफॉर्म से आया है। इसी वजह से हम आज अपना मुफ़्त ElevenLabs ऑडियो डिटेक्टर वेबपेज लॉन्च कर रहे हैं, जिससे लोग यह जांच सकते हैं कि ऑडियो ElevenLabs से जनरेट हुआ है या नहीं। यह हमारे मौजूदा AI स्पीच क्लासिफायर पर आधारित है, लेकिन SynthID का इस्तेमाल करके ऑडियो में और भी मजबूत तरीके से स्रोत की जानकारी जोड़ता है। यह तरीका जरूरी है ताकि हम अपनी टेक्नोलॉजी की ताकत के लिए सार्वजनिक रूप से जवाबदेह रहें और अगर कोई गलत इरादे वाला व्यक्ति हमारी पूरी सुरक्षा को पार कर के नकली डीपफेक बना ले, तो हम सही कदम उठा सकें।
अब कई जगहों पर AI द्वारा जनरेटेड कंटेंट को मशीन-रीडेबल फॉर्मेट में सिंथेटिक के रूप में मार्क करना जरूरी हो गया है। SynthID के साथ वॉटरमार्किंग हमारे मौजूदा स्रोत और अनुपालन टूल्स को और मजबूत बनाती है, जिसमें C2PA क्रेडेंशियल्स भी शामिल हैं। हम SynthID को C2PA सॉफ्ट बाइंडिंग्स लिस्ट में जोड़ने की संभावना को लेकर भी उत्साहित हैं, ताकि जिन ऑडियो से कंटेंट क्रेडेंशियल्स हट गए हैं, उनमें उन्हें फिर से जोड़ा जा सके।
उच्च गुणवत्ता वाला वॉटरमार्किंग समाधान
SynthID ऑडियो क्लिप्स में एक साउंड पैटर्न छुपा कर काम करता है। यह पैटर्न इंसानी कानों को सुनाई नहीं देता, लेकिन हमारे ElevenLabs Audio Detector से पहचाना जा सकता है। हर ऑडियो फाइल को उसका अपना यूनिक पैटर्न मिलता है, और ये पैटर्न कंप्रेशन, क्लिपिंग और स्पीड बदलने जैसी आम ऑडियो प्रोसेसिंग के बाद भी बने रहते हैं।
SynthID ने हमारे बेंचमार्क्स में अच्छा प्रदर्शन किया और हमारी सभी तकनीकी जरूरतों को पूरा किया:
- पहले बाइट तक कोई अतिरिक्त लेटेंसी नहीं (TTFB)
- कम फॉल्स पॉजिटिव रेट के साथ हाई डिटेक्शन रेट
- ऑनलाइन आमतौर पर होने वाले क्रॉपिंग और अन्य बदलावों के लिए मजबूत
- इंसानी कानों को बिल्कुल भी सुनाई नहीं देता, ऑडियो क्वालिटी में कोई गिरावट नहीं
- ऐसे ऑडियो पर कॉपी नहीं किया जा सकता जिसे ElevenLabs ने जनरेट नहीं किया हो
हम Google DeepMind की SynthID टीम के साथ मिलकर ऑडियो वॉटरमार्किंग को और आगे बढ़ाने के लिए उत्साहित हैं।
आगे क्या
वॉटरमार्किंग का मुख्य उद्देश्य पारदर्शिता और जवाबदेही है, लेकिन इससे नए प्रोडक्ट फीचर्स भी संभव होते हैं। डिजिटल कंटेंट क्रेडेंशियल्स का बाजार पहले से ही मौजूद है – स्टूडियोज़ इन्हें अपनी बौद्धिक संपत्ति की सुरक्षा के लिए इस्तेमाल करते हैं, और क्रिएटर्स इन्हें दोबारा इस्तेमाल होने पर पेमेंट सुनिश्चित करने के लिए। भविष्य में, वॉटरमार्क्स की मदद से क्रिएटर्स और IP होल्डर्स अपना मेटाडेटा सीधे कंटेंट में जोड़ सकेंगे, जिससे वे YouTube, Instagram और TikTok जैसे प्लेटफॉर्म्स पर अपने कॉपीराइटेड कंटेंट को पहचान सकेंगे और उस पर कार्रवाई कर सकेंगे।
वॉटरमार्किंग हमारी पारदर्शिता की प्रतिबद्धता का एक हिस्सा है। जैसे-जैसे हमारे मॉडल और ताकतवर और असली जैसे होते जाएंगे, हमारी जवाबदेही की व्यवस्था भी उतनी ही मजबूत होनी चाहिए। जितना ज्यादा हम सभी कंटेंट को उसके स्रोत से जोड़ पाएंगे, उतना ही भरोसेमंद हमारा साझा सूचना तंत्र बनेगा।
%20(1).png&w=3840&q=80)



