कॉन्टेंट पर जाएं

Storytel ने ElevenLabs पर बने वॉइस स्विचर के साथ ऑडियोबुक नैरेशन को नए सिरे से सोचा

प्रकाशित

सुनेंइस आर्टिकल को सुनें

Storytel दुनिया की सबसे बड़ी ऑडियोबुक स्ट्रीमिंग और पब्लिशिंग कंपनियों में से एक है, जिसके मुख्य बाज़ार स्वीडन, डेनमार्क, फिनलैंड और नॉर्वे हैं। हमने Storytel के साथ मिलकर वॉइस स्विचर बनाया, जिससे श्रोता ऑरिजिनल इंसान नैरेटर और उसी ऑडियोबुक के AI नैरेशन में से चुन सकते हैं।

श्रोताओं की पुरानी समस्या

Storytel के यूज़र डेटा से पता चला कि दस में से नौ ग्राहक कभी-कभी ऑडियोबुक इसलिए छोड़ देते हैं क्योंकि वे नैरेटर की आवाज़ से जुड़ नहीं पाते, किताब की वजह से नहीं। वहीं, ऑडियोबुक्स लगभग कभी दो नैरेटर के साथ रिकॉर्ड नहीं होती थीं—पारंपरिक प्रोडक्शन की लागत इसकी इजाज़त नहीं देती थी।

वॉइस स्विचर इसी कमी को पूरा करने के लिए बनाया गया।

Storytel ने ElevenLabs को क्यों चुना

Storytel कई सालों से AI वॉइस पर काम कर रहा था, लेकिन ElevenLabs के साथ पार्टनरशिप के बाद चीज़ें बदलीं। जब Storytel ने 2023 में ElevenLabs का शुरुआती डेमो देखा, तो उसकी क्वालिटी अब तक देखी गई किसी भी चीज़ से बेहतर थी। इसी डेमो से हमारी साझेदारी शुरू हुई।

"हम क्वालिटी देखकर हैरान रह गए। हम काफी समय से AI वॉइस में रुचि रखते थे, लेकिन ElevenLabs जैसी क्वालिटी पहले कभी नहीं देखी थी।"

जोहन स्टॉले, चीफ प्रोडक्ट और टेक्नोलॉजी ऑफिसर, Storytel

नॉर्डिक भाषाओं के लिए कस्टम मॉडल

हमारी इंग्लिश वॉइस Storytel के लिए 2023 की गर्मियों में वॉइस स्विचर का पायलट चलाने के लिए काफी अच्छी थी, लेकिन स्वीडिश वॉइस अभी पूरी ऑडियोबुक के लिए तैयार नहीं थी। हमने Storytel के साथ मिलकर नॉर्डिक भाषाओं के लिए बेहतर मॉडल तैयार किया, जिसमें Storytel ने अपनी कैटलॉग से हाई-क्वालिटी ऑडियो डेटा दिया, क्योंकि वह दुनिया के सबसे बड़े ऑडियोबुक पब्लिशर्स में से एक है।

बेहतर नॉर्डिक मॉडल 2023 के अंत तक तैयार हो गया था।

लॉन्च और नॉर्डिक विस्तार

वॉइस स्विचर 2024 की शुरुआत में स्वीडन में लॉन्च हुआ, जिसमें स्वीडन के सबसे लोकप्रिय नैरेटर में से एक की प्रोफेशनल वॉइस क्लोन इस फीचर की पब्लिक एंबेसडर बनी। उस समय बहुत कम हाई-क्वालिटी, लंबी AI ऑडियोबुक प्रोडक्शंस मौजूद थीं, जिससे Storytel और ElevenLabs पहले ऐसे प्लेटफॉर्म बने जिन्होंने इतनी लंबाई और क्वालिटी में AI नैरेशन दिया।

इसके बाद वॉइस स्विचर डेनमार्क और फिनलैंड में भी लॉन्च हुआ, हर जगह लोकल भाषा में एंबेसडर वॉइस के साथ। Storytel अपने कैटलॉग में इंसान नैरेशन के साथ-साथ AI नैरेशन भी लगातार जोड़ रहा है।

पूरी तरह ऑटोमेटेड प्रोडक्शन की ओर बढ़ना

Storytel ElevenAPI के ज़रिए वॉइस स्विचर नैरेशन तैयार करता है, जिसमें इंटरनल प्री- और पोस्ट-प्रोसेसिंग भी होती है। प्रोनन्सिएशन डिक्शनरी, पहले से जनरेट किए गए प्रॉपर नाउन और कैरेक्टर-नेम चेक्स फाइनल रेंडरिंग से पहले क्वालिटी बढ़ाने में मदद करते हैं।

Storytel का लंबी अवधि का लक्ष्य है कि वॉइस स्विचर उसकी पूरी कैटलॉग में उपलब्ध हो। इस लक्ष्य तक पहुंचने के लिए मैन्युअल एडिटिंग को लगातार कम करना ज़रूरी है, और हम Storytel के साथ मिलकर पूरी तरह ऑटोमेटेड, API-ड्रिवन प्रोडक्शन की दिशा में काम कर रहे हैं।

संबंधित लेख

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं