Storytel ने ElevenLabs पर बने वॉइस स्विचर के साथ ऑडियोबुक नैरेशन को नए सिरे से सोचा
- प्रकाशित
- आखिरी बार अपडेट किया गया
सुनेंइस आर्टिकल को सुनें
Storytel दुनिया की सबसे बड़ी ऑडियोबुक स्ट्रीमिंग और पब्लिशिंग कंपनियों में से एक है, जिसके मुख्य बाज़ार स्वीडन, डेनमार्क, फिनलैंड और नॉर्वे हैं। हमने Storytel के साथ मिलकर वॉइस स्विचर बनाया, जिससे श्रोता ऑरिजिनल इंसान नैरेटर और उसी ऑडियोबुक के AI नैरेशन में से चुन सकते हैं।
श्रोताओं की पुरानी समस्या
Storytel के यूज़र डेटा से पता चला कि दस में से नौ ग्राहक कभी-कभी ऑडियोबुक छोड़ देते हैं, वजह किताब नहीं बल्कि नैरेटर की वॉइस से कनेक्शन न होना है। साथ ही,
वॉइस स्विचर इसी कमी को पूरा करने के लिए बनाया गया।
Storytel ने ElevenLabs को क्यों चुना
Storytel कई सालों से AI वॉइस पर काम कर रहा था, लेकिन ElevenLabs के साथ पार्टनरशिप के बाद चीज़ें बदलीं। जब Storytel ने 2023 में ElevenLabs का शुरुआती डेमो देखा, तो उसकी क्वालिटी अब तक देखी गई किसी भी चीज़ से बेहतर थी। इसी डेमो से हमारी साझेदारी शुरू हुई।
"हम क्वालिटी देखकर हैरान रह गए। हम काफी समय से
— जोहन स्टॉले, चीफ प्रोडक्ट और टेक्नोलॉजी ऑफिसर, Storytel
नॉर्डिक भाषाओं के लिए कस्टम मॉडल
हमारी इंग्लिश वॉइस Storytel के लिए 2023 की गर्मियों में वॉइस स्विचर का पायलट चलाने के लिए काफी अच्छी थी, लेकिन स्वीडिश वॉइस अभी पूरी ऑडियोबुक के लिए तैयार नहीं थी। हमने Storytel के साथ मिलकर नॉर्डिक भाषाओं के लिए बेहतर मॉडल तैयार किया, जिसमें Storytel ने अपनी कैटलॉग से हाई-क्वालिटी ऑडियो डेटा दिया, क्योंकि वह दुनिया के सबसे बड़े ऑडियोबुक पब्लिशर्स में से एक है।
बेहतर नॉर्डिक मॉडल 2023 के अंत तक तैयार हो गया था।
लॉन्च और नॉर्डिक विस्तार
वॉइस स्विचर 2024 की शुरुआत में स्वीडन में लॉन्च हुआ, जिसमें एक प्रोफेशनल
इसके बाद वॉइस स्विचर डेनमार्क और फिनलैंड में भी लॉन्च हुआ, हर जगह लोकल भाषा में एंबेसडर वॉइस के साथ। Storytel अपने कैटलॉग में इंसान नैरेशन के साथ-साथ AI नैरेशन भी लगातार जोड़ रहा है।
पूरी तरह ऑटोमेटेड प्रोडक्शन की ओर बढ़ना
Storytel ElevenAPI के ज़रिए वॉइस स्विचर नैरेशन तैयार करता है, जिसमें इंटरनल प्री- और पोस्ट-प्रोसेसिंग भी होती है। प्रोनन्सिएशन डिक्शनरी, पहले से जनरेट किए गए प्रॉपर नाउन और कैरेक्टर-नेम चेक्स फाइनल रेंडरिंग से पहले क्वालिटी बढ़ाने में मदद करते हैं।
Storytel का लंबी अवधि का लक्ष्य है कि वॉइस स्विचर उसकी पूरी कैटलॉग में उपलब्ध हो। इस लक्ष्य तक पहुंचने के लिए मैन्युअल एडिटिंग को लगातार कम करना ज़रूरी है, और हम Storytel के साथ मिलकर पूरी तरह ऑटोमेटेड, API-ड्रिवन प्रोडक्शन की दिशा में काम कर रहे हैं।



.png&w=3840&q=80)
