कॉन्टेंट पर जाएं

Eleven v3 अब सभी के लिए उपलब्ध

लेखक
Joe Reeve

Eleven v3, हमारा सबसे एडवांस्ड टेक्स्ट टू स्पीच मॉडल, अब अल्फा से बाहर आ गया है और सभी के लिए उपलब्ध है।

Eleven v3, our most advanced Text to Speech model, is now out of Alpha and generally available.

Eleven v3, हमारा सबसे एडवांस्ड टेक्स्ट टू स्पीच मॉडल, अब अल्फा से बाहर आ गया है और सभी के लिए उपलब्ध है।

अल्फा रिलीज़ के बाद से, हमने मॉडल को और बेहतर बनाया है। दो मुख्य सुधार:

अब और भी स्थिर।टेस्टिंग में, यूज़र्स ने नई वर्शन को 72% बार पुराने अल्फा रिलीज़ से बेहतर माना।

अब और भी सटीक।हमने मॉडल की नंबर, सिंबल्स और खास नोटेशन को अलग-अलग भाषाओं में समझने की क्षमता काफी बेहतर की है।

सटीकता में सुधार

टेक्स्ट टू स्पीच मॉडल्स को आपके लिखे हुए को समझना और सही तरीके से बोलना होता है। एक ही सिंबल अलग-अलग संदर्भ में अलग मतलब रख सकते हैं।

जैसे एक फोन नंबर: "+49 170 9876543"

कुछ मामलों में, हमारे मॉडल इसे "प्लस फोर्टी-नाइन, वन हंड्रेड सेवेंटी, नाइन मिलियन एट हंड्रेड सेवेंटी- सिक्स थाउज़ेंड फाइव हंड्रेड फोर्टी-थ्री" की तरह पढ़ते थे - यानी अंकों को बड़े नंबर की तरह, न कि एक-एक अंक के क्रम में। सही पढ़ना है: "प्लस फोर नाइन, वन सेवन ज़ीरो, नाइन एट सेवन सिक्स फाइव फोर थ्री।"

ऐसी गलतियाँ कई कैटेगरी में दिखीं - जैसे खेल के स्कोर, केमिकल फॉर्मूला, करेंसी, कोऑर्डिनेट्स - जहाँ भी मॉडल्स को सिंबल्स को समझकर बोलना पड़ता था।

हमने 8 भाषाओं में 27 कैटेगरी कवर करने वाले इंटरनल बेंचमार्क पर टेस्ट किया।

कुल मिलाकर:गलतियों में 68% की कमी। एरर रेट 15.3% से घटकर 4.9% हो गया।

कैटेगरी के हिसाब से एरर रेट:

Before
Chemical Formulas
45.6%
Phone Numbers
16.9%
URLs / Emails
45.6%
ISBNs
17.9%
License Plates
14.4%
Mathematical Expressions
23.8%
Geographic Coordinates
46.2%
After
Chemical Formulas
0.6%
Phone Numbers
0.6%
URLs / Emails
3.9%
ISBNs
0.0%
License Plates
1.2%
Mathematical Expressions
6.9%
Geographic Coordinates
17.5%
Error Reduction
Chemical Formulas
99%
Phone Numbers
99%
URLs / Emails
91%
ISBNs
100%
License Plates
91%
Mathematical Expressions
71%
Geographic Coordinates
62%

सबसे बड़ा सुधार उन कैटेगरी में दिखा जहाँ संदर्भ के हिसाब से मतलब बदलता है - जैसे कोलन कभी खेल का स्कोर, कभी समय या कभी आस्पेक्ट रेशियो दिखा सकता है।

उदाहरण

करेंसी — सही मात्रा:

इनपुट:  ¥250,000

पहले: 25,000 येन

अब:  250,000 येन

केमिकल फॉर्मूला — सिंबल्स सही रखे गए:

इनपुट:  SO₂

पहले: "सल्फर डबल" (गलत)

अब:  "S O टू"

खेल के स्कोर — संदर्भ के अनुसार सही पढ़ना:

इनपुट:  फाइनल स्कोर: 102-98

पहले: "वन हंड्रेड टू माइनस नाइंटी-एट"

अब:  "वन हंड्रेड टू टू नाइंटी-एट"

उपलब्धता

Eleven v3 अब सभी प्लेटफॉर्म्स पर उपलब्ध है।

ElevenLabs टीम के लेखों को देखें

ElevenLabs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें