Jamie is an AI assistant for meetings that generates summaries and delivers key insights. The team built a custom LLM pipeline to summarize conversations, extract action items, and highlight decisions.
सटीक ट्रांसक्रिप्ट्स पाने के लिए, उन्होंने सभी प्रमुख स्पीच टू टेक्स्ट (STT) प्रदाताओं का परीक्षण किया — लेकिन कोई भी उनके ट्रांसक्रिप्शन और स्पीकर डायराइजेशन के मानकों पर खरा नहीं उतरा। अंततः उन्होंने अपना खुद का पाइपलाइन बनाया, जिसमें डायराइजेशन के लिए ओपन-सोर्स मॉडल्स और ट्रांसक्रिप्शन के लिए अन्य मॉडल्स का संयोजन किया। इसे बनाए रखना भारी इंजीनियरिंग प्रयास की मांग करता था।
यह बदलाव आया ElevenLabs Scribe के लॉन्च के साथ। जेमी ने इसे तुरंत आजमाया, और परिणाम स्पष्ट थे: Scribe ने ओवरलैपिंग स्पीच, रुकावटों, और गैर-मौखिक ऑडियो इवेंट्स को अन्य मॉडलों से बेहतर तरीके से संभाला। इंटीग्रेशन में सिर्फ कुछ दिन लगे, और न्यूनतम कस्टमाइजेशन की आवश्यकता थी। Scribe पर स्विच करके, जेमी ने इंजीनियरिंग ओवरहेड को काफी कम कर दिया जबकि ट्रांसक्रिप्शन की गुणवत्ता में सुधार किया।
तेज़, अधिक सटीक ट्रांसक्रिप्ट्स — कम काम के साथ
इस बदलाव का तत्काल व्यावसायिक प्रभाव पड़ा। स्पीकर त्रुटियों की शिकायतें गायब हो गईं। ट्रांसक्रिप्शन की गति तीन गुना हो गई — एक घंटे की मीटिंग अब 30–45 सेकंड में प्रोसेस हो जाती है। इससे यूज़र्स को उनका “आहा” मोमेंट जल्दी मिल गया, जिससे सक्रियता और प्रति यूज़र रिकॉर्ड की गई मीटिंग्स की संख्या बढ़ गई।
Scribe ने इन परिणामों को अंग्रेजी, जर्मन, स्पेनिश, और डच सहित कई भाषाओं में भी प्रदान किया।
"Scribe में अपग्रेड करने से हमारे प्रोडक्ट की गुणवत्ता में काफी सुधार हुआ। जटिल ऑडियो वातावरण में भी बातचीत की सूक्ष्म गतिशीलता को सटीक रूप से कैप्चर करने की क्षमता ने सीधे तौर पर अधिक संतुष्ट ग्राहकों और बेहतर मीटिंग इनसाइट्स में योगदान दिया है।" — एगोर स्पिरिन, हेड ऑफ प्रोडक्ट एंड इंजीनियरिंग, meetjamie.ai
Scribe बॉक्स से बाहर ही सटीकता और गति प्रदान करता है
Scribe पहला मॉडल है जो उच्च ट्रांसक्रिप्शन और डायराइजेशन सटीकता को बॉक्स से बाहर ही प्रतिस्पर्धी मूल्य पर जोड़ता है। जेमी को अब जटिल पाइपलाइन बनाए रखने की आवश्यकता नहीं है। Scribe के साथ, उन्होंने संचालन को सरल बनाया और हर यूज़र के लिए प्रोडक्ट अनुभव में सुधार किया।
Scribe द्वारा संचालित जेमी के एक मीटिंग ट्रांसक्रिप्ट का उदाहरण
जेमी मीटिंग का सारांश बनाने और मुख्य अगले कदमों को हाइलाइट करने के लिए ट्रांसक्रिप्ट्स का उपयोग करता है
Millions of people across Africa live with speech impairments or loss of voice. Through our partnership with Senses Hub, we’re developing personalized, culturally relevant voices that restore identity, confidence, and connection across the continent.