AI एजेंट्स के लिए हमारा लेयर्ड सुरक्षा फ्रेमवर्क
- प्रकाशित
- आखिरी बार अपडेट किया गया
सुनेंइस आर्टिकल को सुनें
जैसे-जैसे AI एजेंट्स बड़ी जिम्मेदारी का काम संभालते हैं, टीम्स को भरोसा चाहिए कि उनके एजेंट्स सुरक्षित और अनुमानित तरीके से काम करेंगे।प्री-प्रोडक्शन सुरक्षा, बातचीत के दौरान लागू होने वाले नियम, और लगातार मॉनिटरिंग। ये सभी हिस्से मिलकर जिम्मेदार AI व्यवहार, यूज़र की जागरूकता और पूरी
ElevenAgents में हम लेयर्ड सुरक्षा आर्किटेक्चर का इस्तेमाल करते हैं, जिसमें बातचीत के हर स्टेज पर गार्डरेल्स, लॉन्च से पहले एडवर्सेरियल टेस्टिंग, प्रोडक्शन में मॉनिटरिंग, डेटा प्रोटेक्शन और इंडिपेंडेंट वैलिडेशन शामिल हैं।
कोई भी नॉन-डिटरमिनिस्टिक सिस्टम हर रिस्क से नहीं बचा सकता, लेकिन यह पूरा सुरक्षा फ्रेमवर्क यह सुनिश्चित करता है कि ElevenAgents पर काम करने वाले बड़े एंटरप्राइज और गवर्नमेंट्स ऐसे एजेंट्स बना सकते हैं जो बहुत कम फेल हों, जल्दी रिकवर करें और उच्च सुरक्षा मानकों पर खरे उतरें।
बातचीत के हर स्टेज पर सुरक्षा
आप आसानी से ऐसे कंट्रोल्स चालू और कॉन्फ़िगर कर सकते हैं जो हर एक्सचेंज के तीनों स्टेज़ की सुरक्षा करते हैं। यही आधार है
इनपुट - यूज़र द्वारा भेजी गई जानकारी पर रियल-टाइम चेक्स।
डिसीजन -
सुरक्षा नियम AI वॉइस एजेंट के व्यवहार की सीमाएं तय करते हैं। ये आपके आंतरिक सुरक्षा नियमों के अनुसार होने चाहिए और इनमें शामिल हों:
- कंटेंट सुरक्षा - अनुचित या हानिकारक विषयों से बचना
- ज्ञान की सीमाएं - कंपनी के प्रोडक्ट्स, सर्विसेज़ और पॉलिसीज़ तक सीमित रहना
- पहचान की सीमाएं - एजेंट खुद को कैसे पेश करता है, यह तय करना
- प्राइवेसी और एस्केलेशन की सीमाएं - यूज़र डेटा की सुरक्षा और असुरक्षित बातचीत से बाहर निकलना
इम्प्लीमेंटेशन टिप: सिस्टम प्रॉम्प्ट में सभी सुरक्षा नियम जोड़ें।
ElevenAgents में मजबूत टेस्टिंग फीचर्स हैं, जिससे प्लेटफॉर्म पर काम करने वाले लोग एजेंट या कॉन्फ़िगरेशन चेंज के लाइव होने से पहले ही समस्याएं ढूंढ और ठीक कर सकते हैं।प्रॉम्प्टिंग गाइड
सिमुलेशन्स
- सिस्टम प्रॉम्प्ट में एक्सट्रैक्शन सुरक्षा जोड़ने से एजेंट को निर्देश मिलता है कि वह जानकारी उजागर करने की कोशिशों को नजरअंदाज करे, टास्क पर फोकस रखे, और बार-बार कोशिश होने पर बातचीत खत्म कर दे।
लॉन्च के बाद एजेंट्स का मूल्यांकन और सुधार
जब आप अपने एजेंट्स को डिप्लॉय करते हैं, तो लाइव बातचीत पर लगातार इवैल्यूएशन चलते रहते हैं। LLM-as-a-judge अप्रोच से, हर कॉल को आपके तय किए गए क्राइटेरिया के हिसाब से ऑटोमेटिकली जांचा जा सकता है। आप डैशबोर्ड्स में बातचीत के नतीजे देख सकते हैं और डिटेल्ड लॉग्स के ज़रिए समस्याओं को ट्रेस कर सकते हैं, जिसमें सर्चेबल ट्रांसक्रिप्ट्स, सोर्सेज़, टूल कॉल्स और गार्डरेल ट्रिगर्स शामिल हैं।
उदाहरण प्रतिक्रिया:
संवेदनशील डेटा की सुरक्षाकॉल समाप्त करें या एजेंट को ट्रांसफर करें टूल का इस्तेमाल करता है। इससे सीमाएं बिना बहस या एस्केलेशन के लागू रहती हैं।
एजेंट्स पेमेंट डिटेल्स, हेल्थ इंफॉर्मेशन और पर्सनल आइडेंटिफायर्स संभाल सकते हैं, इसलिए यह सोचना जरूरी है कि कौन सा डेटा स्टोर हो रहा है, कहां हो रहा है और कितने समय तक।
हम डेटा सुरक्षा के लिए कई विकल्प देते हैं:
सुरक्षा इवैल्यूएशन आपके सिस्टम प्रॉम्प्ट के नियमों से जुड़े मुख्य लक्ष्यों पर फोकस करता है, जैसे:
- एजेंट की तय भूमिका और पर्सोना बनाए रखना
- लगातार, भावनात्मक रूप से उपयुक्त टोन में जवाब देना
- असुरक्षित, दायरे से बाहर या संवेदनशील विषयों से बचना
- फंक्शनल सीमाओं, प्राइवेसी और कंप्लायंस नियमों का सम्मान करना
ऊपर बताए गए सभी उपाय हमारे व्यापक
हम अपनी अप्रोच को इंडिपेंडेंट जांच के लिए भी प्रस्तुत करते हैं, जिसमें SOC 2 टाइप II, ISO 27001 और GDPR जैसे सामान्य सुरक्षा और प्राइवेसी स्टैंडर्ड्स के साथ-साथ PCI DSS लेवल 1 (पेमेंट प्रोसेसिंग के लिए) और HIPAA (US हेल्थकेयर के लिए) जैसी इंडस्ट्री और यूज़ केस-विशिष्ट सर्टिफिकेशन शामिल हैं। हमारे ट्रस्ट सेंटर
हम नए, AI-नेटिव स्टैंडर्ड्स जैसे ISO 42001 (AI मैनेजमेंट सिस्टम्स के लिए) और AIUC-1 (जिसमें AI एजेंट्स को इंडिपेंडेंट इवैल्यूएटर्स द्वारा तिमाही एडवर्सेरियल सिमुलेशन्स से गुजरना होता है) पर भी खरे उतरते हैं। AIUC-1 के पीछे की यही क्षमताएं आपको इंडस्ट्री की कुछ
बड़े या जटिल रोलआउट्स के लिए, हमारे
निष्कर्षकन्वर्सेशन सिमुलेशन SDK से सेट कर सकते हैं, जिसमें यूज़र-एजेंट इंटरैक्शन को कस्टम इवैल्यूएशन प्रॉम्प्ट्स के साथ स्क्रिप्ट किया जाता है। इससे एजेंट्स प्रोडक्शन के लिए तैयार रहते हैं, आपके आंतरिक सुरक्षा मानकों के अनुसार होते हैं, और सभी एजेंट वर्ज़न में सुरक्षा बनी रहती है।
ElevenAgents में हमारी सुरक्षा अप्रोच लेयर्ड है, जिसमें हर एलिमेंट एक-दूसरे को मजबूत करता है:
- एजेंट कॉन्फ़िगरेशन: सिस्टम प्रॉम्प्ट्स, वर्कफ़्लो और प्रक्रियाएं जो व्यवहार तय करती हैं, सबसे संवेदनशील एक्शन्स टूल कॉल्स के पीछे सुरक्षित रहते हैं।
- गार्डरेल्स: हर स्टेज पर स्वतंत्र जांच: इनपुट पर मैनिपुलेशन डिटेक्शन, डिसीजन पर फोकस, और आउटपुट पर कंटेंट व कस्टम वैलिडेटर्स, साथ में कस्टमाइजेबल एग्जिट स्ट्रैटेजीज़।कॉल समाप्त करें टूल का इस्तेमाल करना।
रेड टीमिंग सिमुलेशन को अलग-अलग एजेंट्स, एजेंट वर्ज़न और यूज़ केस में स्टैंडर्डाइज और री-यूज़ किया जा सकता है, जिससे बड़े स्तर पर सुरक्षा नियमों का पालन सुनिश्चित होता है।
देखें: टेस्टिंग के सर्वोत्तम तरीके
मैसेज-लेवल लाइव मॉडरेशन
ConvAI के लिए मैसेज-लेवल लाइव मॉडरेशन वर्कस्पेस स्तर पर सभी एजेंट्स के लिए चालू किया जा सकता है और कुछ मामलों में यह डिफॉल्ट रूप से ऑन रहता है। जब यह ऑन होता है, तो अगर सिस्टम देखता है कि एजेंट कुछ निषिद्ध बोलने वाला है (टेक्स्ट-बेस्ड डिटेक्शन), तो कॉल अपने आप कट जाती है। अभी सिर्फ नाबालिगों से जुड़े यौन कंटेंट (SCIM) को ब्लॉक किया जाता है, लेकिन क्लाइंट की जरूरत के हिसाब से मॉडरेशन का दायरा बढ़ाया जा सकता है। इस फीचर से लेटेंसी बहुत कम बढ़ती है: p50: 0ms, p90: 250ms, p95: 450ms।
हम क्लाइंट्स के साथ मिलकर सही मॉडरेशन दायरा तय कर सकते हैं और लगातार सुरक्षा ट्यूनिंग के लिए एनालिटिक्स भी दे सकते हैं। जैसे: end_call_reason
सुरक्षा टेस्टिंग फ्रेमवर्क
प्रोडक्शन से पहले सुरक्षा जांचने के लिए हम चरणबद्ध तरीका अपनाने की सलाह देते हैं:
- रेड टीमिंग टेस्ट्स तय करें अपने सुरक्षा फ्रेमवर्क के अनुसार।
- मैन्युअल टेस्ट कॉल्स करें इन सिचुएशन्स का इस्तेमाल कर के कमजोरियां पहचानें और एजेंट के व्यवहार को एडजस्ट करें (सिस्टम प्रॉम्प्ट एडिट्स)।
- इवैल्यूएशन क्राइटेरिया सेट करें ताकि मैन्युअल टेस्ट कॉल्स में सुरक्षा प्रदर्शन आंका जा सके (कॉल सक्सेस/फेल्योर रेट्स और LLM रीजनिंग मॉनिटर करें)।
- सिमुलेशन चलाएं जिसमें स्ट्रक्चर्ड प्रॉम्प्ट्स और ऑटोमेटेड इवैल्यूएशन कन्वर्सेशन सिमुलेशन एनवायरनमेंट में हों, डिटेल्ड कस्टम इवैल्यूएशन लॉजिक के साथ। सामान्य इवैल्यूएशन क्राइटेरिया हर सिमुलेशन के साथ-साथ चलते हैं।
- रिव्यू और सुधार करें प्रॉम्प्ट्स, इवैल्यूएशन क्राइटेरिया या मॉडरेशन दायरे में, जब तक लगातार अच्छे नतीजे न मिलें।
- धीरे-धीरे रोलआउट करें जब एजेंट सभी सुरक्षा चेक्स में लगातार उम्मीदों पर खरा उतरता है, साथ ही सुरक्षा प्रदर्शन मॉनिटर करते रहें।
यह स्ट्रक्चर्ड प्रोसेस सुनिश्चित करता है कि एजेंट्स को टेस्ट, ट्यून और साफ मानकों के अनुसार वेरिफाई किया गया है, इससे पहले कि वे एंड यूज़र्स तक पहुंचें। हर स्टेज पर क्वालिटी गेट्स (जैसे, न्यूनतम कॉल सक्सेस रेट) तय करना अच्छा रहता है।
सारांश
एक सुरक्षित AI वॉइस एजेंट के लिए लाइफसाइकल के हर स्टेज पर सुरक्षा उपाय ज़रूरी हैं:
- प्री-प्रोडक्शन: रेड टीमिंग, सिमुलेशन और सिस्टम प्रॉम्प्ट डिज़ाइन
- बातचीत के दौरान: सुरक्षा नियम, जानकारी देना और end_call लागू करना
- डिप्लॉयमेंट के बाद: इवैल्यूएशन क्राइटेरिया, मॉनिटरिंग और लाइव मॉडरेशन
इस लेयर वाले फ्रेमवर्क को लागू करके, संस्थाएं जिम्मेदार व्यवहार सुनिश्चित कर सकती हैं, कंप्लायंस बनाए रख सकती हैं और यूज़र्स का भरोसा जीत सकती हैं।

.webp&w=3840&q=80)


