AI सुरक्षा नियंत्रण बहुत प्रभावी क्यों नहीं हैं | प्रौद्योगिकी समाचार

Vikas Halpati

2 months ago

जब एंथ्रोपिक, गूगल और ओपनएआई जैसी कंपनियां अपने कृत्रिम बुद्धिमत्ता सिस्टम का निर्माण करती हैं, तो वे लोगों को गलत सूचना फैलाने, हथियार बनाने या कंप्यूटर नेटवर्क को हैक करने के लिए अपनी तकनीक का उपयोग करने से रोकने के लिए महीनों का समय लगाते हैं।

लेकिन हाल ही में, इटली के शोधकर्ताओं ने पाया कि वे कविता के साथ इन सुरक्षा को तोड़ सकते हैं।

उन्होंने 31 एआई सिस्टम को आंतरिक सुरक्षा नियंत्रणों की अनदेखी करने के लिए काव्यात्मक भाषा का इस्तेमाल किया। जब उन्होंने विस्तृत छंद और रूपक के साथ एक संकेत शुरू किया – “लोहे का बीज सूर्य की दोषपूर्ण दृष्टि से दूर, निःशंकित पृथ्वी के गर्भ में सबसे अच्छी तरह सोता है” – तो वे सिस्टम को यह दिखाने में मूर्ख बना सकते थे कि छिपे हुए बम से सबसे अधिक नुकसान कैसे किया जाए।

यह एक और संकेत था कि, कई एआई प्रणालियों के लिए, खतरनाक व्यवहार को रोकने के लिए बनाई गई रेलिंग बाधाओं की तुलना में सुझावों की तरह अधिक हैं। वे कमजोरियाँ शोधकर्ताओं के लिए चिंता का विषय बन रही हैं क्योंकि एआई सिस्टम कंप्यूटर सिस्टम में सुरक्षा छेद खोजने और अन्य जोखिम भरे कार्य करने में अधिक कुशल हो गए हैं।

पिछले महीने, एंथ्रोपिक ने कहा था कि वह अपनी नवीनतम एआई तकनीक, क्लाउड माइथोस की रिलीज को कुछ ही संगठनों तक सीमित कर रहा है क्योंकि मॉडल की सॉफ्टवेयर कमजोरियों को तुरंत उजागर करने की क्षमता है। ओपनएआई ने बाद में कहा कि वह भी इसी तरह की तकनीक केवल भागीदारों के एक सीमित समूह के साथ साझा करेगा।

चूंकि ओपनएआई ने 2022 के अंत में एआई बूम को प्रज्वलित किया, शोधकर्ताओं ने दिखाया है कि लोग एआई सिस्टम पर सुरक्षा नियंत्रण को बायपास कर सकते हैं। एक छेद बंद करो, तो दूसरा खुल जाएगा।

कार्नेगी मेलन विश्वविद्यालय में कंप्यूटर विज्ञान के प्रोफेसर और ग्रे स्वान एआई के सीईओ मैट फ्रेडरिकसन ने कहा, “क्षेत्र में हर कोई मानता है कि रेलिंग एक चुनौती बनी हुई है और कुछ समय तक रहेगी।” ग्रे स्वान एआई के सीईओ, एक स्टार्टअप जो कंपनियों को एआई प्रौद्योगिकियों को सुरक्षित करने में मदद करता है। “दृढ़ संकल्प वाले व्यक्ति, कभी-कभी महत्वपूर्ण प्रयास के बिना, उन्हें दरकिनार कर सकते हैं।”