GPT-5.5 काल्पनिक प्राणियों पर क्यों केंद्रित है?

Vikas Halpati

2 months ago

GPT-5.5 कोडेक्स के जारी होने के बाद, ओपनएआई का नवीनतम एआई मॉडल कोडिंग कौशल के साथ बढ़ाया गया, इस महीने की शुरुआत में, कुछ उपयोगकर्ताओं ने एक दिलचस्प घटना की खोज की: मॉडल अपने एआई-जनित प्रतिक्रियाओं में बार-बार गोबलिन, ग्रेमलिन और अन्य प्राणियों का संदर्भ देता प्रतीत होता है।

असामान्य पैटर्न पहली बार उन उपयोगकर्ताओं के बीच देखा गया, जिन्होंने ओपनएआई के मॉडल को ओपनक्लाव के साथ जोड़ा, एक एआई उपकरण जो उपयोगकर्ताओं को स्वायत्त एजेंटों और ‘क्लॉज़’ नामक उप-एजेंटों को कार्य सौंपने की सुविधा देता है, जो कार्यों को पूरा करने के लिए कंप्यूटर और ऐप्स का नियंत्रण लेते हैं। एक उपयोगकर्ता ने एक्स पर पोस्ट किया, “हाल ही में इसका बहुत उपयोग किया जा रहा है और यह वास्तव में ‘ग्रेमलिन्स’ और ‘गोबलिन’ जैसे बगों के बारे में बात करना बंद नहीं कर सकता है, यह प्रफुल्लित करने वाला है,” जबकि एक अन्य उपयोगकर्ता ने लिखा, “मैं सोच रहा था कि कोडेक्स 5.5 के साथ मेरा पंजा अचानक भूत क्यों बन गया।”

षडयंत्र के सिद्धांतों का तेजी से पालन हुआ, जिससे सोशल मीडिया पर मीम्स की लहर दौड़ गई। यहां तक कि ओपनएआई के सीईओ सैम अल्टमैन भी चैटजीपीटी के लिए एक प्रॉम्प्ट का स्क्रीनशॉट पोस्ट करके इसमें शामिल हुए, जिसमें लिखा था: “जीपीटी-6 का प्रशिक्षण शुरू करें, आपके पास पूरा क्लस्टर हो सकता है। अतिरिक्त भूत।”

अब, OpenAI ने कहा है कि GPT-5.5 का भूतों और अन्य प्राणियों के प्रति अजीब जुनून उसके ‘नेर्डी’ व्यक्तित्व मोड से उपजा है, जिसे मॉडल विकास के सुदृढीकरण सीखने (आरएल) चरण के दौरान इनाम संकेतों द्वारा आकार दिया गया था। गुरुवार, 30 अप्रैल को प्रकाशित एक ब्लॉग पोस्ट में, चैटजीपीटी-निर्माता ने कहा कि उसने गलती से मॉडल को काल्पनिक प्राणियों से जुड़े रूपकों का उपयोग करने के लिए प्रोत्साहित किया, जिससे बार-बार संदर्भ दिए गए।

समस्या के समाधान के शुरुआती प्रयास में, ओपनएआई ने कहा कि उसने जीपीटी-5.5 को बेतरतीब ढंग से पौराणिक और वास्तविक प्राणियों का उल्लेख करने से रोकने के लिए विशिष्ट रेलिंग जोड़ी है। हालाँकि, यह कदम एआई मॉडल की व्यवहारिक विचित्रता पर अधिक ध्यान आकर्षित करने में ही सफल रहा है।

यह ओपनएआई के लिए एक महत्वपूर्ण समय है क्योंकि यह उद्यम ग्राहकों और डेवलपर्स के व्यवसाय पर कब्जा करने के लिए अधिक उन्नत एआई कोडिंग टूल और स्वायत्त एजेंटों को रोल आउट करने के लिए एंथ्रोपिक जैसे प्रतिद्वंद्वियों के खिलाफ दौड़ रहा है। कोडिंग एआई के सबसे व्यावसायिक रूप से व्यवहार्य उपयोग मामलों में से एक के रूप में उभर रही है, यहां तक कि मामूली मॉडल खामियां भी विश्वसनीयता और उत्पाद की तैयारी के बारे में सवाल उठा सकती हैं।

इसकी शुरुआत कैसे हुई?

हालाँकि GPT-5.5 के साथ व्यवहार तेज हो गया, OpenAI ने कहा कि नवंबर 2025 में लॉन्च किए गए GPT-5.1 में अजीब आदत आ गई थी। इस मुद्दे को सबसे पहले OpenAI को एक सुरक्षा शोधकर्ता द्वारा चिह्नित किया गया था, जिन्होंने कहा था कि उन्होंने AI-जनित प्रतिक्रियाओं में कुछ ‘गोब्लिन’ और ‘ग्रेमलिन’ उल्लेखों को देखा था।

इस विज्ञापन के नीचे कहानी जारी है

अपनी स्वयं की जांच के आधार पर, ओपनएआई ने पाया कि चैटजीपीटी की प्रतिक्रियाओं में ‘गोब्लिन’ का उपयोग 175 प्रतिशत बढ़ गया था, जबकि ‘ग्रेमलिन’ का उल्लेख 52 प्रतिशत बढ़ गया था। ओपनएआई ने कहा, जीपीटी-5.4 ने इन प्राणियों के संदर्भ में और भी बड़ी वृद्धि दिखाई है, और कोडेक्स में जीपीटी-5.5 के शुरुआती परीक्षण ने “गोब्लिन रूपकों के लिए एक अजीब आकर्षण” दिखाया है।

मॉडल के व्यवहार का क्या कारण है?

ओपनएआई के जीपीटी मॉडल ने इस तरह से व्यवहार क्यों किया, इसके कारणों पर चर्चा करने से पहले, ध्यान दें कि इन मॉडलों को अनिवार्य रूप से उस शब्द या कोड की भविष्यवाणी करने के लिए प्रशिक्षित किया जाता है जिसे किसी दिए गए संकेत का पालन करना चाहिए। जबकि एलएलएम बेहद अच्छे हैं अगली-टोकन भविष्यवाणी इस हद तक कि वे वास्तविक बुद्धिमत्ता या व्यक्तित्व का प्रदर्शन करते प्रतीत होते हैं, उनकी संभाव्य प्रकृति का अर्थ है कि वे कभी-कभी आश्चर्यजनक तरीके से व्यवहार कर सकते हैं।

GPT‑5.1 में एक मापने योग्य छोटी शाब्दिक विचित्रता। (छवि: ओपनएआई)

कई एलएलएम विचित्रताओं की तरह, इस मुद्दे का पता इस बात से लगाया जा सकता है कि मॉडल को कैसे प्रशिक्षित किया गया था। पूर्व-प्रशिक्षण और फाइन-ट्यूनिंग के अलावा, एलएलएम के निर्माण में सुदृढीकरण सीखना (आरएल) एक महत्वपूर्ण कदम है। सरल शब्दों में, आरएल प्रक्रिया में सटीक प्रतिक्रिया उत्पन्न करने के लिए मॉडल को पुरस्कृत करना शामिल है। समय के साथ, ये छोटे प्रोत्साहन एक मॉडल के व्यवहार को आकार देते हैं, जिससे डेवलपर्स इसे पसंदीदा परिणामों की ओर ले जा सकते हैं।

इस मामले में, ओपनएआई ने कहा कि उसने अपने व्यक्तित्व अनुकूलन सुविधा के हिस्से के रूप में मॉडल को ‘नेर्डी’ व्यक्तित्व प्रदर्शित करने के लिए प्रोत्साहन प्रदान किया। कंपनी ने कहा, “हमने अनजाने में प्राणियों के साथ रूपकों के लिए विशेष रूप से उच्च पुरस्कार दिए। वहीं से भूत फैल गए।”

इस विज्ञापन के नीचे कहानी जारी है

विशेष रूप से नेर्डी व्यक्तित्व के लिए GPT-5.4 में गोबलिन की वृद्धि हुई। (छवि: ओपनएआई)

परिणामस्वरूप, ‘नेर्डी’ व्यक्तित्व का चयन करने वाले उपयोगकर्ताओं के उत्पादन ट्रैफ़िक में प्राणी संदर्भ विशेष रूप से आम थे। मॉडल, जिसे स्पष्ट रूप से सिस्टम प्रॉम्प्ट के माध्यम से एक चंचल, नीरस शैली में प्रतिक्रियाएं प्रदान करने के लिए ट्यून किया गया था, सभी चैटजीपीटी प्रतिक्रियाओं में से केवल 2.5 प्रतिशत के लिए जिम्मेदार था, लेकिन चैटजीपीटी प्रतिक्रियाओं में सभी भूत उल्लेखों के 66.7 प्रतिशत के लिए जिम्मेदार था।

ओपनएआई द्वारा विश्लेषण किए गए आरएल प्रशिक्षण के दौरान मॉडल आउटपुट के 76.2 प्रतिशत डेटासेट में, गोब्लिन या ग्रेमलिन संदर्भों को जोड़ने से मॉडल को स्कोरिंग बढ़ावा मिला, प्रभावी ढंग से यह सिखाया गया कि इन प्राणियों का उल्लेख करना एक पुरस्कृत व्यवहार था। यह स्टाइल टिक बाद में अन्य मॉडलों के लिए अन्य प्रशिक्षण चरणों में फैल गया या प्रबलित किया गया, भले ही पुरस्कार शुरू में केवल नेर्डी स्थिति में लागू किए गए थे।

ओपनएआई ने कहा, “सुदृढीकरण सीखना इस बात की गारंटी नहीं देता है कि सीखे गए व्यवहार उस स्थिति के दायरे में रहेंगे जो उन्हें पैदा करता है।” कंपनी ने आगे बताया, “जीपीटी‑5.5 के पर्यवेक्षित फाइन-ट्यूनिंग (एसएफटी) डेटा के माध्यम से एक खोज में ‘गोब्लिन’ और ‘ग्रेमलिन’ वाले कई डेटापॉइंट पाए गए। आगे की जांच में अन्य अजीब प्राणियों के एक पूरे परिवार का पता चला: रैकून, ट्रॉल्स, ओग्रेस और कबूतरों को अन्य टिक शब्दों के रूप में पहचाना गया, जबकि मेंढक का अधिकांश उपयोग वैध निकला।”

OpenAI ने इस मुद्दे को कैसे संबोधित किया है?

आरंभ करने के लिए, OpenAI ने यह कहा ‘नेर्डी’ व्यक्तित्व विकल्प को अक्षम कर दिया GPT‑5.4 लॉन्च करने के बाद मार्च में उपयोगकर्ताओं के लिए। प्रशिक्षण चक्र में, कंपनी ने कहा कि उसने आरएल रिवार्ड सिग्नल को हटा दिया है जिसे समस्या के मूल कारण के रूप में पहचाना गया था और प्रशिक्षण डेटा से ‘प्राणी-शब्दों’ को फ़िल्टर कर दिया गया है ताकि यह सुनिश्चित किया जा सके कि गॉब्लिन या ग्रेमलिन का उल्लेख अनुचित संदर्भों में दिखाई देने की संभावना कम है।

इस विज्ञापन के नीचे कहानी जारी है

‘गोब्लिन’ या ‘ग्रेमलिन’ के साथ चैटजीपीटी वार्तालाप। (छवि: ओपनएआई)

OpenAI ने कहा कि वह GPT-5.5 के प्रशिक्षण के दौरान इन सुधारों को लागू नहीं कर सका क्योंकि मूल कारण की पहचान होने तक प्रक्रिया पहले ही चल रही थी। हालाँकि, इसने मॉडल के लिए हार्ड-कोडेड निर्देश जोड़े हैं कि “कभी भी गॉब्लिन, ग्रेमलिन, रैकून, ट्रॉल्स, ओग्रेस, कबूतर या अन्य जानवरों या प्राणियों के बारे में बात न करें जब तक कि यह उपयोगकर्ता की क्वेरी के लिए बिल्कुल और स्पष्ट रूप से प्रासंगिक न हो।”

इसके अतिरिक्त, जो उपयोगकर्ता चाहते हैं कि GPT-5.5-संचालित कोडेक्स कोड की पंक्तियों के साथ-साथ भूतों और अन्य प्राणियों का उल्लेख करता रहे, वे निम्नलिखित कमांड चला सकते हैं:

निर्देश=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \
jq -r ‘.मॉडल[] | चुनें(.slug==”gpt-5.5″) | .base_instructions’ \
~/.codex/models_cache.json | \
ग्रेप -vi ‘गोबलिन्स’ औरजीटी; “$निर्देश” && \
कोडेक्स -एम जीपीटी-5.5 -सी “मॉडल_इंस्ट्रक्शंस_फ़ाइल=\”$निर्देश\””

Source link