GPT-5.5 लॉन्च: OpenAI का कहना है कि ChatGPT अब कोड को डीबग कर सकता है और सॉफ़्टवेयर संचालित कर सकता है

Vikas Halpati

3 months ago

अपने इमेजेज 2.0 मॉडल को लॉन्च करने के तुरंत बाद, ओपनएआई ने एक और एआई मॉडल जारी किया है। सैन फ्रांसिस्को स्थित एआई स्टार्टअप ने चैटजीपीटी के लिए एक बड़े अपडेट की घोषणा की, क्योंकि कंपनी ने गुरुवार को अपना जीपीटी-5.5 मॉडल लॉन्च किया, इसे अब तक का अपना “सबसे स्मार्ट और सबसे सहज” मॉडल कहा।

GPT-5.5 में नया क्या है?

OpenAI का कहना है कि GPT-5.5 समस्याओं से निपटने के तरीके में अधिक कुशल है और कम टोकन और पुनः प्रयास के साथ उच्च गुणवत्ता वाले आउटपुट तक पहुंचने में सक्षम है।

OpenAI के सह-संस्थापक और अध्यक्ष ग्रेग ब्रॉकमैनएक्स (पूर्व में ट्विटर) पर एक पोस्ट में, ने लिखा, “जीपीटी-5.5 इंटेलिजेंस का एक नया वर्ग है। यह इंटेलिजेंस इसे उपयोग करने के लिए सहज बनाता है; यह थोड़े से सूक्ष्म प्रबंधन के साथ चुनौतीपूर्ण कार्यों को पूरा करता है। यह बहुत ही कुशल है, और कम विलंबता और बड़े पैमाने पर चलता है। कंप्यूटर पर काम करने के एक नए तरीके की ओर एक वास्तविक कदम।”

यह भी पढ़ें | ओरेकल के एआई ऋण की बाढ़ ने वॉल स्ट्रीट को चरम सीमा तक धकेल दिया है

एजेंट कोडिंग और सॉफ्टवेयर इंजीनियरिंग

OpenAI का कहना है कि GPT-5.5 इसका अब तक का सबसे मजबूत एजेंटिक कोडिंग मॉडल है, जो कार्यान्वयन, रीफैक्टरिंग और डिबगिंग जैसे एंड-टू-एंड इंजीनियरिंग कार्यों को संभालने में सक्षम है।

कंपनी ने अपने नए मॉडल की गुणवत्ता के बारे में विस्तार से बताने के लिए विभिन्न बेंचमार्क साझा किए। यह नोट किया गया:

टर्मिनल-बेंच 2.0 पर, जो जटिल कमांड-लाइन वर्कफ़्लो और टूल समन्वय का परीक्षण करता है, मॉडल ने 82.7% की अत्याधुनिक सटीकता हासिल की।
SWE-बेंच प्रो पर, जो वास्तविक दुनिया GitHub समस्या समाधान का मूल्यांकन करता है, यह 58.6% तक पहुंच गया, अपने पूर्ववर्तियों की तुलना में एक ही बार में अधिक कार्यों को हल करता है।

ओपनएआई का यह भी कहना है कि शुरुआती परीक्षकों ने नोट किया कि मॉडल में मजबूत वैचारिक स्पष्टता है, जो सिस्टम के व्यापक आकार को समझने और अस्पष्ट विफलताओं को सफलतापूर्वक नेविगेट करने में सक्षम है।

यह भी पढ़ें | मेटा 8,000 नौकरियों में कटौती करेगा क्योंकि एआई पुश के बीच माइक्रोसॉफ्ट ने बायआउट की पेशकश की है

एक सह-वैज्ञानिक

कोडिंग से परे, ओपनएआई का दावा है कि नया मॉडल मौलिक रूप से बदलता है कि ज्ञान कैसे काम करता है और वैज्ञानिक अनुसंधान कैसे किया जाता है। कंपनी का कहना है कि चूंकि उसका नया एआई इरादे को समझने में बेहतर है, इसलिए यह जानकारी खोजने के पूरे चक्र में अधिक स्वाभाविक रूप से आगे बढ़ता है: टूल का उपयोग करना, आउटपुट की जांच करना और कच्चे माल को किसी उपयोगी चीज़ में बदलना।

मॉडल ने जीडीपीवल पर 84.9% स्कोर किया, जो 44 व्यवसायों में ज्ञान कार्य का परीक्षण करता है, और वास्तविक कंप्यूटर वातावरण के संचालन के लिए ओएसवर्ल्ड-सत्यापित पर 78.7% स्कोर किया।
वैज्ञानिक अनुप्रयोगों में, मॉडल ने बिक्सबेंच पर 80.5% हासिल किया, जो वास्तविक दुनिया के जैव सूचना विज्ञान और डेटा विश्लेषण के लिए डिज़ाइन किया गया एक बेंचमार्क है।

OpenAI ने इस बात पर भी प्रकाश डाला कि GPT-5.5 के एक आंतरिक संस्करण ने रैमसे संख्याओं के संबंध में एक नए गणितीय प्रमाण की खोज में भी मदद की, जो कॉम्बिनेटरिक्स का एक जटिल क्षेत्र है जो अध्ययन करता है कि बड़े सिस्टम में ऑर्डर अनिवार्य रूप से कैसे उभरता है।

यह भी पढ़ें | मैंने चैटजीपीटी और जेमिनी से पूछा कि क्या मुझे ₹7-9 एलपीए वेतन पर आईफोन 17 प्रो मैक्स खरीदना चाहिए

साइबर सुरक्षा सुरक्षा:

अपने नए मॉडल में सुधार के कारण, ओपनएआई का कहना है कि उसने उच्च जोखिम वाली गतिविधि, संवेदनशील साइबर अनुरोधों और बार-बार दुरुपयोग के लिए अतिरिक्त सुरक्षा के आसपास सख्त नियंत्रण तैयार किया है।

ओपनएआई ने कहा, “जीपीटी-5.5 के साथ, हम यह सुनिश्चित कर रहे हैं कि डेवलपर्स अपने कोड को आसानी से सुरक्षित कर सकें, जबकि साइबर वर्कफ़्लो के आसपास मजबूत नियंत्रण रख सकें, जिससे दुर्भावनापूर्ण अभिनेताओं द्वारा नुकसान पहुंचाने की सबसे अधिक संभावना है।”

विशेष रूप से, ओपनएआई के मुख्य प्रतिद्वंद्वी एंथ्रोपिक ने हाल ही में इसका अनावरण करने से इनकार कर दिया था पौराणिक कथाएं उन्नत साइबर सुरक्षा जोखिमों के कारण एआई मॉडल।

ओपनएआई ने “साइबर के लिए विश्वसनीय पहुंच” कार्यक्रम भी लॉन्च किया है जो महत्वपूर्ण बुनियादी ढांचे का बचाव करने वाले सत्यापित संगठनों को कम प्रतिबंधों के साथ साइबर-अनुमेय मॉडल तक पहुंचने की अनुमति देता है।

कंपनी ने अपने ब्लॉग पोस्ट में लिखा, “यह सत्यापित रक्षकों की एक विस्तृत श्रृंखला को कम अनावश्यक घर्षण के साथ वैध सुरक्षा कार्य के लिए अधिक सक्षम उपकरण प्रदान करता है ताकि हम महत्वपूर्ण रक्षात्मक क्षमताओं तक पहुंच को लोकतांत्रिक बना सकें।”

बेंचमार्क (श्रेणी)	जीपीटी-5.5	जीपीटी-5.4	क्लाउड ओपस 4.7	मिथुन 3.1 प्रो
टर्मिनल-बेंच 2.0 (एजेंट कोडिंग)	82.7%	75.1%	69.4%	68.5%
SWE-बेंच प्रो (वास्तविक दुनिया कोडिंग)	58.6%	57.7%	64.3%	54.2%
विशेषज्ञ-एसडब्ल्यूई (आंतरिक कोडिंग मूल्यांकन)	73.1%	68.5%	–	–
जीडीपीवल (व्यावसायिक ज्ञान कार्य)	84.9%	83.0%	80.3%	67.3%
फाइनेंसएजेंट v1.1 (पेशेवर)	60.0%	56.0%	64.4%	59.7%
ओएसवर्ल्ड-सत्यापित (कंप्यूटर उपयोग)	78.7%	75.0%	78.0%	–
ब्राउजकॉम्प (उपकरण उपयोग)	84.4%	82.7%	79.3%	85.9%
जीनबेंच (शैक्षणिक/जीवविज्ञान)	25.0%	19.0%	–	–
बिक्सबेंच (जैव सूचना विज्ञान)	80.5%	74.0%	–	–
फ्रंटियरमैथ टियर 1-3 (शैक्षणिक गणित)	51.7%	47.6%	43.8%	36.9%
जीपीक्यूए हीरा (अकादमिक)	93.6%	92.8%	94.2%	94.3%
साइबरजिम (साइबर सुरक्षा)	81.8%	79.0%	73.1%	–
एआरसी-एजीआई-1 (अमूर्त तर्क)	95.0%	93.7%	93.5%	98.0%

GPT-5.5 का उपयोग कैसे करें?

OpenAI का कहना है कि GPT-5.5 वर्तमान में ChatGPT में प्लस, प्रो, बिजनेस और एंटरप्राइज़ उपयोगकर्ताओं के लिए उपलब्ध है। ज़ाब्ता. इस बीच, अधिक उन्नत GPT-5.5 प्रो मॉडल भी प्रो, बिजनेस और एंटरप्राइज चैटजीपीटी उपयोगकर्ताओं के लिए जारी किया जा रहा है।

कंपनी ने यह नहीं बताया कि नए मॉडल मुफ्त और गो उपयोगकर्ताओं के लिए कब आएंगे।

Source link