जीटीपी 5.2 बनाम जेमिनी 3: कैसे दोनों एआई प्लेटफॉर्म एक-दूसरे के खिलाफ खड़े हैं

Vikas Halpati

8 months ago

FILES-GERMANY-COURT-AI-US-MUSIC-TECHNOLOGY-0_17633_1765528529378_1765528529719.jpg

ओपनएआई ने गुरुवार को जीपीटी 5.2 का अनावरण किया, जिसे यह पेशेवर और उद्यम उपयोग के लिए अब तक की सबसे उन्नत मॉडल श्रृंखला के रूप में वर्णित करता है। यह अपग्रेड कंपनी के लिए एक महत्वपूर्ण क्षण में आया है, जो कृत्रिम बुद्धिमत्ता क्षेत्र में बढ़ती प्रतिस्पर्धा, विशेष रूप से Google के नए लॉन्च किए गए जेमिनी 3 से दबाव में है।

पेशेवर कार्यों पर बेहतर प्रदर्शन?

के अनुसार ओपनएआई, GPT 5.2 स्प्रेडशीट निर्माण, प्रेजेंटेशन निर्माण, कोडिंग, लंबे संदर्भ की समझ और टूल उपयोग जैसे क्षेत्रों में महत्वपूर्ण सुधार प्रदान करता है। कंपनी ने कहा कि उसके एंटरप्राइज ग्राहक पहले ही रिपोर्ट कर चुके हैं कि एआई उनके प्रतिदिन 40 से 60 मिनट बचाता है, जबकि भारी उपयोगकर्ता सप्ताह में दस घंटे से अधिक का दावा करते हैं। GPT 5.2 को सामान्य व्यावसायिक वर्कफ़्लो में सटीकता और आउटपुट गुणवत्ता को बढ़ाकर इस मूल्य को बढ़ाने के लिए डिज़ाइन किया गया है।

सैम अल्टमैन के नेतृत्व वाला मंच अपने ब्लॉग पोस्ट में लिखा है कि जीडीपीवल मूल्यांकन पर, जो 44 व्यवसायों में अच्छी तरह से परिभाषित ज्ञान कार्य कार्यों का परीक्षण करता है, जीपीटी 5.2 थिंकिंग ने एक नया उच्च स्कोर हासिल किया और 70% से अधिक तुलनाओं में मानव विशेषज्ञ प्रदर्शन को पूरा करने या उससे अधिक करने के लिए आंका गया। ओपनएआई का कहना है कि मॉडल ऐतिहासिक बेंचमार्क के आधार पर ग्यारह गुना से अधिक गति और पेशेवर श्रम की लागत के 1% से भी कम पर परिणाम देता है।

शुरुआती परीक्षकों ने नए मॉडल द्वारा निर्मित स्प्रेडशीट और स्लाइड डेक में फ़ॉर्मेटिंग, डिज़ाइन परिष्कार और संरचनात्मक सुसंगतता में उल्लेखनीय लाभ की सूचना दी।

यह भी पढ़ें | सैम ऑल्टमैन के ‘कोड रेड’ के बाद OpenAI ने GPT-5.2 जारी किया—नया क्या है?

कोडिंग और डिबगिंग में प्रमुख लाभ

एआई कंपनी नोट करती है कि जीपीटी 5.2 थिंकिंग एसडब्ल्यूई बेंच प्रो पर एक नया बेंचमार्क सेट करती है, एक कार्यभार जो चार प्रोग्रामिंग भाषाओं में वास्तविक दुनिया की सॉफ्टवेयर इंजीनियरिंग क्षमताओं को मापता है। ओपनएआई ने इस अधिक चुनौतीपूर्ण मूल्यांकन पर 55.6% स्कोर के साथ-साथ पायथन-केंद्रित मूल्यांकन पर 80% स्कोर की रिपोर्ट दी है। SWE बेंच सत्यापित परीक्षण.

कंपनी का कहना है कि रोजमर्रा की विकास सेटिंग्स में मॉडल अधिक विश्वसनीय रूप से बग की पहचान कर सकता है, फीचर अनुरोधों को लागू कर सकता है और बड़े कोडबेस को रिफैक्टर कर सकता है, जिससे मैन्युअल हस्तक्षेप की आवश्यकता कम हो जाती है। परीक्षकों ने फ्रंट-एंड विकास में भी सुधार पाया, विशेष रूप से त्रि-आयामी तत्वों से जुड़े जटिल या अपरंपरागत इंटरफेस में।

तथ्यात्मक सटीकता और लंबे संदर्भ तर्क में सुधार?

ओपनएआई ने जीपीटी 5.1 थिंकिंग की तुलना में मतिभ्रम में सार्थक गिरावट दर्ज की है। अज्ञात के एक सेट में चैटजीपीटी प्रश्नत्रुटियों वाली प्रतिक्रियाएँ 30% कम आम थीं। इसका उद्देश्य लेखन, अनुसंधान और विश्लेषणात्मक कार्यों के लिए मॉडल को अधिक भरोसेमंद बनाना है।

लंबे संदर्भ वाला प्रदर्शन भी एक बड़ा कदम है। जीपीटी 5.2 थिंकिंग ने 256,000 टोकन की संदर्भ विंडो पर चार-सुई एमआरसीआर मूल्यांकन संस्करण पर लगभग पूर्ण सटीकता हासिल की। यह मॉडल को सुसंगतता खोए बिना कानूनी अनुबंधों, शोध पत्रों और बहु-फ़ाइल परियोजनाओं जैसे अत्यधिक लंबे दस्तावेज़ों से जानकारी का विश्लेषण और संश्लेषण करने की अनुमति देता है।

यह भी पढ़ें | डिज़्नी ओपनएआई के सोरा एआई वीडियो में प्रतिष्ठित चरित्र लाता है: क्या प्रतिबंधित है

चैटजीपीटी और एपीआई उपयोगकर्ताओं के लिए रोलआउट

जीपीटी 5.2 इंस्टेंट, सोच और प्रो संस्करणगुरुवार को प्लस, प्रो, बिजनेस और एंटरप्राइज ग्राहकों सहित चैटजीपीटी ग्राहकों को भुगतान करना शुरू हो गया। डेवलपर्स के लिए एपीआई एक्सेस तुरंत उपलब्ध है। भारत के मुफ्त चैटजीपीटी गो टियर पर उपयोगकर्ताओं को अभी तक अपडेट नहीं मिला है।

जीपीटी 5.2 बनाम जेमिनी 3

यह रिलीज़ एक लीक आंतरिक ज्ञापन के तुरंत बाद हुई है जिसमें ओपनएआई के मुख्य कार्यकारी सैम ऑल्टमैन ने कथित तौर पर कर्मचारियों को “कोड रेड” परिदृश्य के बारे में चेतावनी दी थी। Google का जेमिनी 3 कई बेंचमार्क श्रेणियों और एलएमएरेना जैसे लीडरबोर्ड पर आगे बढ़ गया है, जहां विभिन्न संस्करण टेक्स्ट, विज़न, छवि निर्माण और खोज रैंकिंग में शीर्ष स्थान पर हैं।

प्रारंभिक LMArena परिणाम वेब विकास कार्यों के लिए GPT 5.2 हाई को दूसरे स्थान पर रखते हैं, क्लाउड ओपस 4.5 के बाद, चौथे स्थान पर जेमिनी 3 प्रो के साथ। GPT 5.2 अभी तक प्लेटफ़ॉर्म के व्यापक लीडरबोर्ड पर सूचीबद्ध नहीं है।

प्रारंभिक LMArena परिणाम वेब विकास कार्यों के लिए GPT 5.2 हाई को दूसरे स्थान पर रखते हैं, क्लाउड ओपस 4.5 के बाद, चौथे स्थान पर जेमिनी 3 प्रो के साथ।

(एआई-जनरेटेड ग्राफ़िक)

दोनों कंपनियों द्वारा प्रकाशित बेंचमार्क तुलनाएँ मिश्रित तस्वीर दिखाती हैं। OpenAI की रिपोर्ट है कि GPT 5.2 बिना टूल के GPQA डायमंड और AIME 2025 पर जेमिनी 3 से बेहतर प्रदर्शन करता है, जबकि Google MMMLU और कुछ रीज़निंग कार्यों जैसे मल्टीमॉडल बेंचमार्क पर उच्च स्कोर की रिपोर्ट करता है। स्केलएआई जैसे समूहों के स्वतंत्र परीक्षण ने अभी तक जीपीटी 5.2 को शामिल नहीं किया है।

सुविधाएँ और मूल्य निर्धारण

दोनों मॉडल व्यापक पारिस्थितिकी तंत्र का हिस्सा हैं। जेमिनी 3 को Google AI मोड, Google ऐप्स और NotebookLM सहित Google के उत्पाद सुइट में गहन एकीकरण से लाभ मिलता है। इसके विपरीत, OpenAI उपयोगकर्ताओं को AI वीडियो निर्माण के लिए सोरा ऐप तक अलग पहुंच की आवश्यकता होती है, हालांकि छवि निर्माण ChatGPT के भीतर उपलब्ध है।

कीमत समान रहती है. ओपनएआई की चैटजीपीटी प्लस सदस्यता की कीमत $20 प्रति माह है, प्रो स्तर की कीमत $200 प्रति माह है। Google, Google AI Pro के लिए समान शुल्क लेता है, जबकि इसके AI अल्ट्रा प्लान की लागत $249.99 प्रति माह है और इसमें क्लाउड स्टोरेज लाभ शामिल हैं।

Source link