चीनी एआई स्टार्टअप डीपसीक ने आधिकारिक तौर पर अपने बहुप्रतीक्षित डीपसीक-वी4 मॉडल का पूर्वावलोकन संस्करण जारी किया है। डीपसीक का बहुप्रतीक्षित अपडेट पिछले साल इसके आर1 और वी3 मॉडल के वायरल होने और एआई दौड़ में अमेरिकी वर्चस्व की सभी धारणाओं को तोड़ने के एक साल से अधिक समय बाद आया है।
से नवीनतम मॉडल डीपसीक महत्वपूर्ण वास्तुशिल्प उन्नयन, एकाधिक तर्क मोड और एक विशाल दस लाख-टोकन संदर्भ विंडो के साथ आता है।
डीपसीक का नया एआई मॉडल:
मॉडलों की नई डीपसीक-वी4 श्रृंखला को प्रो और फ्लैश मॉडल में विभाजित किया गया है। फ्लैगशिप डीपसीक-वी4-प्रो में कुल 1.6 ट्रिलियन पैरामीटर हैं, जबकि वी4-फ्लैश 284 बिलियन पैरामीटर वाला एक छोटा मॉडल है।
दोनों मॉडल दस लाख टोकन (लगभग 750,000 शब्द) की अति-लंबी संदर्भ लंबाई का समर्थन करते हैं।
नए डीपसीक-वी4 मॉडल तीन रीजनिंग मोड में आते हैं: नॉन-थिंक, थिंक हाई और थिंक मैक्स। डीपसीक का कहना है कि नॉन-थिंक मोड का उद्देश्य दैनिक कार्यों और कम जोखिम वाले निर्णय लेना है, जबकि थिंक हाई उन प्रश्नों के लिए है जिनके लिए जटिल समस्या-समाधान और योजना की आवश्यकता होती है। इस बीच, थिंक मैक्स सबसे कठिन कोडिंग और गणित समस्याओं से निपटने के लिए है।
मॉडल के लिए हगिंग फेस पेज पर, डीपसीक का कहना है कि वी4 प्रो मैक्स और वी4 प्रो ”ओपन-सोर्स मॉडल की ज्ञान क्षमताओं को काफी आगे बढ़ाते हैं, मजबूती से स्थापित करते हैं [them] आज उपलब्ध सर्वोत्तम ओपन-सोर्स मॉडल के रूप में।” इसमें कहा गया है कि मॉडल कोडिंग बेंचमार्क में शीर्ष स्तरीय प्रदर्शन हासिल करता है और तर्क और एजेंटिक कार्यों पर अग्रणी बंद-स्रोत मॉडल के साथ अंतर को पाटता है।
डीपसीक बनाम चैटजीपीटी बनाम जेमिनी बनाम क्लाउड:
डीपसीक ने ओपनएआई जैसे प्रतिद्वंद्वियों के मौजूदा मॉडलों के मुकाबले अपने नए मॉडल के लिए बेंचमार्क डेटा का भी खुलासा किया जीपीटी-5.4एंथ्रोपिक का क्लाउड ओपस 4.6और Google का मिथुन 3.1 प्रो.
डीपसीक-वी4-प्रो-मैक्स कोडिंग और गणितीय प्रदर्शन में अग्रणी है, जो 90.2% स्कोर के साथ उच्च-कठिनाई तर्क और समस्या-समाधान पर केंद्रित बेंचमार्क एपेक्स शॉर्टलिस्ट में शीर्ष पर है। यह 3206 की कोडफोर्स रेटिंग भी प्राप्त करता है, जो मजबूत वास्तविक दुनिया की प्रतिस्पर्धी प्रोग्रामिंग क्षमता को दर्शाता है, और एसडब्ल्यूई सत्यापित पर पहले स्थान के लिए टाई करता है, एक बेंचमार्क जो व्यावहारिक सॉफ्टवेयर इंजीनियरिंग कार्यों पर प्रदर्शन का मूल्यांकन करता है।
हालाँकि, यह मॉडल सामान्य ज्ञान और व्यापक तर्क में अपने अमेरिकी समकक्षों से पीछे है। जेमिनी 3.1 प्रो सिंपलक्यूए-वेरिफाइड पर आगे है, जो तथ्यात्मक सटीकता और प्रश्न उत्तर का परीक्षण करने के लिए डिज़ाइन किया गया एक बेंचमार्क है, जबकि जीपीटी-5.4 टर्मिनल बेंच 2.0 पर सर्वोच्च स्थान पर है, जो मापता है कि मॉडल कितने प्रभावी ढंग से टूल का उपयोग कर सकते हैं और एजेंट जैसे वातावरण में काम कर सकते हैं।
डीपसीक का कहना है कि वी4-प्रो-मैक्स लंबे इनपुट को संभालते समय अपने वी3.2 मॉडल की तुलना में लगभग 10 गुना कम मेमोरी का उपयोग करके कहीं अधिक कुशल होते हुए इन परिणामों को प्राप्त करता है।
विशेष रूप से, डीपसीक का नया मॉडल लॉन्च ओपनएआई द्वारा अपना नवीनतम जीपीटी-5.5 मॉडल लॉन्च करने के कुछ ही घंटों बाद हुआ है, जिसे कोडिंग दुनिया में क्लाउड के प्रभुत्व के लिए कंपनी के जवाब के रूप में देखा जाता है। पिछले साल की शुरुआत में डीपसीक की लोकप्रियता के कारण शेयर बाजार में ट्रिलियन डॉलर की बिकवाली हुई थी क्योंकि इसका ओपन-सोर्स एआई मॉडल अमेरिकी प्रतिद्वंद्वियों की तुलना में बहुत कम लागत पर बनाया गया था।

