Site icon Taaza Time 18

एंथ्रोपिक ने चैटजीपीटी और जेमिनी को टक्कर देने के लिए क्लाउड ओपस 4.5 लॉन्च किया: यहां वह है जो आपको जानना चाहिए

MICROSOFT-ANTHROPIC-AI-0_1764065478153_1764065497198.JPG


GPT-5.1 और जेमिनी 3 लॉन्च के तुरंत बाद, एंथ्रोपिक ने अपना क्लाउड ओपस 4.5 मॉडल लॉन्च किया है। एआई स्टार्टअप का दावा है कि उसका नया मॉडल कोडिंग, एजेंट और कंप्यूटर-उपयोग-संबंधी कार्यों के लिए दुनिया में सबसे अच्छा है।

यह कहाँ रैंक करता है?

क्लॉड ओपस 4.5 ने एसडब्ल्यूई-बेंच वेरिफाइड, एक वास्तविक दुनिया सॉफ्टवेयर इंजीनियरिंग बेंचमार्क पर 80.9% स्कोर हासिल किया है। विशेष रूप से, ओपस 4.5 एसडब्ल्यूई-बेंच वेरिफाइड पर 80% का आंकड़ा पार करने वाला पहला मॉडल है। इसकी तुलना में, Google का नया रिलीज़ हुआ मिथुन 3 प्रो 76.2% का स्कोर मिला, जबकि OpenAI का जीपीटी-5.1 कोडेक्स मैक्स 77.9% का स्कोर मिला.

नया मॉडल एंथ्रोपिक के 2-घंटे की समय सीमा परीक्षण में किसी भी मानव उम्मीदवार की तुलना में उच्च रैंक पर है जो संभावित प्रदर्शन इंजीनियरिंग उम्मीदवारों को दिया जाता है।

“टेक-होम टेस्ट को समय के दबाव में तकनीकी क्षमता और निर्णय का आकलन करने के लिए डिज़ाइन किया गया है। यह उम्मीदवारों के पास मौजूद अन्य महत्वपूर्ण कौशल जैसे सहयोग, संचार, या वर्षों में विकसित होने वाली प्रवृत्ति का परीक्षण नहीं करता है। लेकिन यह परिणाम – जहां एक एआई मॉडल महत्वपूर्ण तकनीकी कौशल पर मजबूत उम्मीदवारों से बेहतर प्रदर्शन करता है – यह सवाल उठाता है कि एआई एक पेशे के रूप में इंजीनियरिंग को कैसे बदल देगा।” कंपनी का कहना है.

एजेंटिक एआई क्षमताएं:

नया मॉडल, anthropic दावा है, τ2-बेंच में प्रतिद्वंद्वियों को पछाड़ देता है, एक बेंचमार्क जो वास्तविक दुनिया, मल्टी-टर्न कार्यों में एजेंटों के प्रदर्शन को मापता है। एक परिदृश्य में, मॉडल को एक परेशान ग्राहक की मदद करने वाले एयरलाइन सेवा एजेंट के रूप में कार्य करना होता है, जहां बेंचमार्क मॉडल से बुनियादी अर्थव्यवस्था बुकिंग में संशोधन से इनकार करने की अपेक्षा करता है, जहां एयरलाइन बुकिंग के उस वर्ग में बदलाव की अनुमति नहीं देती है।

कंपनी का कहना है कि ओपस 4.5 ने “समस्या को हल करने का एक व्यावहारिक (और वैध) तरीका ढूंढ लिया है: पहले केबिन को अपग्रेड करें, फिर उड़ानों को संशोधित करें।”

पिछले मॉडलों की तुलना में अधिक सुरक्षित:

एंथ्रोपिक का यह भी दावा है कि क्लाउड ओपस 4.5 इसका अब तक का “सबसे मजबूती से संरेखित मॉडल” है।

“ओपस 4.5 के साथ, हमने त्वरित इंजेक्शन हमलों के खिलाफ मजबूती में पर्याप्त प्रगति की है, जो मॉडल को हानिकारक व्यवहार में मूर्ख बनाने के लिए भ्रामक निर्देशों की तस्करी करते हैं। उद्योग में किसी भी अन्य फ्रंटियर मॉडल की तुलना में ओपस 4.5 को त्वरित इंजेक्शन के साथ धोखा देना कठिन है:” कंपनी ने अपने ब्लॉगपोस्ट में कहा।

आप क्लाउड ओपस 4.5 का उपयोग कैसे कर सकते हैं?

नया AI मॉडल उपयोग के लिए उपलब्ध है क्लाउड क्लाउड वेबसाइट के साथ, एंड्रॉइड और आईओएस पर ऐप। कंपनी डेवलपर्स के लिए भी मॉडल जारी कर रही है।



Source link

Exit mobile version