Site icon Taaza Time 18

डीपसेक ने अगली पीढ़ी की ओर ‘इंटरमीडिएट स्टेप’ के रूप में नए एआई मॉडल को डेब्यू किया

DEEPSEEK-CHINA-NATURE-PIX-0_1759155032393_1759155055667.JPG


चीन के दीपसेक ने एक नया एआई मॉडल लॉन्च किया है जिसे डीपसेक-वी 33.2-एक्सप कहा जाता है। नया मॉडल नई दीपसेक स्पार्स ध्यान प्रौद्योगिकी के साथ आता है, जो कंपनी का कहना है कि “लंबे समय से संदर्भ परिदृश्यों में प्रशिक्षण और निष्कर्ष दक्षता के लिए अनुकूलन का पता लगाने और मान्य करने के लिए डिज़ाइन किया गया है।”

दीपसेक का कहना है कि नया मॉडल “हमारी अगली पीढ़ी की वास्तुकला की ओर एक मध्यवर्ती कदम है।”

कंपनी ने अपने वी 3 और आर 1 मॉडल के वैश्विक रोलआउट के साथ साल में पहले सिलिकॉन वैली को चौंका दिया था, जिसने लागत के एक अंश पर निर्मित होने के दौरान ओपनई और Google के अग्रणी मॉडल की तुलना में इसी तरह का प्रदर्शन दिया।

नया दीपसेक मॉडल पुराने v3.1 मॉडल पर बनाया गया है, जो नई तकनीक का पता लगाकर और अनुकूलन करने के लिए नई तकनीक शुरू कर रहा है प्रशिक्षण और संचालन। दीपसेक का कहना है कि नए मॉडल का उद्देश्य लंबे पाठ अनुक्रमों को संसाधित करते समय अपनी बेहतर दक्षता दिखाना है।

“यह प्रयोगात्मक रिलीज हमारे चल रहे अनुसंधान को अधिक कुशल ट्रांसफार्मर आर्किटेक्चर में दर्शाता है, विशेष रूप से विस्तारित पाठ अनुक्रमों को संसाधित करते समय कम्प्यूटेशनल दक्षता में सुधार पर ध्यान केंद्रित करता है,” दीपसेक चेहरे को गले लगाने पर कहा।

एक्स (पूर्व में ट्विटर) पर एक पोस्ट में, दीपसेक ने कहा कि डीएसए लंबे संदर्भ प्रदर्शन को बढ़ावा देने और गणना को कम करते हुए “आउटपुट गुणवत्ता पर न्यूनतम प्रभाव के साथ” ठीक-ठीक होने वाले विरल ध्यान प्राप्त करता है।

कंपनी का यह भी कहना है कि यह एपीआई की कीमतों में 50%की कटौती के वैश्विक में लॉन्च करना है।

दीपसेक के नए एआई मॉडल को वैश्विक बाजारों में कभी भी जल्द ही लॉन्च होने की उम्मीद नहीं है। हालांकि, दीपसेक का एआई अभी भी अलीबाबा के क्यूवेन जैसे अपने चीनी प्रतिद्वंद्वियों पर दबाव डाल सकता है।

अलीबाबा ने भी क्यूवेन को एक बड़ा उन्नयन भी दिया था Qwen 3 मैक्स मॉडल, जिसने Lmarena के बेंचमार्क पर Openai के GPT-5 चैट को हराया।



Source link

Exit mobile version