Site icon Taaza Time 18

कर्सर ने सस्ती टोकन लागत पर लंबे समय तक चलने वाले एआई कोडिंग कार्यों के लिए कंपोजर 2.5 मॉडल लॉन्च किया | प्रौद्योगिकी समाचार

Tech-featured-image236.jpg


एआई कोडिंग स्टार्टअप कर्सर ने कंपोजर 2.5 नामक एक नया मॉडल लॉन्च किया है जिसे विशेष रूप से लंबे समय तक चलने वाले कोडिंग कार्यों के लिए प्रशिक्षित किया गया है।

कर्सर ने सोमवार, 18 मई को एक ब्लॉग पोस्ट में कहा, कंपोजर 2.5 संचार शैली और प्रयास अंशांकन जैसे अन्य व्यवहारिक सुधारों के अलावा जटिल निर्देशों का भी अधिक विश्वसनीय रूप से पालन करता है। कंपनी के अनुसार, कंपोजर 2.5 में सुधार स्केलिंग प्रशिक्षण, अधिक जटिल आरएल वातावरण तैयार करने और नई शिक्षण विधियों को पेश करने से आए हैं।

कंपोजर 2.5 की शुरुआत कर्सर के कंपोजर 2 मॉडल के कुछ महीनों बाद हुई, जिसके बाद कुछ प्रतिक्रिया हुई जब उपयोगकर्ताओं ने पाया कि यह मॉडल किमी 2.5 का एक आरएल-संशोधित संस्करण था, जो हाल ही में मूनशॉट एआई द्वारा जारी किया गया एक ओपन-वेट एआई मॉडल है, जो अलीबाबा और होंगशान (पूर्व में सिकोइया चीन) द्वारा समर्थित एक चीनी एआई स्टार्टअप है।

यह स्वीकार करते हुए कि कंपोज़र 2 किमी 2.5 के शीर्ष पर बनाया गया था, कर्सर के डेवलपर शिक्षा के उपाध्यक्ष ली रॉबिन्सन ने कहा, “हां, कंपोज़र 2 एक ओपन-सोर्स बेस से शुरू हुआ था!” उन्होंने कहा, “अंतिम मॉडल पर खर्च की गई गणना का केवल ~1/4 हिस्सा बेस से आया है, बाकी हमारे प्रशिक्षण से है।”

कर्सर के सह-संस्थापक अमन सेंगर ने कहा, “हमारे ब्लॉग में शुरू से ही किमी बेस का उल्लेख न करना एक गलती थी। हम इसे अगले मॉडल के लिए ठीक कर देंगे।”

निश्चित रूप से, नवीनतम 2.5 वेरिएंट भी कंपोजर 2 के समान ओपन-सोर्स चेकपॉइंट (किमी K2.5) पर बनाया गया है। स्क्रैच से अपने कोडिंग मॉडल को विकसित नहीं करने के अलावा, चीनी मॉडल बेस पर निर्भर कर्सर संभावित रूप से वैश्विक एआई हथियारों की दौड़ के बीच चिंताओं को बढ़ा सकता है जिसे अक्सर संयुक्त राज्य अमेरिका और चीन के बीच अस्तित्व की लड़ाई के रूप में माना जाता है।

पिछले साल, यूएस-आधारित स्टार्टअप ने $29.3 बिलियन के मूल्यांकन पर $2.3 बिलियन का राउंड जुटाया था, और कथित तौर पर वार्षिक राजस्व में $2 बिलियन से अधिक है। अप्रैल में, एलोन मस्क के स्वामित्व वाली स्पेसएक्स, जो अब एक्सएआई की मूल कंपनी भी है, ने इस साल के अंत में 60 बिलियन डॉलर में कर्सर का अधिग्रहण करने की योजना की घोषणा की।

कर्सर ने सोमवार को कहा कि यह पहले से ही है स्पेसएक्सएआई के साथ काम करना (स्पेसएक्स का नया एआई डिवीजन) कोलोसस 2 सुपरकंप्यूटर बनाने वाले लाखों एच100-समतुल्य जीपीयू क्लस्टर से 10 गुना अधिक कुल गणना का उपयोग करके स्क्रैच से “काफी बड़े मॉडल” को प्रशिक्षित करने के लिए।

इस विज्ञापन के नीचे कहानी जारी है

हुड के नीचे

इस बीच, कर्सर ने कहा कि उसने कंपोज़र 2.5 के प्रशिक्षण स्टैक में कई नए बदलाव किए हैं जो मॉडल इंटेलिजेंस और प्रयोज्य में सुधार पर केंद्रित हैं। शुरुआत के लिए, कंपोज़र 2.5 को सुदृढीकरण सीखने (आरएल) के दौरान लक्षित पाठ्य प्रतिक्रिया के साथ प्रशिक्षित किया गया था, जिससे उन्हें प्रक्षेपवक्र में उस बिंदु पर मॉडल को सीधे प्रतिक्रिया प्रदान करने की अनुमति मिली जहां मॉडल बेहतर व्यवहार कर सकता था।

कर्सर ने कहा, “लक्ष्य मॉडल संदेश के लिए, हम वांछित सुधार का वर्णन करने वाला एक संक्षिप्त संकेत बनाते हैं, उस संकेत को स्थानीय संदर्भ में डालते हैं, और परिणामी मॉडल वितरण का उपयोग शिक्षक के रूप में करते हैं।” इसमें कहा गया है, “यह हमें उस व्यवहार के लिए एक स्थानीय प्रशिक्षण संकेत देता है जिसे हम बदलना चाहते हैं, जबकि पूर्ण प्रक्षेपवक्र पर व्यापक आरएल उद्देश्य को बरकरार रखते हुए।”

उदाहरण के लिए, जब कंपोज़र 2.5 किसी ऐसे टूल को कॉल करने का प्रयास करता है जो लंबे रोलआउट के दौरान उपलब्ध नहीं है, तो उसे गलती पर टेक्स्ट फीडबैक प्राप्त होगा जहां समस्याग्रस्त मोड़ के संदर्भ में “रिमाइंडर: उपलब्ध टूल…” जैसा संकेत डाला गया है।

कंपोज़र 2.5 को अपने पूर्ववर्ती की तुलना में 25 गुना अधिक सिंथेटिक डेटा (मुश्किल कोडिंग कार्यों के रूप में) पर प्रशिक्षित किया गया है। हालाँकि, कर्सर ने चेतावनी दी कि सिंथेटिक कार्यों पर प्रशिक्षण के परिणामस्वरूप नवीनतम मॉडल हैकिंग को पुरस्कृत करने के लिए अधिक संवेदनशील है। “हम एजेंटिक निगरानी उपकरणों का उपयोग करके इन समस्याओं को ढूंढने और उनका निदान करने में सक्षम थे, लेकिन वे बड़े पैमाने पर आरएल के लिए आवश्यक बढ़ती देखभाल को प्रदर्शित करते हैं,” यह कहा।

इस विज्ञापन के नीचे कहानी जारी है

बेंचमार्क पर प्रदर्शन

SWE-बेंच मल्टीलिंगुअल (79.8 प्रतिशत) और कर्सरबेंच v3.1 (63.2 प्रतिशत) जैसे बेंचमार्क परीक्षणों पर मूल्यांकन किए जाने पर कंपोजर 2.5 एंथ्रोपिक के ओपस 4.7 और ओपनएआई के जीपीटी-5.5 जैसे अग्रणी एआई मॉडल से मेल खाता है।

हालाँकि, कंपोज़र 2.5 प्रति कार्य के लिए उपयोग करने के लिए बहुत सस्ता है क्योंकि इसकी कीमत $0.50 प्रति मिलियन इनपुट टोकन और $2.50 प्रति मिलियन आउटपुट टोकन है, जो एंथ्रोपिक और ओपनएआई द्वारा वर्तमान में लिए जाने वाले शुल्क का एक अंश है।

$3.00 प्रति मिलियन इनपुट और $15.00 प्रति मिलियन आउटपुट टोकन पर समान बुद्धिमत्ता वाला एक तेज़ संस्करण भी है। कंपोज़र 2.5 में पहले सप्ताह के लिए दोहरा उपयोग शामिल है।





Source link

Exit mobile version