OpenAI ने ChatGPT Images 2.0 जारी किया है, जो इसके AI-संचालित छवि जनरेटर के लिए एक प्रमुख अपडेट है। नवीनतम अपडेट फिर से परिभाषित करता है कि चैटबॉट छवि अनुरोधों को कैसे संसाधित करता है, क्योंकि यह त्वरित व्याख्या से जानबूझकर निर्माण की ओर बढ़ता है।
ओपनएआई इसे ‘छवि निर्माण का नया युग’ कहता है। ओपनएआई के सीईओ सैम ऑल्टमैन और उनकी टीम ने अपडेट की घोषणा करते हुए दिखाया कि कैसे छवियां अब उत्तर की तरह अधिक व्यवहार करती हैं, जो कि उपयोगकर्ता ने जो पूछा है उसकी समझ के आधार पर केवल अनुमान पर भरोसा करने के बजाय।
कंपनी के अनुसार, ChatGPT Images 2.0 अगला कदम है – एक अत्याधुनिक मॉडल जो जटिल दृश्य कार्यों को पूरा कर सकता है और सटीक, उपयोग के लिए तैयार दृश्य उत्पन्न कर सकता है। ओपनएआई का दावा है कि नया मॉडल विस्तृत निर्देशों का पालन करने, वस्तुओं को सटीक रूप से रखने और संबंधित करने, घने पाठ को प्रस्तुत करने और कई पहलू अनुपातों को उत्पन्न करने में एक कदम बदलाव का प्रतीक है।
यह OpenAI की अब तक की सबसे उन्नत छवि निर्माण प्रणाली है, जिसे अत्यधिक विस्तृत, सटीक और संदर्भ-जागरूक दृश्य बनाने के लिए डिज़ाइन किया गया है। पहले के मॉडलों के विपरीत, जो मुख्य रूप से सौंदर्यशास्त्र पर ध्यान केंद्रित करते थे, यह संस्करण गहरी दृश्य बुद्धिमत्ता का परिचय देता है, जिससे यह सटीक पाठ, संरचित लेआउट और सुसंगत डिजाइन तत्वों के साथ छवियां उत्पन्न करने की अनुमति देता है।
ऑल्टमैन ने अपडेट की घोषणा करते हुए लाइवस्ट्रीम इवेंट में कहा, “इमेजेज 2.0 एक बड़ा कदम है – जैसे एक छलांग में जीपीटी-3 से जीपीटी-5 तक जाना। अविश्वसनीय नई छवियां बनाने, रचनात्मकता व्यक्त करने और सुंदर, जटिल दृश्य उत्पन्न करने की क्षमता काफी उल्लेखनीय है।”
मॉडल बहुभाषी पाठ प्रतिपादन का समर्थन करता है, जिससे उपयोगकर्ता बिना किसी त्रुटि के जटिल स्क्रिप्ट सहित कई भाषाओं में दृश्य बना सकते हैं। यह एक ही प्रॉम्प्ट में कई छवियां बनाने में भी सक्षम है, जिससे पत्रिका लेआउट, कॉमिक स्ट्रिप्स और डिज़ाइन मॉकअप जैसे उपयोग के मामले खुल जाते हैं।
कंपनी चैटजीपीटी इमेजेज 2.0 को प्रयोगात्मक रचनात्मकता टूल से व्यावहारिक, रोजमर्रा की उपयोगिताओं में संक्रमण के रूप में पेश कर रही है जो डिजाइन, संचार और समस्या-समाधान में सहायता कर सकती है।
इस विज्ञापन के नीचे कहानी जारी है
चैटजीपीटी इमेजेज 2.0 कैसे काम करता है?
मॉडल, अपने मूल में, छवि निर्माण को तर्क क्षमताओं के साथ जोड़ता है। कथित तौर पर, मॉडल संकेतों की अधिक गहराई से व्याख्या कर सकता है, और यह आउटपुट की योजना बना सकता है और, कुछ मामलों में, आउटपुट उत्पन्न करने से पहले ‘सोच’ भी सकता है। ChatGPT Images 2.0 की एक प्रमुख विशेषता इसका डुअल-मोड सिस्टम है, जो इंस्टेंट मोड और थिंकिंग मोड हैं। इंस्टेंट मोड बेहतर दृश्य समझ और पीढ़ी के साथ तेजी से छवि आउटपुट प्रदान करता है। दूसरी ओर, सोच मोड, जो केवल भुगतान किए गए उपयोगकर्ताओं के लिए उपलब्ध है, मॉडल को छवियों को आउटपुट करने से पहले सटीकता में सुधार करने के लिए विचार-विमर्श करने, संकेतों को परिष्कृत करने और यहां तक कि वेब खोज करने की अनुमति देता है।
कंपनी के अनुसार, यह अतिरिक्त तर्क परत मॉडल को जटिल कार्यों से निपटने की अनुमति देती है, जैसे इन्फोग्राफिक्स उत्पन्न करना, सबूतों के साथ गणित की समस्याओं को हल करना, या कॉमिक या स्टोरीबोर्ड जैसी कई छवियों में स्थिरता बनाए रखना। मुख्य विशेषताओं में से एक यह है कि मॉडल छवियों के भीतर पाठ सटीकता में सुधार करता है, जो पुरानी छवि प्रणालियों में देखी जाने वाली एक लंबे समय से चली आ रही सीमा है। मॉडल न्यूनतम त्रुटियों के साथ पूर्ण पैराग्राफ, लेबल और लेआउट तैयार करने में सक्षम है।
ChatGPT Images 2.0 की प्रमुख विशेषताओं में उच्च-रिज़ॉल्यूशन आउटपुट शामिल है क्योंकि यह विस्तृत बनावट और सूक्ष्म तत्वों के साथ 2K रिज़ॉल्यूशन तक छवियां उत्पन्न करता है; हिंदी, तमिल, तेलुगु, कन्नड़, जापानी और चीनी सहित सभी भाषाओं में सटीक टाइपोग्राफी के साथ उन्नत पाठ प्रतिपादन; बहु-छवि पीढ़ी; फोटोयथार्थवाद; लचीले प्रारूप; और एक इंटरैक्टिव वर्कफ़्लो जो उपयोगकर्ताओं को अनुवर्ती संकेतों के माध्यम से आउटपुट को परिष्कृत करने की अनुमति देता है।
चैटजीपीटी इमेजेज 2.0 का उपयोग कैसे करें
ChatGPT Images 2.0 सीधे ChatGPT के साथ-साथ API एक्सेस के माध्यम से उपलब्ध है। उपयोगकर्ता वांछित छवि, शैली और विवरण का वर्णन करते हुए एक संकेत दर्ज करके शुरुआत कर सकते हैं।
अधिक उन्नत आउटपुट के लिए, उपयोगकर्ता वैयक्तिकरण के लिए संदर्भ छवियां अपलोड कर सकते हैं। वे परिणामों को परिष्कृत करने के लिए अनुवर्ती संकेतों का भी उपयोग कर सकते हैं और जटिल कार्यों के लिए “सोच मोड” को चालू कर सकते हैं। इसके अलावा, वे फोटोरिअलिस्टिक, चित्रण या डिज़ाइन लेआउट जैसी शैलियाँ भी निर्दिष्ट कर सकते हैं।
इस विज्ञापन के नीचे कहानी जारी है
चैटजीपीटी इमेजेज 2.0 एआई-जनरेटेड विजुअल्स का उपयोग करने के तरीके में बदलाव की रूपरेखा तैयार करता है। छवि निर्माण के साथ तर्क जोड़कर, ओपनएआई मॉडल को एक ऐसी प्रणाली के रूप में स्थापित कर रहा है जो न केवल दृश्य उत्पन्न कर सकता है बल्कि उपयोगकर्ताओं को विचारों को दृष्टि से सोचने, योजना बनाने और निष्पादित करने में भी मदद कर सकता है। यह मॉडल आज से सभी के लिए उपलब्ध है चैटजीपीटी और कोडेक्स उपयोगकर्ता, थिंकिंग का उपयोग करके उन्नत आउटपुट के साथ प्लस, प्रो, बिजनेस और एंटरप्राइज उपयोगकर्ताओं के लिए उपलब्ध हैं। अंतर्निहित मॉडल, जीपीटी-इमेज-2, एपीआई में भी उपलब्ध है।