OpenAI ने 17 दिसंबर को ChatGPT Images 1.5 के वैश्विक रोलआउट की घोषणा की है, जो इसकी AI इमेज जेनरेशन और संपादन क्षमताओं में एक बड़ा अपग्रेड पेश करता है। फ्लैगशिप जीपीटी इमेज 1.5 मॉडल द्वारा संचालित नया संस्करण, सीधे चैटजीपीटी के भीतर तेज, अधिक सटीक और लचीली छवि निर्माण और संपादन की पेशकश करने का दावा करता है। दिलचस्प बात यह है कि एआई मॉडल Google के जेमिनी नैनो बनाना प्रो को चुनौती देता है, जिसे अगस्त में प्रमुख अपडेट प्राप्त हुए थे। दुनिया भर के उपयोगकर्ता और डेवलपर अब चैटजीपीटी और इसके एपीआई के माध्यम से इन उन्नत विज़ुअल टूल तक पहुंच सकते हैं।
इस लेख में, हम दोनों एआई टूल के परिणामों की तुलना करते हैं, क्योंकि आउटपुट उत्पन्न करने के लिए दो समान संकेतों का उपयोग किया गया था।
सामान्य संकेतों के साथ AI प्रदर्शन की तुलना करना
अपग्रेड का परीक्षण करने के लिए, ChatGPT Images 1.5 और दोनों में दो संकेतों का उपयोग किया गया था जेमिनी नैनो बनाना प्रो.
संकेत 1 (के-पॉप आइडल परिवर्तन)
संदर्भ के रूप में विषय की प्रदान की गई छवि का उपयोग करते हुए, उन्हें अपने प्राकृतिक चेहरे की विशेषताओं, त्वचा की टोन, जातीयता और पहचान को पूरी तरह से संरक्षित करते हुए, खुद के के-पॉप आइडल-शैली संस्करण में बदल दें। समसामयिक के-पॉप कॉन्सेप्ट फोटोशूट से प्रेरित एक पॉलिश, हाई-फ़ैशन आइडल सौंदर्य के साथ विषय को स्टाइल करें, जिसमें नरम चमक और साफ हाइलाइट्स के साथ संपादकीय स्टूडियो लाइटिंग, एक निर्दोष लेकिन प्राकृतिक ओस वाली त्वचा फिनिश, और कैमरे के लिए तैयार लुक के लिए आंखों, होंठों और बालों में सूक्ष्म वृद्धि शामिल है। विषय अभिव्यंजक लेकिन नियंत्रित शारीरिक भाषा के साथ आत्मविश्वास से पेश आता है, जिसे आधुनिक के-पॉप रुझानों जैसे उन्नत स्ट्रीटवियर, Y2K लहजे, ठाठ सिलाई, ग्लैम पंक, या नरम ईथर लुक से प्रभावित फैशन-फ़ॉरवर्ड आउटफिट में स्टाइल किया गया है, जो उनकी मूल कपड़ों की शैली के पूरक के लिए अनुकूलित है। माहौल एक पेशेवर आइडल फोटोशूट जैसा दिखता है, जिसमें बोल्ड रंग की पृष्ठभूमि या मूडी नाटकीय वातावरण, स्टूडियो या कॉन्सर्ट शैली की रोशनी, सिनेमाई छायाएं और परिष्कृत रंग ग्रेडिंग शामिल होती है, जिसमें वैकल्पिक स्वादिष्ट विवरण जैसे स्तरित आभूषण, बेल्ट, या स्टेटमेंट एक्सेसरीज़ को एकजुट और संयमित रखा जाता है। अंतिम छवि प्रामाणिक जैसी लगनी चाहिए के-पॉप कॉन्सेप्ट फोटो– स्पष्ट, स्टाइलिश और महत्वाकांक्षी – स्पष्ट रूप से एक ही व्यक्ति रहते हुए शानदार करिश्मा और स्टार उपस्थिति पेश करना।
दोनों एआई टूल ने असाधारण रूप से अच्छा प्रदर्शन किया। जबकि जेमिनी ने तेजी से छवियां बनाईं, चैटजीपीटी इमेजेज 1.5 ने अधिक जीवंत आउटफिट और पृष्ठभूमि तैयार की, हालांकि जेमिनी के 35-40 सेकंड की तुलना में इसे प्रस्तुत करने में लगभग 60 सेकंड लगे।
संकेत 2 (चिबी चरित्र परिवर्तन)
तत्पर: विषयों या छवि को छोटे शरीर और एक आकर्षक चबी-शैली वाले चरित्र में रूपांतरित करें वृहत आकार का सिर. यदि छवि में एक व्यक्ति या कई लोग शामिल हैं, तो उन्हें बड़ी, चमकदार आंखें, नरम गोलाकार चेहरे की विशेषताएं और एक हंसमुख अभिव्यक्ति दें, जबकि उनके पहचानने योग्य गुणों जैसे कि प्रमुख चेहरे की विशेषताओं, केश, सहायक उपकरण या विशिष्ट कपड़ों को संरक्षित करें। यदि छवि में कोई वस्तु, जानवर या दृश्य है, तो समान चबी अनुपात और सरलीकृत, सुंदर स्टाइल का उपयोग करके इसकी सबसे पहचानने योग्य विशेषताओं की पुनर्व्याख्या करें। चिकनी पेस्टल शेडिंग और सरलीकृत विवरण के साथ, समग्र रूप को छोटा और सुंदर रखें। अंतिम छवि को संग्रहणीय चबी शुभंकर की तरह उज्ज्वल, अभिव्यंजक और अनूठा रूप से आकर्षक बनाएं।
चिबी परिवर्तनों के लिए, चैटजीपीटी और जेमिनी दोनों ने उच्च-गुणवत्ता वाले परिणाम दिए, हालांकि जेमिनी ने पृष्ठभूमि तत्वों को थोड़ा बेहतर तरीके से कैप्चर किया और अधिक यथार्थवादी चिबी चेहरे और कपड़ों की विशेषताओं को प्रस्तुत किया। जेमिनी ने चैटजीपीटी (लगभग 60 सेकंड) की तुलना में छवियों को तेजी से (लगभग 40 सेकंड) पूरा किया।
निष्कर्ष
ChatGPT Images 1.5 जीवंत दृश्यों, सटीक संपादन और लचीलेपन पर जोर देते हुए AI-संचालित छवि निर्माण में एक मजबूत कदम का प्रतिनिधित्व करता है। जबकि Google का जेमिनी नैनो बनाना प्रो अभी भी तेज प्रदर्शन प्रदान करता है, ओपनएआई का अपडेट रचनात्मक नियंत्रण और आउटपुट गुणवत्ता में अपने प्रतिद्वंद्वी से आगे निकलने का एक स्पष्ट प्रयास है, खासकर विस्तृत और स्टाइल परिवर्तनों के लिए।
उन्नत छवि संपादन सुविधाएँ
ChatGPT Images 1.5 की असाधारण विशेषता छवि के केवल चयनित भागों को संपादित करने की क्षमता है, जबकि बाकी को अछूता रखा जा सकता है। उपयोगकर्ता मूल स्वरूप से समझौता किए बिना वस्तुओं को हटा या जोड़ सकते हैं, रंग बदल सकते हैं या शैलियों को समायोजित कर सकते हैं। मॉडल कई छवियों को एक सुसंगत दृश्य में संयोजित करने का भी समर्थन करता है, जिससे उपयोगकर्ताओं को जटिल रचनाओं पर रचनात्मक नियंत्रण मिलता है।
प्रमुख सुधारों में से एक निर्देश-पालन में निहित है। जब उपयोगकर्ता विस्तृत संपादन निर्देश प्रदान करते हैं, तो AI केवल वही बदलता है जो अनुरोध किया गया है, यह सुनिश्चित करते हुए: