Google ने एक व्यापक गाइड जारी किया है जिसमें बताया गया है कि कैसे निर्माता और डेवलपर्स कंपनी के अगली पीढ़ी के दृश्य और परिसंपत्ति उत्पादन मॉडल नैनो-बनाना प्रो से अधिकतम लाभ उठा सकते हैं। शनिवार को आधिकारिक Google AI स्टूडियो अकाउंट द्वारा एक्स पर पोस्ट किया गया गाइड, Google DeepMind के जेमिनी डेवलपर एडवोकेट गिलाउम वर्नाडे द्वारा लिखा गया था।
इसमें दस प्रमुख अनुभागों की रूपरेखा दी गई है, जिसमें प्रेरक तकनीक, संपादन वर्कफ़्लो और उन्नत रचनात्मक क्षमताओं को शामिल किया गया है।
नैनो बनाना प्रो के लिए संपूर्ण मार्गदर्शिका
गूगल स्थिति नैनो-केला प्रो पहले के छवि मॉडलों से एक महत्वपूर्ण छलांग के रूप में। यह विस्तृत पाठ प्रतिपादन, सटीक चरित्र स्थिरता, उन्नत दृश्य तर्क, वास्तविक समय की Google खोज जानकारी के साथ ग्राउंडिंग और 4K तक के उच्च-रिज़ॉल्यूशन आउटपुट का समर्थन करता है।
कंपनी का कहना है कि मॉडल कीवर्ड मिलान पर निर्भर होने के बजाय कलात्मक इरादे और संरचना को समझता है। इसे प्रदर्शित करने के लिए, Google इस बात पर जोर देता है कि उपयोगकर्ताओं को खंडित वर्णनकर्ताओं पर भरोसा करने के बजाय इसे एक मानव कलाकार की तरह प्रेरित करना चाहिए।
व्यावसायिक संपत्ति उत्पादन के लिए Google की 10 युक्तियाँ
सुनहरे नियम: स्पष्ट ब्रीफिंग और संवादात्मक संपादन
गाइड उपयोगकर्ताओं से पूर्ण वर्णनात्मक वाक्यों को अपनाने और केवल छोटे सुधारों की आवश्यकता होने पर दोबारा शुरू करने से बचने का आग्रह करता है।
गाइड से संपादन निर्देश का उदाहरण:
“यह बहुत अच्छा है, लेकिन रोशनी को सूर्यास्त के समय में बदल दें और टेक्स्ट को नीयन नीला कर दें।”
विस्तृत दृश्य विवरण का उदाहरण:
“एक भविष्य की स्पोर्ट्स कार का सिनेमाई वाइड शॉट, जो रात में टोक्यो की बरसाती सड़क से तेजी से गुजरती है। नीयन संकेत गीले फुटपाथ और कार की धातु चेसिस से प्रतिबिंबित होते हैं।”
गूगल विषयों, बनावट और संदर्भ को परिभाषित करने की भी सिफारिश करता है। उदाहरण के लिए, एक कुकबुक संक्षिप्त प्रकाश व्यवस्था और स्टाइलिंग निर्णयों को प्रभावित कर सकती है।
पाठ प्रतिपादन, आरेख और दृश्य संश्लेषण
नैनो-केला प्रो दस्तावेज़ों को ग्रहण कर सकता है और सघन जानकारी को साफ़ दृश्यों में बदल सकता है।
गाइड में शामिल उदाहरण संकेत:
कमाई इन्फोग्राफिक:
“इस कमाई रिपोर्ट से प्रमुख वित्तीय विशेषताओं का सारांश देते हुए एक स्वच्छ, आधुनिक इन्फोग्राफिक तैयार करें। ‘राजस्व वृद्धि’ और ‘शुद्ध आय’ के लिए चार्ट शामिल करें, और एक स्टाइलिश पुल-कोट बॉक्स में सीईओ के मुख्य उद्धरण को हाइलाइट करें।”
रेट्रो डिज़ाइन:
“अमेरिकी भोजनालय के इतिहास के बारे में एक रेट्रो, 1950 के दशक की शैली का इन्फोग्राफिक बनाएं। ‘द फूड’, ‘द ज्यूकबॉक्स’ और ‘द डेकोर’ के लिए अलग-अलग अनुभाग शामिल करें। सुनिश्चित करें कि सभी पाठ सुपाठ्य हैं और अवधि से मेल खाने के लिए शैलीबद्ध हैं।”
तकनीकी खाका:
“एक ऑर्थोग्राफ़िक ब्लूप्रिंट बनाएं जो योजना, ऊंचाई और अनुभाग में इस इमारत का वर्णन करता है। तकनीकी वास्तुशिल्प फ़ॉन्ट में ‘उत्तर ऊंचाई’ और ‘मुख्य प्रवेश द्वार’ को स्पष्ट रूप से लेबल करें। प्रारूप 16:9।”
व्हाइटबोर्ड शिक्षण सहायता:
“विश्वविद्यालय व्याख्यान के लिए उपयुक्त हाथ से तैयार व्हाइटबोर्ड आरेख के रूप में ‘ट्रांसफॉर्मर न्यूरल नेटवर्क आर्किटेक्चर’ की अवधारणा को संक्षेप में प्रस्तुत करें। एनकोडर और डिकोडर ब्लॉक के लिए अलग-अलग रंगीन मार्करों का उपयोग करें, और ‘सेल्फ-अटेंशन’ और ‘फीड फॉरवर्ड’ के लिए सुपाठ्य लेबल शामिल करें।”
थंबनेल और कहानी कहने के लिए मजबूत चरित्र संगति
नमूना पहचान लॉक करने के लिए अधिकतम 14 संदर्भ छवियों की अनुमति देता है। यह श्रृंखला, थंबनेल या विज्ञापन अभियान बनाने वाले रचनाकारों का समर्थन करता है।
Google से उदाहरण संकेत:
वायरल थंबनेल:
“छवि 1 से व्यक्ति का उपयोग करके एक वायरल वीडियो थंबनेल डिज़ाइन करें। चेहरे की संगति: व्यक्ति के चेहरे की विशेषताओं को बिल्कुल छवि 1 के समान रखें, लेकिन उत्साहित और आश्चर्यचकित दिखने के लिए उनकी अभिव्यक्ति को बदलें। क्रिया: व्यक्ति को बाईं ओर रखें, उनकी उंगली को फ्रेम के दाईं ओर इंगित करें। विषय: दाईं ओर, स्वादिष्ट एवोकैडो टोस्ट की एक उच्च गुणवत्ता वाली छवि रखें। ग्राफिक्स: व्यक्ति की उंगली को टोस्ट से जोड़ने वाला एक बोल्ड पीला तीर जोड़ें। टेक्स्ट: ओवरले बीच में विशाल, पॉप-शैली का पाठ: ‘3分钟搞定!’ (3 मिनट में हो गया!) पृष्ठभूमि: एक धुंधली, चमकदार रसोई पृष्ठभूमि। उच्च संतृप्ति और कंट्रास्ट।”
समूह कहानी सुनाना:
“उष्णकटिबंधीय छुट्टियों पर जा रहे इन 3 शराबी दोस्तों के साथ एक मजेदार 10-भाग वाली कहानी बनाएं। कहानी भावनात्मक उतार-चढ़ाव के साथ रोमांचकारी है और एक सुखद क्षण में समाप्त होती है। सभी 3 पात्रों के लिए पोशाक और पहचान को एक समान रखें, लेकिन उनकी अभिव्यक्ति और कोण सभी 10 छवियों में अलग-अलग होने चाहिए।”
मतिभ्रम को कम करने के लिए खोज-आधारित ग्राउंडिंग
मॉडल वास्तविक समय की खोज जानकारी से वर्तमान डेटा में निहित दृश्य बना सकता है।
उदाहरण संकेत:
“एक उत्पन्न करें इंफ़ोग्राफ़िक वर्तमान यात्रा रुझानों के आधार पर 2025 में अमेरिकी राष्ट्रीय उद्यानों की यात्रा के लिए सर्वोत्तम समय।”
उन्नत संपादन, पुनर्स्थापन और रंगीकरण
उपयोगकर्ता वस्तुओं को हटा सकते हैं, पुरानी तस्वीरों को पुनर्स्थापित कर सकते हैं, मंगा पैनल को रंगीन कर सकते हैं या दृश्यों को नई सांस्कृतिक सेटिंग्स के अनुसार अनुकूलित कर सकते हैं।
वस्तु हटाना:
“पर्यटकों को इस तस्वीर की पृष्ठभूमि से हटा दें और उस स्थान को तार्किक बनावट (कोबलस्टोन और स्टोरफ्रंट) से भरें जो आसपास के वातावरण से मेल खाते हों।”
मंगा रंगीकरण:
“इस मंगा पैनल को रंगीन करें। एक जीवंत एनीमे शैली पैलेट का उपयोग करें। सुनिश्चित करें कि ऊर्जा किरणों पर प्रकाश प्रभाव नीयन नीले रंग में चमक रहा है और चरित्र का पहनावा उनके आधिकारिक रंगों के अनुरूप है।”
स्थानीयकरण:
“इस अवधारणा को लें और इसे टोक्यो सेटिंग में स्थानीयकृत करें, जिसमें टैगलाइन का जापानी में अनुवाद भी शामिल है। रात में पृष्ठभूमि को हलचल भरी शिबुया सड़क पर बदलें।”
ऋतु परिवर्तन:
“इस दृश्य को सर्दियों के समय में बदल दें। घर की वास्तुकला बिल्कुल वैसी ही रखें, लेकिन छत और आँगन में बर्फ डालें, और रोशनी को ठंडी, बादल भरी दोपहर में बदल दें।”
2डी रेखाचित्रों और 3डी वातावरणों के बीच रूपांतरण
नैनो-केला प्रो फर्श योजनाओं और रेखाचित्रों को फोटोयथार्थवादी 3डी दृश्यों में अनुवादित कर सकता है।
आंतरिक बोर्ड:
“अपलोड किए गए 2डी फ्लोर प्लान के आधार पर, एक ही छवि में एक पेशेवर इंटीरियर डिजाइन प्रेजेंटेशन बोर्ड तैयार करें। लेआउट: शीर्ष पर एक बड़ी मुख्य छवि और नीचे तीन छोटी छवियों के साथ एक कोलाज। शैली: गर्म ओक लकड़ी के फर्श और ऑफ-व्हाइट दीवारों के साथ आधुनिक न्यूनतम।”
3डी मेम मनोरंजन:
“‘दिस इज़ फाइन’ डॉग मीम को एक फोटोरियलिस्टिक 3डी रेंडर में बदलें। रचना को समान रखें लेकिन कुत्ते को एक आलीशान खिलौने की तरह बनाएं और आग को यथार्थवादी लपटों की तरह बनाएं।”
उच्च-रिज़ॉल्यूशन आउटपुट और बनावट निर्माण
मॉडल 1K से 4K इमेजरी का समर्थन करता है, जो विस्तृत प्रिंट और पर्यावरणीय बनावट के लिए उपयुक्त है।
4K वन बनावट:
“काईदार जंगल के फर्श के एक लुभावने, वायुमंडलीय वातावरण को तैयार करने के लिए देशी उच्च-निष्ठा आउटपुट का उपयोग करें। जटिल प्रकाश प्रभाव और नाजुक बनावट को नियंत्रित करें, यह सुनिश्चित करते हुए कि काई और प्रकाश की किरण का हर किनारा 4K वॉलपेपर के लिए उपयुक्त पिक्सेल-परफेक्ट रिज़ॉल्यूशन में प्रस्तुत किया गया है।”
डिकंस्ट्रक्टेड बर्गर इन्फोग्राफिक:
“एक बनाने के अति-यथार्थवादी इन्फोग्राफिक एक रुचिकर चीज़बर्गर का, जिसे टोस्टेड ब्रियोच बन की बनावट, पैटी की सिकी हुई परत और पनीर के चमकदार पिघल को दिखाने के लिए विखंडित किया गया है। प्रत्येक परत को उसके स्वाद प्रोफ़ाइल के साथ लेबल करें।”
दृश्य तर्क और समस्या समाधान
नैनो-बनाना प्रो रचनाओं का विश्लेषण और परिशोधन करने के लिए एक सोच प्रक्रिया का उपयोग करता है।
गणितीय तर्क:
“एक सफेद बोर्ड पर C में log_{x^2+1}(x^4-1)=2 को हल करें। चरणों को स्पष्ट रूप से दिखाएं।”
निर्माण दृश्य:
“कमरे की इस छवि का विश्लेषण करें और एक ‘पहले’ छवि बनाएं जो दिखाती है कि निर्माण के दौरान कमरा कैसा दिखता होगा, जिसमें फ़्रेमिंग और अधूरा ड्राईवॉल दिखाया गया है।”
स्टोरीबोर्डिंग और सिनेमाई अवधारणा कला
निर्माता सुसंगत पहचान और शैली के साथ सामंजस्यपूर्ण बहु-छवि कहानियां तैयार कर सकते हैं।
उदाहरण संकेत:
“एक महिला और पुरुष की 9 छवियों के साथ एक व्यसनकारी दिलचस्प 9-भाग वाली कहानी बनाएं पुरस्कार विजेता लक्जरी सामान विज्ञापन। कहानी में भावनात्मक उतार-चढ़ाव होना चाहिए, जो लोगो के साथ महिला के एक सुंदर शॉट पर समाप्त हो।”
डिजाइनरों और डेवलपर्स के लिए लेआउट नियंत्रण
मॉडल स्केच, वायरफ्रेम, ग्रिड और स्प्राइट लेआउट का सटीक रूप से पालन कर सकता है।
विज्ञापन के लिए स्केच:
“ए के लिए एक विज्ञापन बनाएं [product] इस रेखाचित्र का अनुसरण करते हुए।”
यूआई मॉक-अप:
“ए के लिए एक मॉक-अप बनाएं [product] इन दिशानिर्देशों का पालन करें।”
पिक्सेल कला:
“एक यूनिकॉर्न का एक पिक्सेल आर्ट स्प्राइट बनाएं जो इस 64×64 ग्रिड छवि में पूरी तरह से फिट हो। उच्च कंट्रास्ट रंगों का उपयोग करें।”
स्प्राइट शीट:
“ड्रोन पर बैकफ्लिप कर रही एक महिला की स्प्राइट शीट, 3×3 ग्रिड, अनुक्रम, फ्रेम दर फ्रेम एनीमेशन, वर्ग पहलू अनुपात। संलग्न संदर्भ छवि की संरचना का सटीक रूप से पालन करें।”