जेमिनी ओमनी फ्लैश Google पारिस्थितिकी तंत्र में मल्टीमॉडल एआई वीडियो निर्माण जोड़ता है | प्रौद्योगिकी समाचार

Vikas Halpati

2 months ago

4 मिनट पढ़ेंअपडेट किया गया: 20 मई, 2026 06:11 अपराह्न IST

Google ने जेमिनी ओमनी का अनावरण किया है, जो एक नया मल्टीमॉडल AI मॉडल है जिसे टेक्स्ट, छवियों, ऑडियो और वीडियो संकेतों के संयोजन का उपयोग करके वीडियो बनाने और संपादित करने के लिए डिज़ाइन किया गया है। घोषणा Google I/O 2026 के दौरान की गई थी, जहां कंपनी ने ओमनी को जेमिनी को पूरी तरह से रचनात्मक एआई सिस्टम में बदलने की दिशा में एक बड़ा कदम बताया, जो मीडिया के कई रूपों को समझने और उत्पादन करने में सक्षम है।

मॉडल का पहला संस्करण, जिसे जेमिनी ओमनी फ्लैश कहा जाता है, अब जेमिनी ऐप, गूगल फ्लो और यूट्यूब शॉर्ट्स के माध्यम से जारी किया जा रहा है। गूगल कहते हैं कि मॉडल जेमिनी की तर्क क्षमताओं को एआई-संचालित सामग्री निर्माण के साथ जोड़ता है, जिससे उपयोगकर्ताओं को प्राकृतिक भाषा संकेतों का उपयोग करके सिनेमाई-गुणवत्ता वाले वीडियो बनाने की अनुमति मिलती है।

बातचीत के माध्यम से एआई वीडियो संपादन

जेमिनी ओमनी की सबसे बड़ी विशेषताओं में से एक संवादात्मक वीडियो संपादन है। पारंपरिक संपादन टूल या टाइमलाइन का उपयोग करने के बजाय, उपयोगकर्ता सरल शब्दों में समझाते हैं कि वे क्या करना चाहते हैं।

Google ने ऐसे उदाहरण दिखाए जहां उपयोगकर्ताओं ने मूर्तियों को बुलबुले में बदल दिया, दर्पणों को तरल पदार्थ में बदल दिया, एनिमेशन लागू किया, या वीडियो क्लिप के भीतर पात्रों या यथार्थवादी भौतिकी को बदले बिना पर्यावरण को बदल दिया। कंपनी का कहना है कि प्रत्येक निर्देश पिछले संपादनों पर आधारित है, जिससे उपयोगकर्ता निरंतरता खोए बिना कई संकेतों में वीडियो को परिष्कृत कर सकते हैं।

Google के अनुसार, मॉडल में गति, प्रकाश व्यवस्था, गुरुत्वाकर्षण, द्रव गतिशीलता और वस्तु इंटरैक्शन की एक मजबूत समझ है, जो ऐसे दृश्यों को उत्पन्न करने में मदद करती है जो अधिक यथार्थवादी और शारीरिक रूप से सटीक दिखाई देते हैं।

जेमिनी ओमनी पाठ, चित्र, वीडियो और ऑडियो को जोड़ती है

गूगल का कहना है कि जेमिनी ओमनी एक साथ कई तरह के इनपुट के साथ काम कर सकता है। उपयोगकर्ता एकल समेकित आउटपुट बनाने के लिए फ़ोटो, मौजूदा वीडियो, चित्र, ध्वनि संदर्भ और टेक्स्ट संकेत अपलोड कर सकते हैं।

उदाहरण के लिए, उपयोगकर्ता एक छवि की दृश्य शैली को वीडियो पर लागू कर सकते हैं, दृश्यों को संगीत के साथ सिंक्रनाइज़ कर सकते हैं, या किसी न किसी रेखाचित्र और लिखित निर्देशों के आधार पर सिनेमाई क्लिप उत्पन्न कर सकते हैं। सिस्टम छोटे संकेतों से शैक्षिक व्याख्याकार और एनिमेटेड अनुक्रम भी बना सकता है।

इस विज्ञापन के नीचे कहानी जारी है

कंपनी का कहना है कि ओमनी को जेमिनी के विज्ञान, इतिहास और संस्कृति के व्यापक ज्ञान के साथ रचनात्मक पीढ़ी को जोड़कर एआई-जनित दृश्यों और सार्थक कहानी कहने के बीच अंतर को पाटने के लिए डिज़ाइन किया गया है।

एआई अवतार और वैयक्तिकृत सामग्री निर्माण

Google जेमिनी ओमनी के हिस्से के रूप में AI अवतार भी पेश कर रहा है। उपयोगकर्ता वैयक्तिकृत वीडियो बनाने के लिए अपनी उपस्थिति और आवाज़ का उपयोग करके स्वयं का डिजिटल संस्करण बना सकते हैं।

कंपनी का कहना है कि वह डीपफेक और दुरुपयोग से जुड़ी चिंताओं के कारण इन सुविधाओं पर सावधानी से काम कर रही है। अभी के लिए, आवाज-आधारित अवतार पीढ़ी पहले लॉन्च होगी, जबकि भाषण और ऑडियो हेरफेर से जुड़ी अतिरिक्त संपादन सुविधाओं का अभी भी परीक्षण किया जा रहा है।

जेमिनी ओमनी के माध्यम से तैयार किए गए सभी वीडियो में Google की अदृश्य सिंथआईडी वॉटरमार्किंग तकनीक शामिल होगी, जो दर्शकों को यह सत्यापित करने की अनुमति देगी कि सामग्री एआई-जनरेटेड थी।

इस विज्ञापन के नीचे कहानी जारी है

जेमिनी और यूट्यूब पर चल रहा है

जेमिनी ओमनी फ्लैश जेमिनी ऐप और Google फ्लो के माध्यम से Google AI प्लस, प्रो और अल्ट्रा ग्राहकों के लिए विश्व स्तर पर लॉन्च हो रहा है। Google क्रिएटर्स के लिए बिना किसी अतिरिक्त लागत के YouTube शॉर्ट्स और YouTube क्रिएट ऐप में भी तकनीक ला रहा है।

कंपनी का कहना है कि डेवलपर और एंटरप्राइज़ एपीआई एक्सेस आने वाले हफ्तों में आ जाएगा, जिससे व्यवसायों और रचनाकारों को जेमिनी ओमनी को अपने स्वयं के टूल और वर्कफ़्लो में एकीकृत करने की अनुमति मिलेगी।

Source link