News In Brief Technology and Gadgets

Google ने लॉन्च किया Gemini Omni Flash

30 May 2026

min read

News Synopsis

गूगल ने आर्टिफिशियल इंटेलिजेंस (AI) के क्षेत्र में एक और बड़ा कदम उठाते हुए Gemini Omni नामक AI मॉडल्स की नई श्रृंखला पेश की है। यह नई मॉडल फैमिली उन्नत रीजनिंग (तार्किक समझ) को वीडियो जनरेशन और एडिटिंग क्षमताओं के साथ जोड़ती है। इस श्रृंखला का पहला मॉडल, Gemini Omni Flash, गूगल के विभिन्न प्लेटफॉर्म्स जैसे Gemini ऐप, Google Flow और YouTube Shorts पर उपलब्ध कराया जा रहा है। यह लॉन्च मल्टीमॉडल AI टूल्स के क्षेत्र में गूगल की बढ़ती महत्वाकांक्षाओं को दर्शाता है, जो एक साथ कई प्रकार की सामग्री को समझ और प्रोसेस कर सकते हैं।

गूगल ने अपने AI वीडियो निर्माण इकोसिस्टम का विस्तार किया

Gemini Omni Flash के लॉन्च के साथ गूगल का उद्देश्य वीडियो निर्माण और एडिटिंग के तरीके को बदलना है। पारंपरिक वीडियो एडिटिंग टूल्स के विपरीत, जिनमें तकनीकी विशेषज्ञता और मैनुअल कार्य की आवश्यकता होती है, Gemini Omni Flash उपयोगकर्ताओं को सामान्य भाषा में निर्देश देकर वीडियो बनाने और संपादित करने की सुविधा देता है।

क्रिएटर्स केवल अपनी जरूरत को शब्दों में व्यक्त कर सकते हैं, और AI उसी के अनुसार वीडियो तैयार या संशोधित कर सकता है। यह प्लेटफॉर्म टेक्स्ट, इमेज, वीडियो और ऑडियो रेफरेंस सहित कई प्रकार के इनपुट को सपोर्ट करता है, जिससे यह कंटेंट क्रिएटर्स, शिक्षकों, मार्केटर्स और व्यवसायों के लिए एक बहुउपयोगी समाधान बन जाता है।

कंपनी ने घोषणा की है, कि यह टूल फिलहाल Gemini ऐप, Google Flow और YouTube Shorts पर उपलब्ध है, जबकि YouTube Create उपयोगकर्ताओं को भी जल्द ही इसकी सुविधा मिलने वाली है।

नेचुरल लैंग्वेज एडिटिंग से वीडियो निर्माण हुआ आसान

Gemini Omni Flash की सबसे प्रमुख विशेषताओं में से एक इसकी कन्वर्सेशनल वीडियो एडिटिंग क्षमता है। उपयोगकर्ताओं को अब वीडियो एडिटिंग के लिए जटिल टूल्स का उपयोग नहीं करना होगा, बल्कि वे सीधे AI से बातचीत करके बदलाव कर सकते हैं।

उदाहरण के लिए कोई क्रिएटर AI से वीडियो का बैकग्राउंड बदलने, विजुअल स्टाइल में बदलाव करने, कैमरा एंगल संशोधित करने या किसी ऑब्जेक्ट को बदलने के लिए कह सकता है। AI इन परिवर्तनों को करते समय मूल वीडियो के संदर्भ और निरंतरता को बनाए रखता है।

यह संवाद-आधारित एडिटिंग प्रक्रिया उपयोगकर्ताओं को कई चरणों में वीडियो को बेहतर बनाने की सुविधा देती है, जिससे वीडियो निर्माण अधिक सहज और आसान हो जाता है।

उन्नत AI समझ के जरिए अधिक वास्तविक वीडियो निर्माण

गूगल के अनुसार Gemini Omni Flash को अत्यधिक वास्तविक और भरोसेमंद वीडियो तैयार करने के लिए विकसित किया गया है। यह मॉडल Gemini की रीजनिंग क्षमता को भौतिकी, विज्ञान, इतिहास और सांस्कृतिक संदर्भों की समझ के साथ जोड़ता है।

कंपनी का कहना है, कि AI को गति (Motion), गुरुत्वाकर्षण (Gravity), वस्तुओं की परस्पर क्रिया और तरल पदार्थों की गतिशीलता (Fluid Dynamics) की बेहतर समझ प्रदान की गई है। इससे वीडियो सीक्वेंस अधिक प्राकृतिक और वास्तविक दिखाई देते हैं।

वास्तविक दुनिया में वस्तुएं किस प्रकार व्यवहार करती हैं, इसकी समझ AI को ऐसे एनिमेशन और ट्रांजिशन बनाने में मदद करती है जो कृत्रिम नहीं बल्कि स्वाभाविक महसूस होते हैं।

मौजूदा वीडियो को बदलने और बेहतर बनाने की क्षमता

Gemini Omni Flash केवल नए वीडियो बनाने तक सीमित नहीं है। उपयोगकर्ता अपने मौजूदा वीडियो भी अपलोड कर सकते हैं और AI से उन्हें संशोधित या बेहतर बनाने के लिए कह सकते हैं।

यह मॉडल वीडियो में मौजूद ऑब्जेक्ट्स को बदल सकता है, नए विजुअल इफेक्ट्स जोड़ सकता है, वातावरण में बदलाव कर सकता है और पात्रों की गतिविधियों को भी टेक्स्ट आधारित निर्देशों के जरिए संशोधित कर सकता है।

AI की यह क्षमता सुनिश्चित करती है, कि बड़े बदलावों के बावजूद पात्रों की पहचान और दृश्य की निरंतरता बनी रहे, जिससे अंतिम परिणाम अधिक सहज और आकर्षक दिखाई देता है।

शैक्षणिक और एक्सप्लेनर वीडियो बनाना हुआ आसान

गूगल ने Gemini Omni Flash की शैक्षणिक और जानकारीपूर्ण कंटेंट निर्माण क्षमता को भी प्रमुखता से प्रदर्शित किया है। यह AI छोटे-छोटे निर्देशों के आधार पर एक्सप्लेनर वीडियो तैयार कर सकता है, जिससे यह शिक्षकों, प्रशिक्षकों और कंटेंट क्रिएटर्स के लिए उपयोगी साबित हो सकता है।

गूगल ने इसके कुछ उदाहरण भी दिखाए हैं, जिनमें क्लेमेशन-शैली के वैज्ञानिक वीडियो और तेज गति वाली एनिमेटेड स्टोरीटेलिंग शामिल हैं। ये फीचर्स जटिल विषयों को सरल और रोचक तरीके से प्रस्तुत करने में मदद कर सकते हैं।

मल्टीमॉडल इनपुट से बढ़ीं रचनात्मक संभावनाएं

Gemini Omni Flash की सबसे बड़ी ताकत इसकी मल्टीमॉडल डिज़ाइन है। यह मॉडल टेक्स्ट, इमेज, वीडियो और ऑडियो जैसे विभिन्न प्रकार के इनपुट को एक साथ समझकर एकीकृत आउटपुट तैयार कर सकता है।

इसका मतलब है, कि क्रिएटर्स केवल एक प्रकार की सामग्री तक सीमित नहीं रहेंगे, बल्कि वे कई संदर्भों का उपयोग करके अधिक सटीक और अनुकूलित परिणाम प्राप्त कर सकेंगे।

लॉन्च के समय ऑडियो इनपुट के लिए वॉयस रेफरेंस सपोर्ट उपलब्ध होगा, जबकि भविष्य में व्यापक ऑडियो सपोर्ट जोड़े जाने की योजना है।

AI-जनित डिजिटल अवतार भी पेश किए गए

Gemini Omni इकोसिस्टम के तहत गूगल AI-जनित डिजिटल अवतार भी पेश कर रहा है। इन अवतारों की मदद से उपयोगकर्ता अपनी ही आवाज़ और स्वरूप का उपयोग करके वीडियो तैयार कर सकते हैं।

यह सुविधा विशेष रूप से इन्फ्लुएंसर्स, शिक्षकों और व्यवसायों के लिए उपयोगी हो सकती है, जिन्हें नियमित रूप से वीडियो कंटेंट तैयार करना पड़ता है।

गूगल ने कहा है, कि वह स्पीच और ऑडियो एडिटिंग की व्यापक क्षमताओं को जिम्मेदारीपूर्वक लागू करने के लिए सावधानीपूर्वक परीक्षण कर रहा है।

SynthID तकनीक से होगी AI कंटेंट की पहचान

जिम्मेदार AI उपयोग को बढ़ावा देने के लिए Gemini Omni Flash से तैयार किए गए सभी वीडियो में गूगल की SynthID वॉटरमार्किंग तकनीक शामिल होगी।

यह तकनीक AI-जनित कंटेंट की पहचान और सत्यापन में मदद करेगी, जिससे दर्शक आसानी से समझ सकेंगे कि कोई सामग्री AI द्वारा बनाई गई है या नहीं। AI कंटेंट के बढ़ते उपयोग के बीच यह कदम पारदर्शिता और विश्वास बनाए रखने में महत्वपूर्ण भूमिका निभाएगा।

उपलब्धता और भविष्य की योजनाएं

Gemini Omni Flash को वैश्विक स्तर पर Google AI Plus, Pro और Ultra सब्सक्राइबर्स के लिए Gemini ऐप और Google Flow के माध्यम से उपलब्ध कराया जा रहा है।

गूगल ने यह भी पुष्टि की है, कि आने वाले हफ्तों में इस मॉडल को API के जरिए डेवलपर्स और एंटरप्राइज ग्राहकों के लिए भी उपलब्ध कराया जाएगा। इससे व्यवसाय अपने उत्पादों और सेवाओं में उन्नत AI वीडियो निर्माण क्षमताओं को एकीकृत कर सकेंगे।

AI-संचालित कंटेंट निर्माण तकनीकों के तेजी से विकसित होते परिदृश्य में Gemini Omni Flash गूगल का एक महत्वपूर्ण प्रयास है, जो उन्नत वीडियो निर्माण टूल्स को अधिक लोगों तक पहुंचाने के साथ-साथ जिम्मेदार AI उपयोग को भी बढ़ावा देता है।

Podcast

Editorial Segment

TWN Exclusive