Alibaba ने नया AI मॉडल Qwen-VLo लॉन्च किया

Share Us

152
Alibaba ने नया AI मॉडल Qwen-VLo लॉन्च किया
01 Jul 2025
8 min read

News Synopsis

चाइनीज़ टेक कंपनी Alibaba ने अपने नए AI मॉडल Qwen-VLo की घोषणा की है, जिसका उद्देश्य इमेज जेनरेशन के क्षेत्र में ChatGPT-4o जैसे कॉम्पिटिटर को टक्कर देना है। यह नया मॉडल यूजर के निर्देशों को अधिक सटीक रूप से समझ सकता है, और उस समझ के आधार पर हाई-क्वालिटी इमेज जेनरेट कर सकता है।

Qwen-VL जैसे अपने पिछले इमेज-फोकस्ड मॉडल के विपरीत हाल ही में पेश किए गए Qwen-VLo को काम्प्लेक्स संकेतों को संभालने और सटीक परिणाम देने में बहुत बेहतर बताया गया है। प्रमुख सुधारों में से एक यह है, कि यह इमेज में विशिष्ट परिवर्तन कर सकता है, जैसे कलर या बैकग्राउंड बदलना - इमेज के असंबंधित भागों को बदले बिना। यह पहले के वर्शन के साथ एक आम समस्या थी, जहाँ मामूली एडिट अक्सर ओवरआल पिक्चर में अनावश्यक परिवर्तन की ओर ले जाते थे।

क्वेन-वीएलओ को यूजर्स के रिक्वेस्ट के पीछे के कॉन्टेक्स्ट को समझने के लिए डिज़ाइन किया गया है। इसलिए यदि कोई यूजर किसी निश्चित मौसम की स्थिति से मिलती-जुलती या किसी विशेष आर्ट स्टाइल में खींची गई इमेज के लिए कहता है, तो मॉडल उसी के अनुसार रिस्पांस दे सकता है। यह ऐसी इमेज भी बना सकता है, जो किसी निश्चित टाइम पीरियड से संबंधित दिखती हैं, जो इसे क्रिएटिव कार्यों के लिए उपयोग करने की फ्लेक्सिबिलिटी देता है।

मॉडल चाइनीज़ और अंग्रेजी के अलावा कई भाषाओं का भी समर्थन करता है, जिससे यह विभिन्न क्षेत्रों के यूजर्स के लिए अधिक उपयोगी हो जाता है। हालाँकि समर्थित भाषाओं की फुल लिस्ट का खुलासा नहीं किया गया है, लेकिन यह जोड़ अलीबाबा के विडर ग्लोबल ऑडियंस तक पहुँचने के इरादे का संकेत देता है।

एक और प्रमुख फीचर जो क्वेन-वीएलओ को अलग बनाती है, वह है एक बार में एक से अधिक इमेज लेने की इसकी क्षमता। सरल शब्दों में यूजर्स अलग-अलग ऑब्जेक्ट या एलिमेंट्स अपलोड कर सकते हैं, और मॉडल से उन्हें कंबाइन करने के लिए कह सकते हैं। उदाहरण के लिए कोई यूजर किसी टोकरी की इमेज और साबुन या शैम्पू जैसे प्रोडक्ट्स की अलग-अलग इमेज अपलोड कर सकता है, और AI से उन वस्तुओं को टोकरी के अंदर रखने के लिए कह सकता है। हालाँकि यह फीचर अभी भी डेवलपमेंट में है, और इसे अभी तक पूरी तरह से उपलब्ध नहीं कराया गया है।

क्वेन-वीएलओ यूजर्स को डायनामिक रिज़ॉल्यूशन ट्रेनिंग का उपयोग करके विभिन्न फोर्मट्स में इमेज का आकार बदलने की क्षमता भी देता है, जिसमें स्क्वायर, पोर्ट्रेट और वाइडस्क्रीन शामिल हैं। इमेज को ऊपर से नीचे और बाएं से दाएं स्टेप-by-स्टेप बनाया जाता है, जो जनरेशन के दौरान बेहतर कंट्रोल और एक्यूरेसी में मदद करता है।

Alibaba ने बताया है, कि मॉडल अभी अपने शुरुआती चरण में है, और यूजर्स को असंगतता या निर्देशों से पूरी तरह मेल न खाने वाले परिणाम जैसी कुछ समस्याओं का सामना करना पड़ सकता है। हालांकि कंपनी का कहना है, कि सुधार जारी हैं। यह इमेज के भीतर वस्तुओं और दृश्यों की मॉडल की समझ को बेहतर बनाने के लिए इमेज सेगमेंटेशन और डिटेक्शन मैप के उपयोग की भी खोज कर रहा है।

कंपनी का मानना ​​है, कि भविष्य में क्वेन-वीएलओ जैसे एआई मॉडल न केवल सुंदर इमेज बनाने में सक्षम हो सकते हैं, बल्कि विसुअल के माध्यम से विचारों और भावनाओं को भी व्यक्त कर सकते हैं।

TWN Special