OpenAI ने अपने इमेज जेनरेशन मॉडल का नया वर्जन ChatGPT Images 2.0 लॉन्च कर दिया है। माना जा रहा है, कि यह मॉडल पहले से ज्यादा स्मार्ट, सटीक और जटिल विजुअल टास्क पर काम कर सकेगा। खास बात यह है, कि यह कई भाषाओं में टेक्स्ट के साथ बेहतर इमेज तैयार कर सकता है। जानिए इसमें आपको और क्या-क्या खास देखने को मिलेगा...
ओपनएआई के अनुसार चैटजीपीटी इमेज 2.0 स्टेट-ऑफ-द-आर्ट इमेज जेनरेशन मॉडल है। इसे खासतौर पर जटिल विजुअल टास्क हैंडल करनें, सटीक और उपयोगी इमेज बनाने और कम इनपुट में ज्यादा और बेहतर रिजल्ट देने के लिए डिजाइन किया गया है। इसका मतलब है, कि अब यूजर्स को कम मेहनत में ज्यादा क्वालिटी वाला आउटपुट मिल सकेगा।
टेक दिग्गजी कंपनी का यह भी कहना है, कि इस नए मॉडल में डिटेल्स इंस्ट्रक्शन को समझने की क्षमता भी बढ़ी है। यूजर्स ये देख सकेंगे कि ऑब्जेक्ट काे सही जगह रखने में भी सुधार हुआ है। इसके अलावा छोटे टेक्स्ट, आइकॉन्स और यूआई एलिमेंट्स ज्यादा सटीक दिखते हैं। पहले जहां एआई इमेज में टेक्स्ट गड़बड़ हो जाता था, वह भी अब काफी हद तक ठीक हो सकता है।
इसकी सबसे बड़ी खूबी यह है, कि यह अब इमेज के अंदर हिंदी, बंगाली, जापानी, कोरियाई और चाइनीज जैसी तमाम भाषाओं में टेक्स्ट को बिल्कुल सही और रीडेबल तरीके से रेंडर कर सकता है। साथ ही में इसमें थिंकिंग फीचर जोड़ा गया है, जिससे यह रीयल-टाइम जानकारी सर्च करने और एक ही प्रॉम्प्ट से कई इमेज जेनरेट करने की क्षमता देते हैं। यानी की अब यूजर के लिए लोकल लैंग्वेज में कंटेंट बनाना पहले से ज्यादा आसान हो सकता है। वहीं थिंकिंग फीचर से आइडिया से फाइनल डिजाइन तक पहुंचने का समय काफी कम हो जाएगा।
यह नया ChatGPT Images 2.0 मॉडल अब सामान्य इमेज जनरेट करने तक ही सीमित नहीं रह गया। यह अब फोटोरियलिस्टिक इमेज, इलस्ट्रेशन, कॉमिक्स और सिनेमैटिक विजुअल्स जैसे कई तरह के स्टाइल में इमेज तैयार कर सकता है। इसके साथ ही अलग-अलग आस्पेक्ट रेशियो में इमेज बनाने की सुविधा मिलती है, जिससे सोशल मीडिया पोस्ट, प्रेजेंटेशन या बैनर डिजाइन करना आसान हो जाता है। इसके अलावा यूजर को लाइटिंग, टेक्सचर और कंपोजिशन में भी पहले से बेहतर सुधार देखने को मिल सकता है।
ओपनएआई के मुताबिक यूजर अपनी जरूरत के अनुसार इस मॉडल का उपयोग कई कामों में कर सकते हैं। हालांकि यह मार्केटिंग और डिजाइन, एजुकेशन और लर्निंग कंटेंट, स्टोरीटेलिंग और क्रिएटिव प्रोटेक्ट्स व प्रोडक्ट डेवलमेंट में अधिक मददगार साबित हो सकता है। इस मॉडल के बाद अब डेवलपर्स API के जरिए इसे ऐप में जोड़कर ऑटोमेशन भी कर सकते हैं।
यह नया मॉडल ChatGPT, Codex और API सभी यूजर्स के लिए उपलब्ध है। इसके लिए किसी को एक रुपये भी देने की जरूरत नहीं है, लेकिन नए थिकिंग जैसे एडवांस फीचर्स फिलहाल केवल Plus, Pro और Business यूजर्स को मिलेंगे। डेवलपर्स के लिए API में gpt-image-2 मॉडल दिया गया है, जिसे वे अपनी एप्लिकेशन में इंटीग्रेट कर सकते हैं। कीमत की बात करें तो यह इमेज की क्वालिटी और रेजोल्यूशन के आधार पर अलग-अलग तय की जाती है, जिससे यूजर्स अपनी जरूरत के हिसाब से इसे इस्तेमाल कर सकते हैं।
ChatGPT Image 2.0 की सबसे बड़ी खासियत इसका बेहतर टेक्स्ट रेंडरिंग सिस्टम है, जिससे डायलॉग बबल्स अब सही और साफ दिखाई देते हैं, यह जापानी जैसी नॉन-लैटिन भाषाओं को भी सपोर्ट करता है, जिससे मंगा का असली अनुभव मिलता है।
इसके अलावा इसमें एडवांस्ड AI सोचने की क्षमता है, जो एक जैसी कैरेक्टर डिजाइन और स्टोरी फ्लो को कई पेज तक बनाए रखती है, यही वजह है, कि यह टूल सिर्फ इमेज जनरेशन नहीं, बल्कि पूरी विजुअल स्टोरीटेलिंग का अनुभव देता है।