OpenAI ने ChatGPT के लिए GPT-5.4 मॉडल लॉन्च किया
News Synopsis
OpenAI ने GPT-5.4 पेश किया है, और इसे कंपनी का सबसे काबिल और कुशल फ्रंटियर मॉडल बताया है, जो प्रोफेशनल और एंटरप्राइज कामों के लिए बनाया गया है।
यह नया रिलीज़ GPT-5 सीरीज़ को कई वेरिएंट के साथ बढ़ाता है। स्टैंडर्ड मॉडल के साथ OpenAI GPT-5.4 थिंकिंग, जो मुश्किल प्रॉब्लम सॉल्विंग के लिए डिज़ाइन किया गया एक रीज़निंग-फोकस्ड वर्शन है, और GPT-5.4 प्रो दे रहा है, जो बेहतर परफॉर्मेंस को प्राथमिकता देता है।
इस मॉडल की एक खास बात इसकी बड़ी कॉन्टेक्स्ट विंडो है। API वर्शन एक मिलियन टोकन तक सपोर्ट करता है, जिससे डेवलपर्स पिछले OpenAI मॉडल की तुलना में एक ही रिक्वेस्ट में कहीं ज़्यादा बड़े डॉक्यूमेंट और डेटासेट प्रोसेस कर सकते हैं।
OpenAI का कहना है, कि नया मॉडल काफी ज़्यादा टोकन-एफिशिएंट भी है। कंपनी के अनुसार GPT-5.4, GPT-5.2 की तुलना में कम टोकन का इस्तेमाल करके वैसी ही प्रॉब्लम सॉल्व कर सकता है, जिससे डेवलपर्स के लिए लेटेंसी और कॉस्ट दोनों कम हो सकते हैं।
बेंचमार्क रिज़ल्ट कई टेस्ट में बड़े फायदे दिखाते हैं। GPT-5.4 ने कंप्यूटर-यूज़ बेंचमार्क OSWorld-Verified और WebArena Verified में टॉप स्कोर हासिल किए, जबकि OpenAI के GDPval इवैल्यूएशन में 83 परसेंट हासिल किया, जो नॉलेज-वर्क टास्क पर परफॉर्मेंस को मापता है।
इस मॉडल ने Mercor के APEX-Agents बेंचमार्क को भी लीड किया, जो लीगल रीजनिंग और फाइनेंशियल एनालिसिस जैसे प्रोफेशनल स्किल्स को इवैल्यूएट करता है।
मर्कोर के CEO Brendan Foody ने कहा कि GPT-5.4 ने स्लाइड डेक, फाइनेंशियल मॉडलिंग और लीगल एनालिसिस जैसे मुश्किल कामों पर अच्छा काम किया, जबकि यह मुकाबले के फ्रंटियर मॉडल्स की तुलना में तेज़ी से और कम कीमत पर काम करता है।
OpenAI ने बेहतर फैक्ट्स की विश्वसनीयता का भी दावा किया है। इंटरनल इवैल्यूएशन में GPT-5.2 की तुलना में GPT-5.4 में अलग-अलग दावों में गलतियाँ होने की संभावना 33 प्रतिशत कम थी, जबकि कुल जवाबों में गलतियाँ होने की संभावना 18 प्रतिशत कम थी।
नया टूल सर्च
कंपनी ने टूल सर्च नाम का एक नया सिस्टम भी पेश किया है, ताकि यह बेहतर हो सके कि मॉडल API के ज़रिए बाहरी टूल के साथ कैसे इंटरैक्ट करते हैं। पहले, सिस्टम प्रॉम्प्ट में हर उपलब्ध टूल के लिए डेफिनिशन शामिल करने की ज़रूरत होती थी, जिसमें बड़ी संख्या में टोकन लग सकते थे। टूल सर्च मॉडल को सिर्फ़ ज़रूरत पड़ने पर ही टूल डेफिनिशन निकालने की सुविधा देता है, जिससे टोकन का इस्तेमाल कम होता है, और कई इंटीग्रेटेड टूल वाले एप्लिकेशन में रिक्वेस्ट तेज़ हो जाती हैं।
OpenAI ने चेन-ऑफ़-थॉट रीज़निंग पर फ़ोकस करने वाला एक नया सेफ़्टी इवैल्यूएशन भी पेश किया — यह वह अंदरूनी स्टेप-बाय-स्टेप एक्सप्लेनेशन है, जो मॉडल मुश्किल कामों को हल करते समय बनाते हैं। रिसर्चर्स ने चिंता जताई है, कि AI मॉडल कुछ खास हालात में इस रीज़निंग प्रोसेस को गलत दिखा सकते हैं।
OpenAI के मुताबिक शुरुआती टेस्टिंग से पता चलता है, कि GPT-5.4 थिंकिंग के साथ धोखे की संभावना कम होती है, जिससे पता चलता है, कि मॉडल अपनी रीज़निंग को छिपाने में कम काबिल है। नतीजों से पता चलता है, कि चेन-ऑफ़-थॉट बिहेवियर को मॉनिटर करना एक असरदार सेफ्टी तरीका बना हुआ है।


