News In Brief Technology and Gadgets

OpenAI ने ChatGPT के लिए GPT-5.4 मॉडल लॉन्च किया

06 Mar 2026

7 min read

News Synopsis

OpenAI ने GPT-5.4 पेश किया है, और इसे कंपनी का सबसे काबिल और कुशल फ्रंटियर मॉडल बताया है, जो प्रोफेशनल और एंटरप्राइज कामों के लिए बनाया गया है।

यह नया रिलीज़ GPT-5 सीरीज़ को कई वेरिएंट के साथ बढ़ाता है। स्टैंडर्ड मॉडल के साथ OpenAI GPT-5.4 थिंकिंग, जो मुश्किल प्रॉब्लम सॉल्विंग के लिए डिज़ाइन किया गया एक रीज़निंग-फोकस्ड वर्शन है, और GPT-5.4 प्रो दे रहा है, जो बेहतर परफॉर्मेंस को प्राथमिकता देता है।

इस मॉडल की एक खास बात इसकी बड़ी कॉन्टेक्स्ट विंडो है। API वर्शन एक मिलियन टोकन तक सपोर्ट करता है, जिससे डेवलपर्स पिछले OpenAI मॉडल की तुलना में एक ही रिक्वेस्ट में कहीं ज़्यादा बड़े डॉक्यूमेंट और डेटासेट प्रोसेस कर सकते हैं।

OpenAI का कहना है, कि नया मॉडल काफी ज़्यादा टोकन-एफिशिएंट भी है। कंपनी के अनुसार GPT-5.4, GPT-5.2 की तुलना में कम टोकन का इस्तेमाल करके वैसी ही प्रॉब्लम सॉल्व कर सकता है, जिससे डेवलपर्स के लिए लेटेंसी और कॉस्ट दोनों कम हो सकते हैं।

बेंचमार्क रिज़ल्ट कई टेस्ट में बड़े फायदे दिखाते हैं। GPT-5.4 ने कंप्यूटर-यूज़ बेंचमार्क OSWorld-Verified और WebArena Verified में टॉप स्कोर हासिल किए, जबकि OpenAI के GDPval इवैल्यूएशन में 83 परसेंट हासिल किया, जो नॉलेज-वर्क टास्क पर परफॉर्मेंस को मापता है।

इस मॉडल ने Mercor के APEX-Agents बेंचमार्क को भी लीड किया, जो लीगल रीजनिंग और फाइनेंशियल एनालिसिस जैसे प्रोफेशनल स्किल्स को इवैल्यूएट करता है।

मर्कोर के CEO Brendan Foody ने कहा कि GPT-5.4 ने स्लाइड डेक, फाइनेंशियल मॉडलिंग और लीगल एनालिसिस जैसे मुश्किल कामों पर अच्छा काम किया, जबकि यह मुकाबले के फ्रंटियर मॉडल्स की तुलना में तेज़ी से और कम कीमत पर काम करता है।

OpenAI ने बेहतर फैक्ट्स की विश्वसनीयता का भी दावा किया है। इंटरनल इवैल्यूएशन में GPT-5.2 की तुलना में GPT-5.4 में अलग-अलग दावों में गलतियाँ होने की संभावना 33 प्रतिशत कम थी, जबकि कुल जवाबों में गलतियाँ होने की संभावना 18 प्रतिशत कम थी।

नया टूल सर्च

कंपनी ने टूल सर्च नाम का एक नया सिस्टम भी पेश किया है, ताकि यह बेहतर हो सके कि मॉडल API के ज़रिए बाहरी टूल के साथ कैसे इंटरैक्ट करते हैं। पहले, सिस्टम प्रॉम्प्ट में हर उपलब्ध टूल के लिए डेफिनिशन शामिल करने की ज़रूरत होती थी, जिसमें बड़ी संख्या में टोकन लग सकते थे। टूल सर्च मॉडल को सिर्फ़ ज़रूरत पड़ने पर ही टूल डेफिनिशन निकालने की सुविधा देता है, जिससे टोकन का इस्तेमाल कम होता है, और कई इंटीग्रेटेड टूल वाले एप्लिकेशन में रिक्वेस्ट तेज़ हो जाती हैं।

OpenAI ने चेन-ऑफ़-थॉट रीज़निंग पर फ़ोकस करने वाला एक नया सेफ़्टी इवैल्यूएशन भी पेश किया — यह वह अंदरूनी स्टेप-बाय-स्टेप एक्सप्लेनेशन है, जो मॉडल मुश्किल कामों को हल करते समय बनाते हैं। रिसर्चर्स ने चिंता जताई है, कि AI मॉडल कुछ खास हालात में इस रीज़निंग प्रोसेस को गलत दिखा सकते हैं।

OpenAI के मुताबिक शुरुआती टेस्टिंग से पता चलता है, कि GPT-5.4 थिंकिंग के साथ धोखे की संभावना कम होती है, जिससे पता चलता है, कि मॉडल अपनी रीज़निंग को छिपाने में कम काबिल है। नतीजों से पता चलता है, कि चेन-ऑफ़-थॉट बिहेवियर को मॉनिटर करना एक असरदार सेफ्टी तरीका बना हुआ है।