एंथ्रोपिक ने क्लाउड ओपस 4.5 लॉन्च किया
News Synopsis
एंथ्रोपिक ने कंपनी का फ्रंटियर आर्टिफिशियल इंटेलिजेंस (AI) मॉडल Claude Opus 4.5 रिलीज़ किया। क्लाउड 4.5 फ़ैमिली का फ़ाइनल मेंबर और सीरीज़ का सबसे ज़्यादा परफ़ॉर्म करने वाला मॉडल, कोड जेनरेशन, लॉन्ग-कॉन्टेक्स्ट रीज़निंग और एजेंटिक क्षमताओं में बड़े सुधारों के साथ आता है। साथ ही AI फ़र्म ने इस बात पर भी ज़ोर दिया कि यह मॉडल मुश्किल कामों को पूरा करने के लिए कम टोकन का इस्तेमाल करता है। ओपस 4.5, क्लाउड API और सपोर्टेड क्लाउड प्लेटफ़ॉर्म के ज़रिए उपलब्ध है, जो एंथ्रोपिक के टॉप-टियर कमर्शियल मॉडल के तौर पर ओपस 4.1 की जगह लेता है।
क्लाउड ओपस 4.5 में नया क्या है:
Anthropic ने नए बड़े लैंग्वेज मॉडल की घोषणा की और उसके बारे में डिटेल में बताया। कंपनी का कहना है, कि क्लाउड ओपस 4.5 कोडिंग, एजेंटिक टूल का इस्तेमाल और लॉन्ग-कॉन्टेक्स्ट रीज़निंग के तीन एरिया में काफ़ी सुधार लाता है। कोडिंग के बारे में, कंपनी बताती है, कि ओपस 4.5 अपने पिछले मॉडल की तुलना में ज़्यादा लॉन्ग-होराइज़न कोडिंग कामों को हल करता है, जबकि 65 परसेंट तक कम टोकन का इस्तेमाल करता है।
असल में इसका मतलब है, कि मॉडल कम कम्प्यूटेशनल कॉस्ट और छोटे प्रॉम्प्ट विंडो में वही इंस्ट्रक्शन प्रोसेस कर सकता है। कंपनी इस सुधार का क्रेडिट बेहतर प्लानिंग और ज़्यादा कुशल इंटरनल रीज़निंग स्टेप्स को देती है।
Opus 4.5 को ज़्यादा मुश्किल मल्टी-स्टेप वर्कफ़्लो को मैनेज करने के लिए ट्रेन किया गया है। इंटरनल टेस्ट के दौरान एंथ्रोपिक ने दावा किया कि मॉडल एक ही बार में दो अलग-अलग कोडबेस को रीफैक्टर करने, तीन एजेंट के काम को कोऑर्डिनेट करने और लो-लेवल डिटेल्स को एग्जीक्यूट करते हुए हाई-लेवल प्लान बनाए रखने में सक्षम था। ये क्षमताएं मॉडल की लॉन्ग-कॉन्टेक्स्ट रीज़निंग में सुधार और टूल कॉलिंग को बेहतर बनाने के लिए एक नए सिस्टम (एक बड़ी लाइब्रेरी को प्री-लोड करने के बजाय, LLM केवल टास्क से जुड़े टूल्स को कॉल करता है) द्वारा इनेबल की जाती हैं। कहा जाता है, कि इससे कॉन्टेक्स्ट का इस्तेमाल 85 प्रतिशत तक कम हो जाता है।
कंटेंट बनाने के लिए Opus 4.5 को लंबे डॉक्यूमेंट्स को ज़्यादा भरोसेमंद तरीके से हैंडल करने के लिए डिज़ाइन किया गया है। यह मॉडल कई पेज वाले नैरेटिव चैप्टर (एंथ्रोपिक के उदाहरण में 10–15 पेज) बना सकता है, और उन लंबे हिस्सों में कैरेक्टर, प्लॉट की दिशा और टोन बनाए रख सकता है। कंपनी मुश्किल 3D रीज़निंग एक्सरसाइज़ में भी बेहतर परफॉर्मेंस का दावा करती है, जहाँ मॉडल पिछले वर्शन की तुलना में सीन या स्पेशल रिश्तों को ज़्यादा डिटेल में बताता है।
बेंचमार्क की बात करें तो, कंपनी ने इंटरनल टेस्टिंग की और दावा किया कि क्लॉड ओपस 4.5 ने कोड-बेस्ड टेस्ट में अपने कॉम्पिटिटर से बेहतर स्कोर किया। खास तौर पर SWE-बेंच वेरिफाइड बेंचमार्क में, जो एजेंटिक कोडिंग को मापता है, Opus 4.5 ने 80.9 परसेंट स्कोर किया, जबकि जेमिनी 3 प्रो ने 76.2 परसेंट और GPT-5.1 कोडेक्स मैक्स ने 77.9 परसेंट स्कोर किया।
एंथ्रोपिक ने क्लॉड ओपस 4.5 को अपने पहले के वर्शन की तुलना में ज़्यादा सस्ता भी बनाया है। कंपनी का कहना है, कि यह मॉडल कई एंटरप्राइज़ वर्कलोड के लिए लगभग एक-तिहाई कीमत पर वैसा ही या बेहतर परफॉर्मेंस देता है। LLM अभी क्लॉड के ऐप और वेबसाइट पर पेड सब्सक्राइबर्स के लिए एंथ्रोपिक के एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (API) के ज़रिए, साथ ही Google Vertex AI और Amazon Bedrock जैसे बड़े क्लाउड प्लेटफ़ॉर्म पर उपलब्ध है।


