एंथ्रोपिक ने क्लाउड ओपस 4.6 लॉन्च किया

Share Us

36
एंथ्रोपिक ने क्लाउड ओपस 4.6 लॉन्च किया
06 Feb 2026
7 min read

News Synopsis

Anthropic ने अपने सबसे एडवांस्ड AI मॉडल का अपग्रेडेड वर्जन Claude Opus 4.6 लॉन्च किया है, जिससे फ्रंटियर मॉडल के बीच बढ़ती कॉम्पिटिशन के बीच प्रतिद्वंद्वी OpenAI और Google पर दबाव बढ़ गया है।

नया मॉडल अपने पिछले वर्जन की कोडिंग और रीजनिंग क्षमताओं में काफी सुधार करता है, एंथ्रोपिक ने ओपस 4.6 को बड़े कोडबेस में लंबे समय तक चलने वाले ऑटोनॉमस कामों के लिए ज़्यादा बेहतर बताया है। ओपस लाइन में पहली बार यह मॉडल बीटा में 1 मिलियन टोकन कॉन्टेक्स्ट विंडो भी पेश करता है, जिससे यह एक ही सेशन में बहुत ज़्यादा जानकारी को प्रोसेस और स्टोर कर सकता है।

मज़बूत एजेंटिक कोडिंग, क्लाउड के लिए बेंचमार्क जीत

एंथ्रोपिक का कहना है, कि ओपस 4.6 ज़्यादा सावधानी से प्लान बनाता है, एजेंटिक वर्कफ़्लो को ज़्यादा समय तक बनाए रखता है, और मज़बूत कोड रिव्यू और डीबगिंग करता है, जिसमें अपनी गलतियों को पकड़ना भी शामिल है। सॉफ्टवेयर डेवलपमेंट के अलावा यह मॉडल फाइनेंशियल एनालिसिस, रिसर्च और डॉक्यूमेंट, स्प्रेडशीट और प्रेजेंटेशन बनाने जैसे जटिल नॉलेज वर्क के लिए डिज़ाइन किया गया है।

कोवर्क के अंदर, जो एंथ्रोपिक का ऑटोनॉमस मल्टीटास्किंग एनवायरनमेंट है, ओपस 4.6 इन स्किल्स को मिलाकर कम से कम देखरेख में कई स्टेप वाले टास्क पूरे कर सकता है।

बेंचमार्क पर एंथ्रोपिक ने बेहतरीन परफॉर्मेंस का दावा किया है। ओपस 4.6 एजेंटिक कोडिंग इवैल्यूएशन, टर्मिनल-बेंच 2.0 में सबसे आगे है, और मल्टीडिसिप्लिनरी रीजनिंग टेस्ट, ह्यूमैनिटीज़ लास्ट एग्जाम में टॉप पर है। GDPval-AA पर, जो फाइनेंस और लीगल कामों में आर्थिक रूप से मूल्यवान काम को मापता है, मॉडल कथित तौर पर OpenAI के GPT-5.2 से लगभग 144 एलो पॉइंट्स और अपने पिछले वर्जन से 190 पॉइंट्स बेहतर प्रदर्शन करता है।

यह मॉडल BrowseComp पर भी सबसे अच्छा परफ़ॉर्म करता है, जो ऑनलाइन मुश्किल से मिलने वाली जानकारी खोजने पर फ़ोकस किया गया एक टेस्ट है। एंथ्रोपिक का तर्क है, कि यह लॉन्ग-कॉन्टेक्स्ट रीजनिंग और रिट्रीवल में एक बड़े सुधार को दिखाता है, एक ऐसा एरिया जहाँ कई मॉडल अभी भी तथाकथित "कॉन्टेक्स्ट रॉट" से जूझ रहे हैं।

MRCR v2 पर, जो 1 मिलियन टोकन कॉन्टेक्स्ट का इस्तेमाल करने वाला एक नीडल-इन-ए-हेस्टैक बेंचमार्क है, Opus 4.6 ने 76% स्कोर हासिल किया, जबकि Claude Sonnet 4.5 का स्कोर 18.5% था। एंथ्रोपिक इसे इस तरह से बताता है, कि बड़े कॉन्टेक्स्ट का इस्तेमाल कितनी असरदार तरीके से किया जा सकता है, बिना परफ़ॉर्मेंस खराब हुए।

एंथ्रोपिक का कहना है, कि ये फायदे सुरक्षा की कीमत पर नहीं मिलते हैं। इसके सिस्टम कार्ड के अनुसार Opus 4.6 धोखे या ओवर-कम्प्लायंस जैसे गलत व्यवहार की कम दरें दिखाता है, और पिछले Claude मॉडल की तुलना में इसमें कम गैर-ज़रूरी इनकार होते हैं। कंपनी ने मॉडल की मज़बूत रक्षात्मक और आक्रामक सुरक्षा क्षमताओं के जवाब में नए साइबर सुरक्षा जांच भी पेश किए हैं।

अन्य मुख्य अपडेट

मॉडल रिलीज़ के साथ एंथ्रोपिक ने कई प्रोडक्ट और API अपडेट भी जारी किए। डेवलपर्स के पास अब एडेप्टिव थिंकिंग और एडजस्टेबल प्रयास स्तरों के माध्यम से रीजनिंग की गहराई पर बेहतर कंट्रोल है, साथ ही कॉन्टेक्स्ट कम्पेक्शन भी है, ताकि टोकन लिमिट तक पहुंचे बिना लंबे समय तक चलने वाले एजेंटों को अनुमति मिल सके। आउटपुट अब 128,000 टोकन तक पहुंच सकते हैं, और केवल US में इन्फरेंस प्रीमियम पर उपलब्ध है।

एंथ्रोपिक ने Claude Code में एजेंट टीमों को भी पेश किया, जिससे कई AI एजेंट बड़े कोडबेस रिव्यू जैसे कामों पर समानांतर रूप से काम कर सकते हैं। Claude को Excel में अपग्रेड मिले हैं, और PowerPoint में Claude का एक रिसर्च प्रीव्यू अब Max, Team और Enterprise यूज़र्स के लिए उपलब्ध है।

Claude Opus 4.6 आज claude.ai पर API के ज़रिए और सभी प्रमुख क्लाउड प्लेटफ़ॉर्म पर उपलब्ध है, जिसमें कीमत $5 और $25 प्रति मिलियन इनपुट और आउटपुट टोकन पर अपरिवर्तित है।

TWN Special