Google ने Gemma 4 लॉन्च किया है, जो उसके ओपन-सोर्स AI मॉडल परिवार का सबसे नया और सबसे काबिल वर्शन है। कंपनी का कहना है, कि ये नए मॉडल सबसे ऊँचे दर्जे की आर्टिफिशियल इंटेलिजेंस (AI) को हर जगह के डेवलपर्स तक पहुँचाने की दिशा में एक बड़ा कदम हैं: फिर चाहे वे शक्तिशाली डेटा सेंटर वर्कस्टेशन हों या आपकी जेब में रखा स्मार्टफोन। Google का दावा है, कि जब से उसने Gemma की पहली पीढ़ी लॉन्च की है, तब से डेवलपर्स ने इसे 40 करोड़ से ज़्यादा बार डाउनलोड किया है, जिससे एक ऐसा कम्युनिटी इकोसिस्टम तैयार हुआ है, जिसमें Google के आधार पर बने 1 लाख से ज़्यादा मॉडल वर्शन शामिल हैं।
Google के CEO Sundar Pichai ने कहा कि इन मॉडल्स में "हर पैरामीटर के हिसाब से ज़बरदस्त इंटेलिजेंस" है, जबकि Google DeepMind के चीफ़ एग्ज़ीक्यूटिव ने Gemma 4 को "अपने-अपने साइज़ के हिसाब से दुनिया के सबसे बेहतरीन ओपन मॉडल्स" बताया।
सुंदर पिचाई ने कहा “Gemma 4 आ गया है, और इसमें हर पैरामीटर के हिसाब से ज़बरदस्त इंटेलिजेंस है।” डेमिस हसाबिस ने कहा “Gemma 4 को लॉन्च करते हुए बहुत उत्साहित हूँ: यह अपने-अपने साइज़ के हिसाब से दुनिया के सबसे बेहतरीन ओपन मॉडल हैं। ये 4 साइज़ में उपलब्ध हैं, जिन्हें आप अपने खास काम के लिए फ़ाइन-ट्यून कर सकते हैं: बेहतरीन रॉ परफ़ॉर्मेंस के लिए 31B dense, कम लेटेंसी के लिए 26B MoE, और एज डिवाइस पर इस्तेमाल के लिए असरदार 2B और 4B – तो अब बेझिझक बनाना शुरू करें!”
Gemma 4 अब Apache 2.0 लाइसेंस के तहत उपलब्ध है, जिसका मतलब है, कि डेवलपर्स इसका इस्तेमाल, इसमें बदलाव और इस पर आधारित काम बिना किसी रोक-टोक के कर सकते हैं।
Google, Gemma 4 को चार साइज़ में रिलीज़ कर रहा है, जिन्हें मोबाइल डिवाइस से लेकर हाई-एंड डेवलपर मशीनों तक—हर चीज़ को कवर करने के लिए डिज़ाइन किया गया है।
> E2B (Effective 2 Billion parameters) — फ़ोन और IoT डिवाइस के लिए बनाया गया।
> E4B (Effective 4 Billion parameters) — एज और मोबाइल इस्तेमाल के लिए भी ऑप्टिमाइज़ किया गया है।
> 26B मिक्सचर ऑफ़ एक्सपर्ट्स (MoE) — एक मिड-रेंज पावरहाउस।
> 31B Dense — फ्लैगशिप, जो अभी इंडस्ट्री-स्टैंडर्ड Arena AI लीडरबोर्ड पर दुनिया के सभी ओपन AI मॉडल्स में #3 रैंक पर है।
वह आखिरी आंकड़ा विशेष रूप से चौंकाने वाला है। कहा जाता है, कि 31B मॉडल ने अपने से 20 गुना बड़े कॉम्पिटिटर से बेहतर परफॉर्म किया है।
गूगल का कहना है, कि जेम्मा 4 बेसिक सवाल-जवाब वाली चैट से कहीं आगे है। इसकी मुख्य क्षमताओं में शामिल हैं:
एडवांस्ड रीज़निंग: यह मॉडल मल्टी-स्टेप प्लानिंग और मुश्किल लॉजिक को हैंडल कर सकता है, साथ ही मैथ और इंस्ट्रक्शन-फॉलोइंग टास्क में भी सुधार किया गया है।
एजेंटिक वर्कफ़्लो: Gemma 4 नेटिवली फ़ंक्शन-कॉलिंग, स्ट्रक्चर्ड डेटा आउटपुट और सिस्टम इंस्ट्रक्शन को सपोर्ट करता है, जिससे डेवलपर्स ऐसे AI एजेंट बना सकते हैं, जो बाहरी टूल्स, APIs और सर्विसेज़ के साथ ऑटोनॉमसली इंटरैक्ट कर सकें।
कोड जेनरेशन: डेवलपर्स Gemma 4 को लोकल मशीन पर पूरी तरह से ऑफ़लाइन चला सकते हैं, जिससे एक स्टैंडर्ड वर्कस्टेशन एक प्राइवेट AI कोडिंग असिस्टेंट बन जाता है।
विज़न और ऑडियो: चारों मॉडल इमेज और वीडियो को मूल रूप से प्रोसेस कर सकते हैं। दो छोटे एज मॉडल स्पीच रिकग्निशन के लिए ऑडियो इनपुट को भी सपोर्ट करते हैं।
लंबे कॉन्टेक्स्ट विंडो: एज मॉडल एक ही प्रॉम्प्ट में 128,000 टोकन तक प्रोसेस कर सकते हैं, जबकि बड़े मॉडल 256,000 टोकन तक जा सकते हैं।
140+ भाषाएँ: आखिर में Gemma 4 को 140 से ज़्यादा भाषाओं में नेटिवली ट्रेन किया गया है, जिससे यह दुनिया भर में मौजूद सबसे ज़्यादा शामिल ओपन मॉडल में से एक बन गया है।
शायद जेम्मा 4 की सबसे अच्छी बात यह है, कि गूगल ने इसे कितना छोटा बनाया है, और साथ ही इसे पावरफुल भी रखा है। The E2B और E4B मॉडल को Google की Pixel टीम, Qualcomm Technologies और MediaTek के साथ मिलकर बिल्कुल नए सिरे से तैयार किया गया है, ये वही कंपनियाँ हैं, जो दुनिया भर में अरबों Android डिवाइस को पावर देने वाली चिप्स बनाती हैं।
इसका नतीजा एक ऐसा मॉडल है, जो फ़ोन Raspberry Pi बोर्ड और Nvidia Jetson हार्डवेयर जैसे रोज़ाना के डिवाइस पर लगभग ज़ीरो लेटेंसी के साथ पूरी तरह ऑफ़लाइन चलता है।
गूगल का कहना है, कि Gemma 4 को उसी वर्ल्ड-क्लास रिसर्च और टेक्नोलॉजी से बनाया गया है, जिससे इसका फ्लैगशिप प्रोप्राइटरी मॉडल Gemini 3 बना है।