माइक्रोसॉफ्ट ने अपने AI इकोसिस्टम को और सशक्त बनाने के लिए दो नए MAI (Microsoft AI) मॉडल्स के पब्लिक प्रीव्यू पेश किए हैं। ये मॉडल्स खासतौर पर कोपिलट और संबंधित AI अनुभवों को बेहतर बनाने के लिए डिज़ाइन किए गए हैं। MAI-Voice-1 और MAI-1-preview के शुरुआती लॉन्च से माइक्रोसॉफ्ट की उस महत्वाकांक्षा की शुरुआत होती है, जो उपभोक्ता-केंद्रित AI सिस्टम बनाने की है, जो टेक्स्ट और वॉइस दोनों माध्यमों में इंटरैक्शन को बदल सकते हैं।
MAI-Voice-1 माइक्रोसॉफ्ट का पहला मॉडल है जो उच्च गुणवत्ता वाली अभिव्यक्तिपूर्ण वॉइस जनरेशन Expressive voice generation के लिए बनाया गया है। यह मॉडल रीयल-टाइम में जीवंत ऑडियो उत्पन्न कर सकता है। कंपनी के अनुसार:
यह एक सेकंड से भी कम समय में एक मिनट तक का ऑडियो जनरेट कर सकता है।
सिंगल और मल्टी-स्पीकर सेटअप को सपोर्ट करता है, जिससे यह conversational AI के लिए आदर्श है।
पॉडकास्ट, इंटरैक्टिव स्टोरीटेलिंग और AI companions के लिए उच्च गुणवत्ता वाली ऑडियो प्रदान करता है।
MAI-Voice-1 वर्तमान में Copilot Daily और Copilot Podcasts में फीचर्स को पावर करता है।
Copilot Labs में इसका इस्तेमाल किया जा सकता है, जैसे:
इंटरैक्टिव “choose your own adventure” कहानियाँ
Guided meditation
वॉइस-आधारित AI companions
माइक्रोसॉफ्ट का कहना है कि MAI-Voice-1 दिखाता है कि वॉइस AI के साथ इंटरैक्शन का मुख्य माध्यम बन सकती है, जिससे अनुभव और अधिक प्राकृतिक और immersive बनते हैं।
MAI-1-preview लगभग 15,000 NVIDIA H100 GPUs पर प्रशिक्षित मिश्रित विशेषज्ञ मॉडल है।
यह टेक्स्ट-बेस्ड इंस्ट्रक्शंस को सही तरीके से फॉलो कर सकता है।
Copilot टेक्स्ट इंटरैक्शन को बेहतर बनाता है।
LMArena जैसी प्लेटफॉर्म के माध्यम से कम्युनिटी-ड्रिवन टेस्टिंग के लिए उपयोग किया जा सकता है।
फिलहाल यह मॉडल केवल विश्वसनीय टेस्टर्स और कुछ चुनिंदा यूजर्स के लिए उपलब्ध है।
माइक्रोसॉफ्ट उपयोगकर्ताओं के फीडबैक के आधार पर मॉडल को और बेहतर बनाने की योजना बना रहा है।
MAI मॉडल्स केवल पहले कदम हैं।
Microsoft ने GB200 क्लस्टर तैयार किया है, जो बड़े पैमाने पर AI मॉडल ट्रेनिंग और डिप्लॉयमेंट के लिए सक्षम है।
इन-हाउस AI मॉडल
पार्टनर टेक्नोलॉजीज़
ओपन-सोर्स इनोवेशन
इस संयोजन से Copilot और संबंधित एप्लिकेशन हर दिन लाखों इंटरैक्शन को बेहतर बना सकते हैं।
कंटेंट क्रिएटर्स पॉडकास्ट और स्टोरीटेलिंग में वॉइस का इस्तेमाल कर सकते हैं।
डेवलपर्स टेक्स्ट और वॉइस आधारित AI एप्स में प्रयोग कर सकते हैं।
एंटरप्राइजेज दैनिक वर्कफ़्लो में AI को इंटीग्रेट कर सकते हैं।
MAI-Voice-1 और MAI-1-preview का लॉन्च AI-पावर्ड प्रोडक्टिविटी टूल्स के विकास में महत्वपूर्ण कदम है।
यह मॉडल एक्सप्रेसिव स्पीच और उन्नत इंस्ट्रक्शन-फॉलोइंग को सक्षम बनाता है।
स्केलेबल कंप्यूटिंग इंफ्रास्ट्रक्चर से यह उपभोक्ता और एंटरप्राइज दोनों जरूरतों के लिए तैयार है।
टेस्टिंग और यूजर फीडबैक के साथ, Copilot और अधिक सक्षम होगा, जिससे प्राकृतिक मानव इंटरैक्शन और AI सहायता के बीच का अंतर कम होगा।