News In Brief Technology and Gadgets
News In Brief Technology and Gadgets

OpenAI ने API में विज़न के साथ GPT-4 टर्बो लॉन्च किया

Share Us

125
OpenAI ने API में विज़न के साथ GPT-4 टर्बो लॉन्च किया
11 Apr 2024
8 min read

News Synopsis

ओपनएआई OpenAI ने पिछले साल अपना सबसे शक्तिशाली बड़े भाषा मॉडल GPT-4 पेश किया था। एलएलएम को अपने पूर्ववर्ती जीपीटी-3.5 की तुलना में एक महत्वपूर्ण प्रगति करार दिया गया था। इसके अनावरण पर ओपनएआई ने विभिन्न परीक्षाओं में प्रभावशाली प्रदर्शन दिखाते हुए मॉडल की क्षमताओं का विवरण साझा किया। GPT-4 ने एलएसएटी, एसएटी गणित, जीआरई क्वांटिटेटिव और जीआरई मौखिक और लेखन जैसी परीक्षाओं में उल्लेखनीय प्रतिशत हासिल किया। और OpenAI ने लाखों घंटों के YouTube वीडियो के व्यापक डेटा का उपयोग करके एलएलएम का प्रशिक्षण दिया। अब सैम ऑल्टमैन के नेतृत्व वाली कंपनी ने GPT-4 के लिए एक और अपग्रेड की घोषणा की है।

OpenAI ने अपने लेटेस्ट AI मॉडल GPT-4 Turbo में एक बड़े सुधार की घोषणा की। एआई मॉडल अब कंप्यूटर विज़न क्षमताओं के साथ आता है, जो इसे मल्टीमीडिया इनपुट को संसाधित करने और विश्लेषण करने की अनुमति देता है। यह किसी छवि, वीडियो और बहुत कुछ के बारे में प्रश्नों का उत्तर दे सकता है। कंपनी ने कई एआई टूल्स पर भी प्रकाश डाला जो विजन के साथ जीपीटी-4 टर्बो द्वारा संचालित हैं, जिनमें एआई कोडिंग असिस्टेंट डेविन और हेल्थीफाई का स्नैप फीचर शामिल है। पिछले हफ्ते AI फर्म ने एक नया फीचर पेश किया जो यूजर्स को ChatGPT के भीतर DALL-E 3 उत्पन्न छवियों को संपादित करने की अनुमति देगी।

यह घोषणा ओपनएआई डेवलपर्स के आधिकारिक अकाउंट द्वारा की गई थी, जिसमें एक एक्स पोस्ट में कहा “विजन के साथ जीपीटी -4 टर्बो अब आम तौर पर एपीआई में उपलब्ध है। विज़न अनुरोध अब JSON मोड और फ़ंक्शन कॉलिंग का भी उपयोग कर सकते हैं।" और बाद में OpenAI के एक्स अकाउंट से यह भी पता चला कि यह फीचर अब API में उपलब्ध है, और इसे ChatGPT में रोल आउट किया जा रहा है।

विज़न के साथ GPT-4 टर्बो अनिवार्य रूप से GPT-4 फाउंडेशन मॉडल है, जिसमें टर्बो मॉडल के साथ उच्च टोकन आउटपुट पेश किए गए हैं, और यह अब मल्टीमीडिया फ़ाइलों का विश्लेषण करने के लिए बेहतर कंप्यूटर विज़न के साथ आता है। दृष्टि क्षमताओं का उपयोग विभिन्न तरीकों से किया जा सकता है। उदाहरण के लिए अंतिम यूजर्स चैटजीपीटी पर ताज महल की एक छवि अपलोड करके इस क्षमता का उपयोग कर सकता है, और यह बताने के लिए कह सकता है, कि इमारत किस सामग्री से बनी है। डेवलपर्स इसे एक कदम आगे ले जा सकते हैं, और विशिष्ट उद्देश्यों के लिए अपने टूल में क्षमता को बेहतर बना सकते हैं।

OpenAI ने कहा कॉग्निशन एआई का डेविन चैटबॉट जो एक एआई-संचालित कोडिंग सहायक है, प्रोग्राम बनाने के लिए जटिल कोडिंग कार्यों और इसके सैंडबॉक्स वातावरण को देखने के लिए विजन के साथ जीपीटी -4 टर्बो का उपयोग करता है।

इसी तरह भारतीय कैलोरी ट्रैकिंग और पोषण फीडबैक प्लेटफॉर्म हेल्थीफाई में स्नैप नामक एक फीचर है, जहां यूजर्स किसी खाद्य पदार्थ या व्यंजन की तस्वीर क्लिक कर सकते हैं, और प्लेटफॉर्म उसमें संभावित कैलोरी का खुलासा करता है। विजन की क्षमताओं के साथ जीपीटी-4 टर्बो के साथ अब यह यह भी सिफारिश करता है, कि यूजर्स को अतिरिक्त कैलोरी जलाने के लिए क्या करना चाहिए या भोजन में कैलोरी कम करने के तरीके क्या हैं।

बेहतर एआई मॉडल में 128,000 टोकन की संदर्भ विंडो है, और इसे दिसंबर 2023 तक डेटा पर प्रशिक्षित किया गया है।

TWN Special