Google ने ऑफ़लाइन AI डिक्टेशन ऐप लॉन्च किया

Share Us

108
Google ने ऑफ़लाइन AI डिक्टेशन ऐप लॉन्च किया
20 May 2026
7 min read

News Synopsis

Latest Update

Google ने “Audio Glasses” लॉन्च किए, Meta के Ray-Ban स्मार्ट ग्लासेस को देगी टक्कर

Google ने अपने नए “Audio Glasses” का डिजाइन पेश किया है, जिससे वह स्मार्ट वियरबल्स के क्षेत्र में एक बार फिर वापसी कर रहा है। यह कदम सीधे तौर पर Meta के Ray-Ban स्मार्ट ग्लासेस को चुनौती देने के लिए उठाया गया है, जिनकी बिक्री लाखों यूनिट्स में हो चुकी है।

एक दशक बाद स्मार्ट ग्लासेस मार्केट में Google की वापसी

Google ने लगभग एक दशक बाद स्मार्ट वियरबल ग्लासेस मार्केट में दोबारा एंट्री की है, और अपने नए “Audio Glasses” लॉन्च किए हैं।

यह वापसी इसलिए भी महत्वपूर्ण है, क्योंकि कंपनी ने 2013 में Google Glass के जरिए इस क्षेत्र में कदम रखा था, लेकिन गोपनीयता (privacy) और सीमित उपयोगिता के कारण इसे बंद करना पड़ा था।

अब कंपनी नए डिजाइन, बेहतर उपयोगिता और आर्टिफिशियल इंटेलिजेंस (AI) इंटीग्रेशन के साथ वापसी कर रही है।

Google के नए “Audio Glasses” क्या हैं?

यह स्मार्ट ग्लासेस हल्के और रोजमर्रा के उपयोग के लिए बनाए गए हैं, जिनमें कई आधुनिक फीचर्स शामिल हैं।

मुख्य फीचर्स:

  • कॉल और वॉइस इनपुट के लिए माइक्रोफोन
  • ऑडियो प्लेबैक के लिए छोटा स्पीकर
  • फोटो और वीडियो के लिए कैमरा
  • Gemini AI असिस्टेंट सपोर्ट
  • म्यूजिक और हैंड्स-फ्री कम्युनिकेशन

इन ग्लासेस की मदद से यूजर्स बिना मोबाइल छुए कॉल कर सकेंगे, म्यूजिक सुन सकेंगे और AI से बातचीत कर सकेंगे।

Meta के साथ सीधी टक्कर

Google का यह लॉन्च उसे सीधे के मुकाबले खड़ा करता है, जिसने Ray-Ban स्मार्ट ग्लासेस के जरिए इस बाजार में मजबूत पकड़ बनाई है।

Meta के स्मार्ट ग्लासेस अब तक 70 लाख से अधिक यूनिट्स बेच चुके हैं, जिससे वह इस सेगमेंट में लीडर बन चुका है।

Google की एंट्री से स्मार्ट ग्लासेस की प्रतिस्पर्धा और तेज होने की उम्मीद है।

प्रमुख आईवियर ब्रांड्स के साथ साझेदारी

Google ने अपने नए ग्लासेस को स्टाइलिश और आकर्षक बनाने के लिए दो प्रमुख ब्रांड्स के साथ साझेदारी की है:

  • अमेरिकी ब्रांड Warby Parker
  • दक्षिण कोरियाई डिजाइनर Gentle Monster

इसका उद्देश्य तकनीक के साथ फैशन को जोड़कर यूजर्स को आकर्षित करना है।

तकनीकी विकास में Samsung की भूमिका

इन स्मार्ट ग्लासेस के तकनीकी विकास में Samsung ने महत्वपूर्ण भूमिका निभाई है।

यह डिवाइस Android और Apple दोनों स्मार्टफोन के साथ काम करेगा, जिससे इसका उपयोग और आसान हो जाएगा।

Gemini AI का इंटीग्रेशन

Google के नए ग्लासेस की सबसे बड़ी खासियत Gemini AI असिस्टेंट का इंटीग्रेशन है।

यूजर्स AI की मदद से:

  • सवाल पूछ सकेंगे
  • रियल-टाइम जानकारी पा सकेंगे
  • बातचीत का अनुवाद कर सकेंगे
  • वॉइस कमांड से काम कर सकेंगे

यह फीचर Google के स्मार्ट ग्लासेस को और अधिक एडवांस बनाता है।

Google Glass से मिली सीख

2013 में लॉन्च हुए Google Glass को प्राइवेसी और सीमित उपयोगिता के कारण बाजार में सफलता नहीं मिली थी।

उस समय लोगों ने कैमरा और निगरानी से जुड़ी चिंताओं को लेकर विरोध किया था।

इस बार कंपनी डिजाइन और यूजर एक्सपीरियंस पर ज्यादा ध्यान दे रही है।

प्राइवेसी को लेकर अभी भी चुनौतियां

हालांकि सुधार किए गए हैं, लेकिन कैमरा आधारित स्मार्ट ग्लासेस को लेकर प्राइवेसी चिंताएं अभी भी बनी हुई हैं।

मुख्य चिंताएं:

  • बिना अनुमति रिकॉर्डिंग का खतरा
  • डेटा सुरक्षा
  • निगरानी (surveillance)
  • सार्वजनिक स्वीकार्यता

Google ने अभी इन मुद्दों पर पूरी तकनीकी जानकारी साझा नहीं की है।

भविष्य की योजना: डिस्प्ले वाले स्मार्ट ग्लासेस

Google केवल ऑडियो ग्लासेस तक सीमित नहीं है, बल्कि वह डिस्प्ले वाले स्मार्ट ग्लासेस पर भी काम कर रहा है।

यह नया वर्जन Meta के आने वाले एडवांस मॉडल्स को टक्कर देगा।

हालांकि इसकी लॉन्च टाइमलाइन अभी घोषित नहीं की गई है।

स्मार्ट ग्लासेस मार्केट का भविष्य

स्मार्ट ग्लासेस मार्केट तेजी से बढ़ रहा है, जिसका कारण है:

  • AI तकनीक का विकास
  • हैंड्स-फ्री डिवाइस की मांग
  • AR (Augmented Reality) का विस्तार
  • वियरेबल टेक्नोलॉजी की लोकप्रियता

Google की एंट्री से इस सेक्टर में प्रतिस्पर्धा और बढ़ेगी।

निष्कर्ष:

Google का “Audio Glasses” लॉन्च स्मार्ट वियरेबल टेक्नोलॉजी में उसकी बड़ी वापसी है।

यह सीधे तौर पर Meta को चुनौती देता है और आने वाले समय में दोनों कंपनियों के बीच कड़ी प्रतिस्पर्धा देखने को मिलेगी।

AI, डिजाइन और उपयोगिता के आधार पर यह बाजार भविष्य में तेजी से विकसित होने की संभावना रखता है।

Previous Update

Google ने एक नया iOS ऐप लॉन्च करके तेज़ी से विकसित हो रहे AI ट्रांसक्रिप्शन क्षेत्र में कदम रखा है। यह ऐप बिना इंटरनेट कनेक्शन के भी काम करने के लिए डिज़ाइन किया गया है। Google AI Edge Eloquent नाम का यह ऐप Edge AI पर कंपनी के बढ़ते फोकस को दर्शाता है, इसमें प्रोसेसिंग पूरी तरह से क्लाउड इंफ्रास्ट्रक्चर पर निर्भर रहने के बजाय सीधे डिवाइस पर ही होती है।

ऑफ़लाइन-फर्स्ट AI अनुभवों की ओर एक बदलाव

पारंपरिक स्पीच-टू-टेक्स्ट टूल्स के विपरीत, जो क्लाउड प्रोसेसिंग पर बहुत ज़्यादा निर्भर रहते हैं, Eloquent को ऑफ़लाइन-फर्स्ट आर्किटेक्चर के आधार पर बनाया गया है। एक बार जब यूज़र्स ज़रूरी AI मॉडल्स डाउनलोड कर लेते हैं, तो यह ऐप बोली गई बातों को स्थानीय रूप से (लोकल तौर पर) ट्रांसक्राइब कर सकता है, जिससे कम कनेक्टिविटी वाले माहौल में भी इसकी पहुँच सुनिश्चित होती है। यह तरीका प्राइवेसी-सेंट्रिक और लेटेंसी-फ्री AI एप्लीकेशन की तरफ इंडस्ट्री के बड़े पुश के साथ मेल खाता है।

यह ऐप जेम्मा मॉडल्स से चलने वाली एडवांस्ड स्पीच रिकग्निशन क्षमताओं का इस्तेमाल करता है। ये ऑन-डिवाइस मॉडल नैचुरल स्पीच पैटर्न को समझने के लिए डिज़ाइन किए गए हैं, साथ ही प्रोसेसिंग में देरी को कम करते हैं, जिससे रियल-टाइम डिक्टेशन ज़्यादा स्मूद और ज़्यादा रिस्पॉन्सिव हो जाता है।

रॉ स्पीच से रिफाइंड टेक्स्ट तक

एलोक्वेंट को स्टैंडर्ड डिक्टेशन टूल्स से जो बात अलग बनाती है, वह है बोले गए इनपुट को समझदारी से रिफाइंड करने की इसकी क्षमता। पॉज़ और वर्बल फिलर्स से भरे लिटरल ट्रांसक्रिप्ट बनाने के बजाय, ऐप ऑटोमैटिकली झिझक हटाकर और क्लैरिटी के लिए सेंटेंस को रीस्ट्रक्चर करके आउटपुट को क्लीन कर देता है।

यूज़र्स को अपनी ट्रांसक्रिप्ट को बिल्ट-इन ट्रांसफ़ॉर्मेशन ऑप्शन का इस्तेमाल करके रीशेप करने की फ़्लेक्सिबिलिटी भी दी जाती है, जैसे कि खास पॉइंट्स को समराइज़ करना, टोन को फ़ॉर्मल के हिसाब से एडजस्ट करना, या कंटेंट को बड़ा और छोटा करना। यह ऐप को सिर्फ़ एक ट्रांसक्रिप्शन टूल से कहीं ज़्यादा बनाता है, और इसे एक हल्के AI राइटिंग असिस्टेंट में बदल देता है।

जब क्लाउड मोड चालू होता है, तो एलोक्वेंट ज़्यादा एडवांस्ड टेक्स्ट प्रोसेसिंग के लिए गूगल जेमिनी का इस्तेमाल करता है। हालांकि यूज़र्स के पास पूरी तरह से लोकल मोड पर स्विच करने का पूरा कंट्रोल रहता है, जिससे डेटा प्राइवेसी मज़बूत होती है, और बाहरी सर्वर पर निर्भरता कम होती है।

पर्सनलाइज़्ड और कॉन्टेक्स्ट-अवेयर डिक्टेशन

एक्यूरेसी बढ़ाने के लिए ऐप कस्टम वोकैबुलरी इनपुट को सपोर्ट करता है, जिससे यूज़र डोमेन-स्पेसिफिक टर्मिनोलॉजी, नाम या अक्सर इस्तेमाल होने वाले फ्रेज़ जोड़ सकते हैं। यह ऑप्शनल तौर पर Gmail जैसे लिंक्ड अकाउंट्स से कॉन्टेक्स्चुअल क्यूज़ भी ले सकता है, जिससे पर्सनल या प्रोफेशनल भाषा पैटर्न की ज़्यादा सटीक पहचान हो सके।

ट्रांसक्रिप्शन के अलावा Eloquent प्रोडक्टिविटी पर केंद्रित कई फ़ीचर्स पेश करता है, जिनमें खोजने लायक हिस्ट्री, सेशन ट्रैकिंग और बोलने की गति व कुल शब्दों की संख्या जैसी परफ़ॉर्मेंस से जुड़ी जानकारी शामिल है। ये बदलाव एनालिटिक्स-ड्रिवन कम्युनिकेशन टूल्स की ओर बढ़ने का संकेत देते हैं।

कॉम्पिटिटिव माहौल और आगे क्या होगा

इस लॉन्च के साथ गूगल एक कॉम्पिटिटिव जगह में आ रहा है, जहाँ अभी Wispr Flow और SuperWhisper जैसे AI-नेटिव डिक्टेशन प्लेटफॉर्म हैं। हालांकि ऑफ़लाइन फ़ंक्शनैलिटी और डीप इकोसिस्टम इंटीग्रेशन पर इसका ज़ोर एक अलग फ़ायदा दे सकता है, खासकर उन यूज़र्स के लिए जो प्राइवेसी और आसान क्रॉस-डिवाइस एक्सपीरियंस को प्राथमिकता देते हैं।

हालांकि यह ऐप अभी सिर्फ़ iOS तक ही सीमित है, लेकिन Android के साथ इसकी कम्पैटिबिलिटी के संकेत बताते हैं, कि जल्द ही इसे और बड़े पैमाने पर लॉन्च किया जा सकता है। Android इकोसिस्टम पर Google के कंट्रोल को देखते हुए, इसमें और ज़्यादा गहराई से इंटीग्रेशन—शायद कीबोर्ड या सिस्टम लेवल पर—इसके दायरे को काफ़ी हद तक बढ़ा सकता है।

Voice Interfaces के भविष्य की एक झलक

Eloquent का लॉन्च इस बात का संकेत है, कि यूज़र्स अब डिवाइस के साथ किस तरह इंटरैक्ट करते हैं, उसमें एक बड़ा बदलाव आ रहा है। जैसे-जैसे AI मॉडल्स ज़्यादा कुशल होते जा रहे हैं, और लोकल लेवल पर काम करने में सक्षम होते जा रहे हैं, बोलने और स्ट्रक्चर्ड कंटेंट के बीच की सीमा धुंधली होती जा रही है।

Google के लिए यह प्रयोग सिर्फ़ एक अलग ऐप से कहीं ज़्यादा है। यह अगली पीढ़ी के Voice Interfaces के लिए एक टेस्टिंग ग्राउंड का काम करता है, जो आखिरकार इस बात को पूरी तरह से बदल सकता है, कि यूज़र्स ईमेल कैसे लिखते हैं, डॉक्यूमेंट्स कैसे तैयार करते हैं, और डिजिटल प्लेटफ़ॉर्म पर एक-दूसरे से कैसे बातचीत करते हैं।

अगर यह सफल होता है, तो Eloquent के पीछे की टेक्नोलॉजी जल्द ही Android के और भी बड़े अनुभवों का हिस्सा बन सकती है, यह एक ऐसे भविष्य का संकेत है, जहाँ स्वाभाविक रूप से बोलना ही बेहतरीन और प्रोफ़ेशनल कंटेंट बनाने का सबसे कुशल तरीका बन जाएगा।

TWN Opinion