टॉक टू मी कंप्यूटर: वॉयस कंट्रोल चल रहा है I

अगर अप्रत्याशित पैकेज आपके दरवाजे पर दिखना शुरू हो जाएंगे, तो हो सकता है कि आप अपने स्मार्ट उपकरणों में से एक के साथ एक शब्द चाहते हों।

इस महीने की शुरुआत में, डलास में एक छह वर्षीय अपने परिवार से पूछा अमेज़न इको एक गुड़ियाघर के लिए स्मार्ट स्पीकर और अलेक्सा, अमेज़ॅन की सिरी जैसी कृत्रिम सहायक, तुरंत एक को उनके घर का आदेश दिया.

एक सैन डिएगो टीवी समाचार शो ने कहानी को उठाया और अनजाने में इसे दोहराया जब समाचार एंकरों में से एक ने टिप्पणी की: "मुझे छोटी लड़की से प्यार है, कह रही है 'एलेक्सा ने मुझे एक गुड़ियाघर का आदेश दिया।' 'इस पर झुंझलाकर, कई अन्य अमेज़ॅन उपकरणों के घरों में सैन डिएगो अधिक गुड़ियाघर खरीदने का प्रयास किया.

एलेक्सा की आकस्मिक गुड़ियाघर खरीद पर CW6 सैन डिएगो समाचार रिपोर्ट

{यूट्यूब}oI2KLIULjXc{/youtube}

कहानी किसी से परिचित हो सकती है, जिन्होंने ऐप्पल की सिरी या माइक्रोसॉफ्ट के कॉरटाना के साथ बातचीत करने की कोशिश की है। हमारे डिवाइस हमारे सुनने में काफी अच्छा हो गए हैं, लेकिन इसका हमेशा मतलब नहीं होता कि वे समझते हैं।

माइक्रोसॉफ्ट के शोधकर्ताओं ने हाल ही में आज की बात कर रहे इंटरफेस के साथ एक संभावित समस्या के रूप में इसे चिह्नित किया है: चतुर चुटकुले और सांसारिक ज्ञान के साथ, उन्हें "बुद्धिमान" सहायकों के रूप में विपणन किया जाता है, फिर भी वे अक्सर आम भावना की कमी के साथ हमें निराश करते हैं


आंतरिक सदस्यता ग्राफिक


में छोटे अध्ययन, शोधकर्ताओं ने पाया कि जिन लोगों ने समय के साथ अपने डिजिटल सहायकों से बात करना जारी रखा वे सबसे कम उम्मीदों के साथ शुरू कर चुके थे।

एक आवाज इंटरफ़ेस वास्तव में क्या करता है?

जब आप किसी ध्वनि इंटरफ़ेस से बात करते हैं, तो उसके लिए:

  • अपनी आवाज की आवाज़ "सुन", और पृष्ठभूमि शोर से अलग
  • पता करें कि प्रत्येक शब्द कब शुरू होता है और समाप्त होता है, अपने "umms" और "आह"
  • शब्दकोश में शब्द के प्रत्येक शब्द की आवाज़ से मेल खाती है, अगर संदर्भ में से एक का चयन करें होमोफोन्स
  • ठीक से पूरे वाक्य के अर्थ की व्याख्या
  • आपके अनुरोध से मेल खाने वाली एक सार्थक और उपयोगी प्रतिक्रिया उत्पन्न करें

इनमें से प्रत्येक एक जटिल तकनीकी चुनौती है, और विभिन्न प्रौद्योगिकी कंपनियों ने विभिन्न क्षेत्रों में प्रगति की है।

Google अब विस्तृत अनुरोधों के लिए प्रासंगिक प्रतिक्रिया देने में अच्छा है क्योंकि Google सेवाओं का उपयोग करते हुए Google के वेब के बारे में डेटा और आपके व्यक्तिगत गतिविधियों से लाभ मिलता है।

अमेज़ॅन इको विशेष रूप से एक शोर कमरे में से आपके अनुरोधों को सुनने में अच्छा है, एक शोर-रद्दी दूर-क्षेत्र माइक्रोफ़ोन सरणी के लिए धन्यवाद। बेशक, यह अमेज़ॅन के माध्यम से खरीदारी करने में भी अच्छा है।

पिछले कुछ वर्षों में, केवल स्टील्ड किए गए और ध्यान से शब्दों के आदेशों की बजाय हर रोज़ या "प्राकृतिक" भाषण को समझने में ध्वनि इंटरफेस बेहतर हो गए हैं। वे अभी भी सरल प्रश्नों को संभालने में बेहतर हैं, जैसे "जो ऑस्ट्रेलियाई ओपन में खेल रहे हैं?" और अधिक जटिल अनुरोधों के साथ संघर्ष करते हैं, जैसे "इस साल पहली बार ऑस्ट्रेलियाई ओपन में कौन खेल रहा है?", और अनुवर्ती प्रश्न, जैसे "क्या फाइनल के दौरान बारिश होगी?"

स्थिति अंग्रेजी के अलावा अन्य भाषाओं के लिए और भी मिश्रित है: जबकि सिरी 40 भाषाओं और बोलियों से अधिक का समर्थन करती है, अब तक एलेक्सा केवल अंग्रेजी और जर्मन में उपलब्ध है। लेकिन इन सभी सुविधाओं में तेजी से सुधार कर रहे हैं।

कहां आवाज इंटरफेस हकलाना

तो ध्वनि इंटरफेस जल्द ही हमारी सभी तकनीक पर ले जाएगा, जैसा कि फिल्म में अनुमान लगाया गया है उसके? गार्टनर, एक प्रौद्योगिकी अनुसंधान फर्म, पूर्वानुमान किया है कि अगले वर्ष तक, प्रौद्योगिकी के साथ हमारी बातचीत का 30% आवाज-सक्षम इंटरफेस के साथ बातचीत होगी।

लेकिन आवाज इंटरफेस में सीमाएं हैं, और इन सभी को बेहतर तकनीक द्वारा हल नहीं किया जा सकता है।

आवाज स्पाइक जोंज़ की फिल्म में उसे प्रौद्योगिकी के साथ इंटरफ़ेसिंग का एक केंद्रीय माध्यम है

{यूट्यूब}ne6p6MfLBxc{/youtube}

शोर प्रदूषण एक प्रमुख बाधा है क्या आप अपने आस-पास के पृष्ठभूमि शोर से क्या कह रहे हैं, क्या आपकी डिवाइस अलग हो सकती है? प्रौद्योगिकी उस के साथ, शोर में कमी, व्यक्तिगत आवाज पहचान और होंठ पढ़ने सहित मदद कर सकता है।

लेकिन आप अपने स्मार्ट डिवाइस से बात कर दूसरों के लिए जो पृष्ठभूमि शोर बना रहे हैं, उसके बारे में क्या? कल्पना करें कि आपके पास दफ्तर में बैठे व्यक्ति - या किसी हवाई जहाज पर - जब आप पढ़ने की कोशिश कर रहे हैं, तो सिरी से बातें कर रहे हैं, और आप देख सकते हैं कि ध्वनि इंटरफेस हमेशा सामाजिक रूप से स्वीकार्य नहीं क्यों हो सकते हैं।

मुद्दों का एक और सेट आवाज इंटरफेस की मानसिक मांगों से आता है। वॉयस-आधारित सिस्टम का उपयोग करना सीखना कठिन हो सकता है, विशेषकर अगर कोई स्क्रीन नहीं है, जैसे कि अमेज़ॅन इको

अगर आपने कभी बैंक या टेलिफोन कंपनी को बुलाया है, तो आप एकाग्रता और ऊब के दुखी संगति को जानते हैं जो एक सिंथेसाइज्ड वॉयस सूची को आपके सभी विकल्पों से सुनने से आता है, जब आप एक की जरूरत के लिए इंतजार करते हैं और उन्हें मिश्रण न करने का प्रयास करते हैं अप। पारंपरिक ग्राफिकल इंटरफेस आपको उपलब्ध विकल्पों को दिखाकर इस समस्या से बचते हैं और आपको अपनी पसंद को जल्दी से टैप करते हैं।

जब आप वॉयस कमांड सीखते हैं, तो उनका उपयोग करके ध्यान भंग हो सकता है। शोधकर्ताओं ने पाया है कि आवाज आज्ञाएं अपनी ट्रेन के विचार को पटरी से उतरना एक माउस और कीबोर्ड से अधिक

यह विशेष रूप से इन-कार वाइस इंटरफेस के लिए खतरनाक है: युटा विश्वविद्यालय से अध्ययन की एक जोड़ी ने पाया कि चालक थे 27 सेकंड तक के लिए विचलित आवाज आज्ञाओं का उपयोग करने के बाद

यूनिवर्सिटी ऑफ यूटा / एएए फाउंडेशन फॉर ट्रैफिक सेफ्टी रिसर्च ऑन डायरेक्टर विरक्ति।

{vimeo}108281698{/vimeo}

इसकी आवाज ढूँढना?

इसलिए ध्वनि इंटरफेस पूरी तरह से लेने की संभावना नहीं है, लेकिन वे हमारे जीवन में उपयोगी संख्या पाएंगे। वे कारों में पहले से ही सामान्य हैं, जहां तक ​​तकनीकी रूप से सुधार होने पर उन्हें कम ध्यान नहीं दिया जाएगा।

रसोई में, आप एलेक्सा से नुस्खा के बारे में बात कर सकते हैं या अपनी शॉपिंग सूची को अपडेट कर सकते हैं, जबकि आपके हाथ व्यस्त खाना बनाती हैं आभासी और संवर्धित वास्तविकता में, ध्वनि इंटरफेस आपको सिस्टम को नियंत्रित करने दे सकते हैं जब आप अपने हाथ बिल्कुल नहीं देख सकते।

भाषा सीखने में, उनका उच्चारण उच्चारण करने के लिए इस्तेमाल किया जा सकता है सबसे महत्वपूर्ण बात, आवाज़ इंटरफेस उपयोगकर्ताओं को अपने विकलांगों पर काबू पाने के लिए मोटर विकार, आरएसआई या डिस्लेक्सिया की मदद करते हैं।

वॉयस इंटरफेस एक लंबे समय से प्रतीक्षित तकनीक हैं, और यह सोचने के लिए अच्छे कारण हैं कि उनका समय आ गया है। बस याद रखें कि वे अभी तक के रूप में चालाक नहीं हो सकता है क्योंकि वे ध्वनि और यदि आप बच्चों के आस-पास हैं तो आप वॉयस खरीद पर एक पिन कोड डाल सकते हैं।

वार्तालाप

के बारे में लेखक

फ्रेजर एलिसन, मानव कम्प्यूटर इंटरेक्शन में पीएचडी उम्मीदवार, यूनिवर्सिटी ऑफ मेलबॉर्न

यह आलेख मूलतः पर प्रकाशित हुआ था वार्तालाप। को पढ़िए मूल लेख.

संबंधित आइटम

{amazonWS: searchindex = KindleStore; कीवर्ड = AmazonEcho" लक्ष्य = "_ खाली" rel = "nofollow noopener"> इनरसेल्फ़ मार्केट और अमेज़न