शटरस्टॉक/वैलेंटाइन640

1956 में, लंदन की एक साल की लंबी यात्रा के दौरान और अपने 20 के दशक की शुरुआत में, गणितज्ञ और सैद्धांतिक जीवविज्ञानी जैक डी. कोवान ने विल्फ्रेड टेलर और उनके अजीब नए "का दौरा किया।"सीखने की मशीन”। अपने आगमन पर वह "यंत्रों के विशाल भंडार" से चकित हो गया जिसने उसका सामना किया। कोवान केवल खड़े होकर "मशीन को अपना काम करते हुए" देख सकते थे। ऐसा प्रतीत होता है कि यह जो काम कर रहा था वह एक "साहचर्य स्मृति योजना" का प्रदर्शन कर रहा था - ऐसा प्रतीत होता था कि यह कनेक्शन ढूंढने और डेटा पुनर्प्राप्त करने का तरीका सीखने में सक्षम था।

यह तारों और बक्सों के समूह में हाथ से एक साथ मिलाए गए सर्किटरी के भद्दे ब्लॉक की तरह लग सकता है, लेकिन कोवान जो देख रहा था वह तंत्रिका नेटवर्क का एक प्रारंभिक एनालॉग रूप था - आज की सबसे उन्नत कृत्रिम बुद्धिमत्ता का अग्रदूत, जिसमें शामिल है बहुत चर्चा हुई ChatGPT लगभग किसी भी आदेश के जवाब में लिखित सामग्री उत्पन्न करने की अपनी क्षमता के साथ। चैटजीपीटी की अंतर्निहित तकनीक एक तंत्रिका नेटवर्क है।

जब कोवान और टेलर खड़े होकर मशीन को काम करते हुए देख रहे थे, तो उन्हें वास्तव में पता नहीं था कि यह इस कार्य को कैसे पूरा कर रही है। टेलर के रहस्यमय मशीन मस्तिष्क का उत्तर इसके "एनालॉग न्यूरॉन्स" में, इसकी मशीन मेमोरी द्वारा बनाए गए संघों में और, सबसे महत्वपूर्ण बात, इस तथ्य में पाया जा सकता है कि इसकी स्वचालित कार्यप्रणाली को वास्तव में पूरी तरह से समझाया नहीं जा सका है। इन प्रणालियों को अपना उद्देश्य ढूंढने और उस शक्ति को अनलॉक करने में दशकों लगेंगे।

तंत्रिका नेटवर्क शब्द में प्रणालियों की एक विस्तृत श्रृंखला शामिल है, फिर भी केंद्रीय रूप से, आईबीएम के अनुसार, ये "तंत्रिका नेटवर्क - जिन्हें कृत्रिम तंत्रिका नेटवर्क (एएनएन) या सिम्युलेटेड तंत्रिका नेटवर्क (एसएनएन) के रूप में भी जाना जाता है - मशीन लर्निंग का एक उपसमूह हैं और गहन शिक्षण एल्गोरिदम के केंद्र में हैं"। महत्वपूर्ण रूप से, यह शब्द और उनका रूप और "संरचना मानव मस्तिष्क से प्रेरित हैं, जिस तरह से जैविक न्यूरॉन्स एक दूसरे को संकेत देते हैं"।

शुरुआती चरणों में उनके मूल्य के बारे में कुछ संदेह हो सकता है, लेकिन जैसे-जैसे साल बीतते गए एआई फैशन दृढ़ता से तंत्रिका नेटवर्क की ओर बढ़ गया है। अब इन्हें अक्सर एआई का भविष्य समझा जाता है। इनका हम पर और मानव होने के अर्थ पर बड़ा प्रभाव है। हमने सुना है हाल ही में इन चिंताओं की प्रतिध्वनि नए एआई विकास को उनके निहितार्थों में विश्वास सुनिश्चित करने के लिए छह महीने की अवधि के लिए रोकने का आह्वान किया गया।


आंतरिक सदस्यता ग्राफिक


तंत्रिका नेटवर्क को केवल चमकदार, आकर्षक नए गैजेट के रूप में खारिज करना निश्चित रूप से एक गलती होगी। वे पहले से ही हमारे जीवन में अच्छी तरह से स्थापित हैं। कुछ अपनी व्यावहारिकता में शक्तिशाली हैं। 1989 में, एटी एंड टी बेल लेबोरेटरीज में यान लेकुन के नेतृत्व में एक टीम ने एक सिस्टम को प्रशिक्षित करने के लिए बैक-प्रोपेगेशन तकनीकों का उपयोग किया था। हस्तलिखित डाक कोड पहचानें। हाल का माइक्रोसॉफ्ट द्वारा घोषणा बिंग खोज एआई द्वारा संचालित होगी, जिससे यह आपका "वेब के लिए सह-पायलट" बन जाएगा, यह दर्शाता है कि हम जिन चीजों की खोज करते हैं और हम उन्हें कैसे समझते हैं वे तेजी से इस प्रकार के स्वचालन का उत्पाद होंगे।

पैटर्न खोजने के लिए विशाल डेटा का उपयोग करके एआई को छवि पहचान जैसी चीजों को गति से करने के लिए प्रशिक्षित किया जा सकता है - जिसके परिणामस्वरूप उन्हें इसमें शामिल किया जा सकता है चेहरे की पहचान, उदाहरण के लिए। पैटर्न की पहचान करने की इस क्षमता ने कई अन्य अनुप्रयोगों को जन्म दिया है, जैसे शेयर बाज़ारों की भविष्यवाणी करना.

तंत्रिका नेटवर्क हमारी व्याख्या और संचार के तरीके को भी बदल रहे हैं। दिलचस्प शीर्षक से विकसित किया गया गूगल ब्रेन टीम, Google अनुवाद तंत्रिका नेटवर्क का एक अन्य प्रमुख अनुप्रयोग है।

आप किसी के साथ शतरंज या शोगी भी नहीं खेलना चाहेंगे। नियमों की उनकी समझ और रणनीतियों और सभी रिकॉर्ड की गई चालों को याद रखने का मतलब है कि वे खेलों में असाधारण रूप से अच्छे हैं (हालांकि चैटजीपीटी ऐसा लगता है) वर्डले के साथ संघर्ष). वे सिस्टम जो मानव गो खिलाड़ियों (गो एक बेहद मुश्किल रणनीति बोर्ड गेम है) और शतरंज ग्रैंडमास्टर्स को परेशान कर रहे हैं, ये हैं तंत्रिका नेटवर्क से बनाया गया.

लेकिन उनकी पहुंच इन उदाहरणों से कहीं आगे तक जाती है और बढ़ती रहती है। केवल सटीक वाक्यांश "तंत्रिका नेटवर्क" के उल्लेख तक सीमित पेटेंट की खोज 135,828 परिणाम उत्पन्न करती है। इस तीव्र और निरंतर विस्तार के साथ, एआई के प्रभाव को पूरी तरह से समझाने में सक्षम होने की संभावना बहुत कम हो सकती है। ये वे प्रश्न हैं जिनका मैं अपने शोध में परीक्षण कर रहा हूं और एल्गोरिथम सोच पर मेरी नई किताब.

'अज्ञेयता' की रहस्यमयी परतें

तंत्रिका नेटवर्क के इतिहास पर नज़र डालने से हमें स्वचालित निर्णयों के बारे में कुछ महत्वपूर्ण जानकारी मिलती है जो हमारे वर्तमान को परिभाषित करते हैं या जिनका भविष्य में संभवतः अधिक गहरा प्रभाव पड़ेगा। उनकी उपस्थिति हमें यह भी बताती है कि समय के साथ हमें एआई के निर्णयों और प्रभावों को और भी कम समझने की संभावना है। ये प्रणालियाँ केवल ब्लैक बॉक्स नहीं हैं, ये किसी प्रणाली के छिपे हुए हिस्से मात्र नहीं हैं जिन्हें देखा या समझा नहीं जा सकता है।

यह कुछ अलग है, कुछ ऐसा जो इन प्रणालियों के उद्देश्यों और डिज़ाइन में निहित है। अज्ञात की लंबे समय से तलाश की जा रही है। प्रणाली जितनी अधिक अपारदर्शी, उतनी ही अधिक प्रामाणिक और उन्नत मानी जाती है। यह केवल सिस्टम के अधिक जटिल होने या बौद्धिक संपदा के नियंत्रण के कारण पहुंच सीमित करने के बारे में नहीं है (हालांकि ये इसका हिस्सा हैं)। इसके बजाय यह कहना है कि उन्हें चलाने वाले लोकाचार में "अनजानेपन" में एक विशेष और अंतर्निहित रुचि है। रहस्य को तंत्रिका नेटवर्क के स्वरूप और प्रवचन में भी कोडित किया गया है। वे गहराई से ढेर परतों के साथ आते हैं - इसलिए गहरी शिक्षा वाक्यांश - और उन गहराइयों के भीतर और भी अधिक रहस्यमय लगने वाली "छिपी हुई परतें" हैं। इन प्रणालियों के रहस्य सतह के नीचे गहरे हैं।

इस बात की अच्छी संभावना है कि कृत्रिम बुद्धिमत्ता का हमारे जीवन पर जितना अधिक प्रभाव पड़ेगा, हम उतना ही कम समझ पाएंगे कि कैसे या क्यों। आज एआई पर जोर दिया जा रहा है जिसे समझा जा सकता है। हम जानना चाहते हैं कि यह कैसे काम करता है और यह निर्णयों और परिणामों पर कैसे पहुंचता है। यूरोपीय संघ संभावित "अस्वीकार्य जोखिमों" और यहां तक ​​कि "खतरनाक" अनुप्रयोगों से इतना चिंतित है कि वह वर्तमान में आगे बढ़ रहा है एक नया एआई अधिनियम इसका उद्देश्य "सुरक्षित, भरोसेमंद और नैतिक कृत्रिम बुद्धिमत्ता के विकास" के लिए "वैश्विक मानक" स्थापित करना है।

वे नये कानून व्याख्यात्मकता की आवश्यकता पर आधारित होंगे, इसकी मांग कर रहे हैं "उच्च जोखिम वाले एआई सिस्टम के लिए, एआई द्वारा उत्पन्न मौलिक अधिकारों और सुरक्षा के जोखिमों को कम करने के लिए उच्च गुणवत्ता वाले डेटा, दस्तावेज़ीकरण और ट्रेसबिलिटी, पारदर्शिता, मानव निरीक्षण, सटीकता और मजबूती की आवश्यकताएं सख्ती से आवश्यक हैं"। यह केवल सेल्फ-ड्राइविंग कारों जैसी चीजों के बारे में नहीं है (हालाँकि सुरक्षा सुनिश्चित करने वाली प्रणालियाँ EU की उच्च जोखिम वाली AI की श्रेणी में आती हैं), यह भी एक चिंता का विषय है कि भविष्य में ऐसी प्रणालियाँ उभरेंगी जिनका मानवाधिकारों पर प्रभाव पड़ेगा।

यह एआई में पारदर्शिता के व्यापक आह्वान का हिस्सा है ताकि इसकी गतिविधियों की जांच, ऑडिट और मूल्यांकन किया जा सके। दूसरा उदाहरण रॉयल सोसाइटी का होगा समझाने योग्य एआई पर नीति ब्रीफिंग जिसमें वे बताते हैं कि "दुनिया भर में नीतिगत बहसों में एआई-सक्षम प्रणालियों के डिजाइन और तैनाती में नैतिक सिद्धांतों को शामिल करने के प्रयासों के हिस्से के रूप में एआई व्याख्या के कुछ रूप की मांग बढ़ रही है"।

लेकिन तंत्रिका नेटवर्क की कहानी हमें बताती है कि भविष्य में हम उस उद्देश्य के करीब आने के बजाय उससे और भी दूर हो जाएंगे।

मानव मस्तिष्क से प्रेरित

ये तंत्रिका नेटवर्क जटिल प्रणालियाँ हो सकते हैं फिर भी उनके कुछ मूल सिद्धांत हैं। मानव मस्तिष्क से प्रेरित होकर, वे जैविक और मानवीय सोच के रूपों की नकल या अनुकरण करना चाहते हैं। संरचना और डिज़ाइन के संदर्भ में, वे जैसे हैं आईबीएम भी समझाता है, "नोड परतों से युक्त, जिसमें एक इनपुट परत, एक या अधिक छिपी हुई परतें और एक आउटपुट परत होती है"। इसके भीतर, "प्रत्येक नोड, या कृत्रिम न्यूरॉन, दूसरे से जुड़ता है"। क्योंकि उन्हें आउटपुट बनाने के लिए इनपुट और जानकारी की आवश्यकता होती है, वे "सीखने और समय के साथ अपनी सटीकता में सुधार करने के लिए प्रशिक्षण डेटा पर भरोसा करते हैं"। ये तकनीकी विवरण मायने रखते हैं लेकिन इन प्रणालियों को मानव मस्तिष्क की जटिलताओं पर मॉडल बनाने की इच्छा भी मायने रखती है।

इन प्रणालियों के पीछे की महत्वाकांक्षा को समझना यह समझने में महत्वपूर्ण है कि व्यवहार में इन तकनीकी विवरणों का क्या अर्थ है। में एक 1993 साक्षात्कारतंत्रिका नेटवर्क वैज्ञानिक टेउवो कोहोनेन ने निष्कर्ष निकाला कि एक "स्व-संगठित" प्रणाली "मेरा सपना है", जो "कुछ उसी तरह काम करती है जैसे हमारा तंत्रिका तंत्र सहज रूप से कर रहा है"। एक उदाहरण के रूप में, कोहोनेन ने चित्रित किया कि कैसे एक "स्व-संगठित" प्रणाली, एक ऐसी प्रणाली जो खुद की निगरानी और प्रबंधन करती है, "किसी भी मशीन के लिए एक निगरानी पैनल के रूप में इस्तेमाल किया जा सकता है ... हर हवाई जहाज, जेट विमान, या हर परमाणु ऊर्जा स्टेशन, या प्रत्येक में कार"। उन्होंने सोचा, इसका मतलब यह होगा कि भविष्य में "आप तुरंत देख सकेंगे कि सिस्टम किस स्थिति में है"।

व्यापक उद्देश्य एक ऐसी प्रणाली बनाना था जो अपने परिवेश के अनुकूल ढलने में सक्षम हो। यह तंत्रिका तंत्र की शैली में काम करते हुए त्वरित और स्वायत्त होगा। वह सपना था, ऐसी प्रणालियाँ बनाना जो बहुत अधिक मानवीय हस्तक्षेप की आवश्यकता के बिना खुद को संभाल सकें। मस्तिष्क, तंत्रिका तंत्र और वास्तविक दुनिया की जटिलताएं और अज्ञातताएं जल्द ही तंत्रिका नेटवर्क के विकास और डिजाइन को सूचित करने के लिए आएंगी।

'इसमें कुछ गड़बड़ है'

लेकिन 1956 और उस अजीब सीखने की मशीन पर वापस जाएं, तो इसे बनाते समय टेलर ने जो व्यावहारिक दृष्टिकोण अपनाया था, उसने तुरंत कोवान का ध्यान आकर्षित किया। टुकड़ों और टुकड़ों को जोड़ने में उसने स्पष्ट रूप से पसीना बहाया था। टेलर, कोवान ने देखा इन प्रणालियों की कहानी में अपनी ओर से एक साक्षात्कार के दौरान, "यह सिद्धांत द्वारा नहीं किया, और उन्होंने इसे कंप्यूटर पर नहीं किया"। इसके बजाय, हाथ में उपकरण लेकर, उन्होंने "वास्तव में हार्डवेयर बनाया"। यह एक भौतिक चीज़ थी, भागों का संयोजन, शायद एक उपकरण भी। और टेलर, कोवान कहते हैं, "यह सब एनालॉग सर्किटरी के साथ किया गया था", "इसे बनाने और इसके साथ खेलने में कई साल लगे"। परीक्षण और त्रुटि का मामला.

जाहिर तौर पर कोवान जो कुछ देख रहा था, उसे समझना चाहता था। उन्होंने टेलर से इस शिक्षण मशीन के बारे में समझाने की कोशिश की। स्पष्टीकरण नहीं आया. कोवान टेलर को यह बताने के लिए नहीं कह सका कि यह चीज़ कैसे काम करती है। एनालॉग न्यूरॉन्स एक रहस्य बने रहे। कोवान ने सोचा कि अधिक आश्चर्यजनक समस्या यह थी कि टेलर "वास्तव में खुद नहीं समझ पाया कि क्या हो रहा था"। यह दो अलग-अलग विशेषज्ञता वाले वैज्ञानिकों के बीच संचार में सिर्फ एक क्षणिक रुकावट नहीं थी, यह उससे कहीं अधिक थी।

एक में 1990 के दशक के मध्य से साक्षात्कारटेलर की मशीन के बारे में सोचते हुए, कोवान ने खुलासा किया कि "आज तक प्रकाशित पत्रों में आप यह नहीं समझ सकते कि यह कैसे काम करती है"। यह निष्कर्ष इस बात का सूचक है कि कैसे अज्ञात तंत्रिका नेटवर्क में गहराई से अंतर्निहित है। इन तंत्रिका तंत्रों की अस्पष्टता लगभग सात दशकों से मौलिक और विकासात्मक चरणों से भी मौजूद है।

यह रहस्य आज भी बना हुआ है और एआई के उन्नत रूपों में पाया जा सकता है। टेलर की मशीन द्वारा बनाए गए संघों के कामकाज की अथाहता ने कोवान को आश्चर्यचकित कर दिया कि क्या "इसमें कुछ गड़बड़ है"।

लंबी और उलझी हुई जड़ें

जब कोवान से कुछ वर्षों बाद उनके अपने काम के स्वागत के बारे में पूछा गया तो उन्होंने टेलर के साथ अपनी संक्षिप्त यात्रा का उल्लेख किया। कोवान ने प्रतिबिंबित किया, 1960 के दशक में लोग "एनालॉग न्यूरल नेटवर्क के बिंदु को देखने में थोड़े धीमे" थे। इसके बावजूद, कोवान याद करते हैं, टेलर का 1950 का "साहचर्य स्मृति" पर काम "एनालॉग न्यूरॉन्स" पर आधारित था। नोबेल पुरस्कार विजेता तंत्रिका तंत्र विशेषज्ञ, लियोन एन. कूपर ने निष्कर्ष निकाला 1960 के दशक में मस्तिष्क मॉडल के अनुप्रयोग के आसपास के विकास को "गहरे रहस्यों में से एक" माना जाता था। इस अनिश्चितता के कारण इस बात पर संदेह बना रहा कि तंत्रिका नेटवर्क क्या हासिल कर सकता है। लेकिन चीजें धीरे-धीरे बदलने लगीं.

लगभग 30 साल पहले न्यूरोसाइंटिस्ट वाल्टर जे. फ्रीमैन, जो "" से आश्चर्यचकित थे।असाधारणतंत्रिका नेटवर्क के लिए पाए गए अनुप्रयोगों की श्रृंखला पहले से ही इस तथ्य पर टिप्पणी कर रही थी कि वह उन्हें "मौलिक रूप से नई तरह की मशीन" के रूप में नहीं देखता था। वे धीरे-धीरे विकसित हो रहे थे, पहले तकनीक आई और फिर बाद में इसके लिए अनुप्रयोग ढूंढे गए। इसमें समय लगा. वास्तव में, तंत्रिका नेटवर्क प्रौद्योगिकी की जड़ें खोजने के लिए हमें कोवान की टेलर की रहस्यमय मशीन की यात्रा से भी पीछे जाना पड़ सकता है।

न्यूरल नेट वैज्ञानिक जेम्स एंडरसन और विज्ञान पत्रकार एडवर्ड रोसेनफेल्ड नोट किया है तंत्रिका नेटवर्क की पृष्ठभूमि 1940 के दशक की है और कुछ प्रारंभिक प्रयास, जैसा कि वे वर्णन करते हैं, "मानव तंत्रिका तंत्र को समझने और कृत्रिम सिस्टम बनाने के लिए जो हमारे तरीके से कार्य करते हैं, कम से कम थोड़ा सा"। और इसलिए, 1940 के दशक में, मानव तंत्रिका तंत्र के रहस्य भी कम्प्यूटेशनल सोच और कृत्रिम बुद्धिमत्ता के रहस्य बन गए।

इस लंबी कहानी का सारांश प्रस्तुत करते हुए, कंप्यूटर विज्ञान लेखक लैरी हार्डेस्टी ने बताया है तंत्रिका नेटवर्क के रूप में गहन शिक्षा "70 से अधिक वर्षों से फैशन के अंदर और बाहर हो रही है"। अधिक विशेष रूप से, वह कहते हैं, ये "तंत्रिका नेटवर्क पहली बार 1944 में शिकागो विश्वविद्यालय के दो शोधकर्ताओं वॉरेन मैककुलोच और वाल्टर पिट्स द्वारा प्रस्तावित किए गए थे, जो 1952 में एमआईटी में चले गए थे, जिसे कभी-कभी पहला संज्ञानात्मक विज्ञान विभाग कहा जाता है"।

कहीं और, 1943 कभी-कभी प्रौद्योगिकी के लिए प्रथम वर्ष के रूप में दी गई तारीख होती है। किसी भी तरह से, लगभग 70 वर्षों के खातों से पता चलता है कि तंत्रिका नेटवर्क प्रचलन में आए हैं और बाहर आए हैं, अक्सर उपेक्षित होते हैं लेकिन फिर कभी-कभी पकड़ बनाते हैं और अधिक मुख्यधारा के अनुप्रयोगों और बहसों में चले जाते हैं। अनिश्चितता बनी रही. वे शुरुआती डेवलपर्स अक्सर अपने शोध के महत्व को नजरअंदाज किए जाने का वर्णन करते हैं, जब तक कि इसे अपना उद्देश्य अक्सर वर्षों और कभी-कभी दशकों बाद नहीं मिल जाता।

1960 के दशक से 1970 के दशक के अंत तक आगे बढ़ते हुए हम इन प्रणालियों के अज्ञात गुणों की और कहानियाँ पा सकते हैं। फिर भी, तीन दशकों के बाद भी, तंत्रिका नेटवर्क को अभी भी उद्देश्य की भावना नहीं मिल पाई है। डेविड रुमेलहार्ट, जिनकी मनोविज्ञान में पृष्ठभूमि थी और 1986 में प्रकाशित पुस्तकों के एक सेट के सह-लेखक थे, जिन्होंने बाद में तंत्रिका नेटवर्क की ओर फिर से ध्यान आकर्षित किया, उन्होंने खुद को तंत्रिका नेटवर्क के विकास पर सहयोग करते हुए पाया। अपने सहयोगी जे मैक्लेलैंड के साथ.

सहकर्मी होने के साथ-साथ वे हाल ही में मिनेसोटा में एक सम्मेलन में एक-दूसरे से भी मिले थे, जहां "कहानी की समझ" पर रुमेलहार्ट की बातचीत ने प्रतिनिधियों के बीच कुछ चर्चा को उकसाया था।

उस सम्मेलन के बाद मैक्लेलैंड इस विचार के साथ लौटे कि एक तंत्रिका नेटवर्क कैसे विकसित किया जाए जो मॉडलों को अधिक इंटरैक्टिव बनाने के लिए संयोजित कर सके। यहाँ क्या मायने रखता है रुमेलहार्ट की यादें "कंप्यूटर पर छेड़छाड़ के घंटे और घंटे"।

हमने बैठकर कंप्यूटर में यह सब किया और कंप्यूटर मॉडल बनाए, और हम उन्हें समझ नहीं पाए। हमें समझ नहीं आया कि उन्होंने काम क्यों किया या उन्होंने काम क्यों नहीं किया या उनमें क्या आलोचनात्मक थी।

टेलर की तरह, रुमेलहार्ट ने खुद को सिस्टम के साथ छेड़छाड़ करते हुए पाया। उन्होंने भी एक कार्यशील तंत्रिका नेटवर्क बनाया और, महत्वपूर्ण रूप से, वे यह भी निश्चित नहीं थे कि यह कैसे या क्यों उस तरह से काम करता है, जैसे डेटा से सीख रहा है और एसोसिएशन ढूंढ रहा है।

मस्तिष्क की नकल - परत दर परत

आपने पहले ही देखा होगा कि तंत्रिका नेटवर्क की उत्पत्ति पर चर्चा करते समय मस्तिष्क की छवि और इससे उत्पन्न जटिलता कभी भी दूर नहीं होती है। मानव मस्तिष्क ने इन प्रणालियों के लिए एक प्रकार के टेम्पलेट के रूप में कार्य किया। शुरुआती चरणों में, विशेष रूप से, मस्तिष्क - अभी भी महान अज्ञातों में से एक - तंत्रिका नेटवर्क कैसे कार्य कर सकता है, इसके लिए एक मॉडल बन गया।

इसलिए ये प्रयोगात्मक नई प्रणालियाँ किसी ऐसी चीज़ पर आधारित थीं जिनकी कार्यप्रणाली स्वयं काफी हद तक अज्ञात थी। न्यूरोकंप्यूटिंग इंजीनियर कार्वर मीड ने खुलासा करते हुए बात कही है एक "संज्ञानात्मक हिमशैल" की अवधारणा जो उन्हें विशेष रूप से आकर्षक लगी थी। यह केवल चेतना के हिमशैल का सिरा है जिसके बारे में हम जानते हैं और जो दिखाई देता है। शेष का पैमाना और स्वरूप सतह के नीचे अज्ञात रहता है।

1998 में, जेम्स एंडरसनजो कुछ समय से तंत्रिका नेटवर्क पर काम कर रहे थे, उन्होंने कहा कि जब मस्तिष्क पर शोध की बात आती है तो "हमारी प्रमुख खोज यह जागरूकता प्रतीत होती है कि हम वास्तव में नहीं जानते कि क्या हो रहा है"।

में एक विस्तृत विवरण में 2018 में फाइनेंशियल टाइम्सप्रौद्योगिकी पत्रकार रिचर्ड वाटर्स ने उल्लेख किया कि कैसे तंत्रिका नेटवर्क "मानव मस्तिष्क कैसे संचालित होता है, इसके सिद्धांत पर आधारित होते हैं, एक पहचान योग्य पैटर्न उभरने तक कृत्रिम न्यूरॉन्स की परतों के माध्यम से डेटा पास करते हैं"। वाटर्स ने प्रस्तावित किया कि यह एक नॉक-ऑन समस्या पैदा करता है, क्योंकि "पारंपरिक सॉफ्टवेयर प्रोग्राम में नियोजित लॉजिक सर्किट के विपरीत, इस प्रक्रिया को ट्रैक करने का कोई तरीका नहीं है ताकि यह पता लगाया जा सके कि कंप्यूटर किसी विशेष उत्तर के साथ क्यों आता है"। वाटर्स का निष्कर्ष यह है कि इन परिणामों को अचयनित नहीं किया जा सकता। मस्तिष्क के इस प्रकार के मॉडल के अनुप्रयोग, कई परतों के माध्यम से डेटा लेने का मतलब है कि उत्तर को आसानी से वापस नहीं लिया जा सकता है। मल्टीपल लेयरिंग इसका एक अच्छा कारण है।

हार्डस्टी यह भी देखा गया कि ये प्रणालियाँ "मानव मस्तिष्क पर शिथिल रूप से प्रतिरूपित" हैं। यह मस्तिष्क के साथ मेल खाने की कोशिश करने के लिए और अधिक प्रसंस्करण जटिलता बनाने की उत्सुकता लाता है। इस उद्देश्य का परिणाम एक तंत्रिका जाल है जिसमें "हजारों या यहां तक ​​कि लाखों सरल प्रसंस्करण नोड्स होते हैं जो एक दूसरे से गहराई से जुड़े होते हैं"। डेटा इन नोड्स के माध्यम से केवल एक ही दिशा में चलता है। हार्डेस्टी ने देखा कि "एक व्यक्तिगत नोड इसके नीचे की परत में कई नोड्स से जुड़ा हो सकता है, जहां से यह डेटा प्राप्त करता है, और इसके ऊपर की परत में कई नोड्स, जहां यह डेटा भेजता है"।

मानव मस्तिष्क के मॉडल शुरू से ही इन तंत्रिका नेटवर्क की कल्पना और डिजाइन करने का एक हिस्सा थे। यह विशेष रूप से दिलचस्प है जब हम मानते हैं कि मस्तिष्क स्वयं उस समय का एक रहस्य था (और कई मायनों में अभी भी है)।

'अनुकूलन ही सारा खेल है'

मीड और कोहोनेन जैसे वैज्ञानिक एक ऐसी प्रणाली बनाना चाहते थे जो वास्तव में उस दुनिया के अनुकूल हो सके जिसमें वह खुद को पाती है। यह उसकी शर्तों का जवाब देगा. मीड स्पष्ट थे कि तंत्रिका नेटवर्क में मूल्य यह था कि वे इस प्रकार के अनुकूलन की सुविधा प्रदान कर सकते थे। उस समय, और इस महत्वाकांक्षा पर विचार करते हुए, मीड जोड़ा गया वह अनुकूलन उत्पन्न करना "पूरा खेल है"। उन्होंने सोचा, इस अनुकूलन की आवश्यकता है, "वास्तविक दुनिया की प्रकृति के कारण", जिसके बारे में उन्होंने निष्कर्ष निकाला कि "कुछ भी पूर्ण करने के लिए यह बहुत परिवर्तनशील है"।

इस समस्या पर विशेष रूप से विचार करने की आवश्यकता है क्योंकि, उन्होंने सोचा, यह कुछ ऐसा था जिसका पता "तंत्रिका तंत्र ने बहुत पहले ही लगा लिया था"। ये अन्वेषक न केवल मस्तिष्क और उसके अज्ञात की छवि के साथ काम कर रहे थे, बल्कि वे इसे "वास्तविक दुनिया" और इससे आने वाली अनिश्चितताओं, अज्ञात और परिवर्तनशीलता की दृष्टि के साथ जोड़ रहे थे। मीड ने सोचा कि प्रणालियों को प्रतिक्रिया देने और परिस्थितियों के अनुकूल ढलने में सक्षम होने की आवश्यकता है बिना अनुदेश।

1990 के दशक में लगभग उसी समय, स्टीफन ग्रॉसबर्ग - गणित, मनोविज्ञान और बायोमेडिकल इंजीनियरिंग में काम करने वाले संज्ञानात्मक प्रणालियों के विशेषज्ञ - यह भी तर्क दिया दीर्घावधि में अनुकूलन महत्वपूर्ण कदम होने वाला था। ग्रॉसबर्ग, जब उन्होंने तंत्रिका नेटवर्क मॉडलिंग पर काम किया, तो उन्होंने मन ही मन सोचा कि यह सब "कैसे जैविक माप और नियंत्रण प्रणालियों को तेजी से उतार-चढ़ाव वाली दुनिया में वास्तविक समय में जल्दी और स्थिर रूप से अनुकूलित करने के लिए डिज़ाइन किया गया है"। जैसा कि हमने पहले कोहोनन के "स्व-संगठित" प्रणाली के "सपने" के साथ देखा था, "वास्तविक दुनिया" की धारणा वह संदर्भ बन जाती है जिसमें प्रतिक्रिया और अनुकूलन को इन प्रणालियों में कोडित किया जा रहा है। उस वास्तविक दुनिया को कैसे समझा और कल्पना की जाती है, यह निस्संदेह आकार देता है कि इन प्रणालियों को अनुकूलन के लिए कैसे डिज़ाइन किया गया है।

छुपी हुई परतें

जैसे-जैसे परतें बढ़ती गईं, गहरी सीख में नई गहराईयां आती गईं। तंत्रिका नेटवर्क को प्रशिक्षण डेटा का उपयोग करके प्रशिक्षित किया जाता है, हार्डेस्टी ने समझाया, "नीचे की परत - इनपुट परत - को खिलाया जाता है और यह बाद की परतों से होकर गुजरती है, जटिल तरीकों से गुणा और एक साथ जुड़ती है, जब तक कि यह अंततः आउटपुट परत पर, मौलिक रूप से परिवर्तित नहीं हो जाती"। जितनी अधिक परतें, उतना अधिक परिवर्तन और इनपुट से आउटपुट तक की दूरी उतनी ही अधिक होगी। हार्डेस्टी ने कहा, उदाहरण के लिए, गेमिंग में ग्राफ़िक्स प्रोसेसिंग यूनिट्स (जीपीयू) के विकास ने 1960 के दशक के एक-परत नेटवर्क और 1980 के दशक के दो से तीन-परत नेटवर्क को दस, 15 या यहां तक ​​कि 50 में विकसित करने में सक्षम बनाया। -आज के लेयर नेटवर्क"।

तंत्रिका नेटवर्क गहरे होते जा रहे हैं। वास्तव में, हार्डेस्टी के अनुसार, यह परतों का जोड़ है, जो "'गहन शिक्षा' में 'गहराई' को संदर्भित करता है"। उनका प्रस्ताव है कि यह मायने रखता है, क्योंकि "वर्तमान में, कृत्रिम बुद्धिमत्ता अनुसंधान के लगभग हर क्षेत्र में सर्वोत्तम प्रदर्शन करने वाली प्रणालियों के लिए गहन शिक्षा जिम्मेदार है"।

लेकिन रहस्य अभी भी गहराता जा रहा है. जैसे-जैसे तंत्रिका नेटवर्क की परतें ऊंची होती गईं, उनकी जटिलता बढ़ती गई। इससे इन गहराईयों के भीतर "छिपी परतों" के रूप में संदर्भित चीज़ों में भी वृद्धि हुई है। तंत्रिका नेटवर्क में छिपी हुई परतों की इष्टतम संख्या पर चर्चा जारी है। मीडिया सिद्धांतकार बीट्राइस फ़ाज़ी ने लिखा है "क्योंकि एक गहरा तंत्रिका नेटवर्क कैसे संचालित होता है, न्यूरॉन्स की पहली परत (इनपुट परत) और अंतिम परत (आउटपुट परत) के बीच छुपी हुई तंत्रिका परतों पर निर्भर होकर, गहरी सीखने की तकनीकें अक्सर अपारदर्शी या यहां तक ​​​​कि अस्पष्ट होती हैं प्रोग्रामर जो मूल रूप से उन्हें स्थापित करते हैं"।

जैसे-जैसे परतें बढ़ती हैं (उन छिपी हुई परतों सहित) वे और भी कम समझाने योग्य हो जाती हैं - यहां तक ​​​​कि, जैसा कि यह पता चला है, उन्हें बनाने वालों के लिए भी। एक समान बात रखते हुए, प्रमुख और अंतःविषय नए मीडिया विचारक कैथरीन हेयल्स भी नोट किया कि "हम सिस्टम के बारे में कितना जान सकते हैं, तंत्रिका जाल और गहन शिक्षण एल्गोरिदम में 'छिपी परत' के लिए प्रासंगिक परिणाम" की सीमाएं हैं।

अज्ञात का पीछा करना

कुल मिलाकर, ये लंबे घटनाक्रम प्रौद्योगिकी के समाजशास्त्री के विचारों का हिस्सा हैं टैना बुचर को "अज्ञात की समस्या" कहा गया है। हैरी कोलिन्स एआई के क्षेत्र में वैज्ञानिक ज्ञान पर अपने प्रभावशाली शोध का विस्तार कर रहे हैं ने इस ओर इशारा किया है तंत्रिका जाल के साथ उद्देश्य यह है कि वे कम से कम शुरू में एक मानव द्वारा उत्पादित किए जा सकते हैं, लेकिन “एक बार लिखे जाने के बाद कार्यक्रम अपना जीवन जीता है, जैसा कि वह था; भारी प्रयास के बिना, प्रोग्राम वास्तव में कैसे काम कर रहा है यह रहस्यमय बना रह सकता है"। इसमें स्व-संगठित प्रणाली के उन लंबे समय से प्रतीक्षित सपनों की प्रतिध्वनि है।

मैं इसमें यह भी जोड़ना चाहूंगा कि अज्ञात और शायद यहां तक ​​कि अज्ञात को भी इन प्रणालियों के प्रारंभिक चरण से एक मूलभूत भाग के रूप में अपनाया गया है। इस बात की अच्छी संभावना है कि कृत्रिम बुद्धिमत्ता का हमारे जीवन पर जितना अधिक प्रभाव पड़ेगा, हम उतना ही कम समझ पाएंगे कि कैसे या क्यों।

लेकिन यह बात आज बहुत से लोगों को रास नहीं आती। हम जानना चाहते हैं कि एआई कैसे काम करता है और यह उन निर्णयों और परिणामों पर कैसे पहुंचता है जो हमें प्रभावित करते हैं। जैसे-जैसे एआई में विकास दुनिया के बारे में हमारे ज्ञान और समझ को आकार देता रहेगा, हम क्या खोजते हैं, हमारे साथ कैसा व्यवहार किया जाता है, हम कैसे सीखते हैं, उपभोग करते हैं और बातचीत करते हैं, समझने की यह प्रेरणा बढ़ेगी। जब समझाने योग्य और पारदर्शी एआई की बात आती है, तो तंत्रिका नेटवर्क की कहानी हमें बताती है कि भविष्य में हम उस उद्देश्य के करीब आने के बजाय उससे और दूर हो जाएंगे।

डेविड बीयर, समाजशास्त्र के प्रोफेसर, यॉर्क विश्वविद्यालय

इस लेख से पुन: प्रकाशित किया गया है वार्तालाप क्रिएटिव कॉमन्स लाइसेंस के तहत। को पढ़िए मूल लेख.