कैसे चहचहाना पर अपने दोस्तों को आप अपने गुमनामी दूर दे सकता है

जैसा कि आप इंटरनेट ब्राउज़ करते हैं, ऑनलाइन विज्ञापनदाता ट्रैक करते हैं लगभग हर साइट जो आप देखते हैं, अपनी आदतों और वरीयताओं के बारे में सूचनाओं का एक धन इकट्ठा करना जब आप किसी समाचार साइट पर जाते हैं, तो वे देख सकते हैं कि आप बास्केटबॉल, ओपेरा और रहस्य उपन्यासों के प्रशंसक हैं और तदनुसार अपने स्वाद के अनुरूप विज्ञापन चुनें।

विज्ञापनदाता अत्यधिक व्यक्तिगत अनुभव बनाने के लिए इस जानकारी का उपयोग करते हैं, लेकिन उन्हें आमतौर पर नहीं पता कि आप कौन हैं। वे केवल आपके डिजिटल निशान का पालन करते हैं, न कि आपकी पहचान है, और इसलिए आप महसूस कर सकते हैं कि आपने गुमनामी की डिग्री बरकरार रखी है।

लेकिन, एक कागज में मैं coauthored अंशु शुक्ला, शरद गोएल और अरविंद नारायणन के साथ, हम दिखाते हैं कि ये अनन्य वेब ब्राउज़िंग रिकॉर्ड वास्तव में वास्तविक दुनिया की पहचान में वापस बंधे जा सकते हैं।

हमारे दृष्टिकोण का परीक्षण करने के लिए, हमने बनाया एक वेबसाइट जहां लोग इस अध्ययन के प्रयोजनों के लिए अपने ब्राउज़िंग इतिहास का दान कर सकते हैं। फिर हमने यह देखने की कोशिश की कि क्या हम सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करके अपने इतिहास को अपने ट्विटर प्रोफाइल पर वापस ला सकते हैं। जिन लोगों को हम उपनाम देने की कोशिश की थी उनमें से बाईस-दो प्रतिशत सही खोज परिणामों में शीर्ष उम्मीदवार के रूप में पहचाने गए थे, और 81 प्रतिशत शीर्ष 15 उम्मीदवारों में से थे।

गोपनीयता XNUM 2 2डीनोमाइज़ेशन वेबसाइट के स्क्रीनशॉट

यह हमारे ज्ञान के लिए, आज तक की deanonymization का सबसे बड़ा पैमाने पर प्रदर्शन है, क्योंकि यह सैकड़ों लाखों संभावित ट्विटर उपयोगकर्ताओं से सही उपयोगकर्ता को चुनता है। इसके अतिरिक्त, हमारी पद्धति के लिए केवल एक व्यक्ति ही आवश्यक है कि वह अपने सोशल मीडिया फ़ीड में प्रदर्शित होने वाले लिंक पर क्लिक करें, न कि वे किसी भी सामग्री को पोस्ट करते हैं - इसलिए जो लोग इंटरनेट पर जो कुछ भी साझा करते हैं, उनके बारे में सावधान रहना अभी भी इस हमले के लिए कमजोर है।


आंतरिक सदस्यता ग्राफिक


यह कैसे काम करता है

उच्च स्तर पर, हमारा दृष्टिकोण एक सरल अवलोकन पर आधारित है। प्रत्येक व्यक्ति के पास एक अति विशिष्ट सामाजिक नेटवर्क है, जिसमें परिवार, मित्रों, स्कूल, काम और उनके जीवन के विभिन्न चरणों के दोस्त शामिल होते हैं। एक परिणाम के रूप में, आपके फेसबुक और ट्विटर फ़ीड में लिंक का सेट बेहद विशिष्ट है। इन लिंकों पर क्लिक करने से आपके ब्राउज़िंग इतिहास में एक बयान दर्ज हो जाती है।

वेब पन्नों के एक समूह को देखकर, एक व्यक्ति ने दौरा किया है, हम इसी तरह के सोशल मीडिया फीड्स को चुनने में सक्षम थे, जो उस वेब ब्राउज़िंग इतिहास को उत्पन्न होने वाले उम्मीदवारों की सूची प्रदान करते थे। इस तरीके से, हम किसी व्यक्ति की वास्तविक-दुनिया की पहचान को उन लिंकों के लगभग पूर्ण सेट में बाँध सकते हैं, जिनके लिंक उन सोशल मीडिया साइट पर कभी पोस्ट नहीं किए गए थे।

इस रणनीति में दो महत्वपूर्ण चुनौतियां शामिल हैं पहला सैद्धांतिक है: आप कैसे बता सकते हैं कि किसी विशेष वेबमास्टिंग इतिहास को किस प्रकार एक विशिष्ट सोशल मीडिया फ़ीड है? एक सरल तरीका है ब्राउजिंग इतिहास में दिए गए लिंक के अंश को मापना, जो फ़ीड में भी दिखाई देता है। यह अभ्यास में काफी अच्छी तरह से काम करता है, लेकिन यह बड़ी फीड्स के लिए समानता पर निर्भर करता है, क्योंकि इसमें केवल अधिक लिंक होते हैं। हम इसके बजाय एक वैकल्पिक दृष्टिकोण लेते हैं। हम वेब ब्राउज़िंग व्यवहार के एक स्टाइलिश, संभाव्य मॉडल को प्रस्तुत करते हैं, और फिर उस सोशल मीडिया फीड के साथ उपयोगकर्ता को देखा गया ब्राउजिंग इतिहास उत्पन्न कर सकते हैं। फिर हम सोशल मीडिया फीड का चयन करते हैं जो कि सबसे अधिक संभावना है।

दूसरी चुनौती में वास्तविक समय में सबसे अधिक समान फ़ीड्स की पहचान करना शामिल है। यहां हम ट्विटर पर जाते हैं, चूंकि चहचहाना फ़ीड (फेसबुक के विपरीत) काफी हद तक सार्वजनिक हैं। हालांकि, हालांकि फ़ीड सार्वजनिक हैं, हम केवल ट्विटर की स्थानीय प्रतिलिपि नहीं बना सकते हैं जिसके विरुद्ध हम हमारे प्रश्नों को चला सकते हैं। इसके बजाय हम खोज की जगह नाटकीय रूप से कम करने के लिए कई तकनीकों को लागू करते हैं। हम फिर से सबसे बढ़िया उम्मीदवारों की फ़ीड बनाने के लिए ऑन-डिमांड नेटवर्क क्रॉल के साथ कैशिंग तकनीकों को संयोजित करते हैं। इस कम उम्मीदवार सेट पर, हम अंतिम परिणामों के उत्पादन के लिए हमारे समानता के उपाय लागू करते हैं। एक ब्राउज़िंग इतिहास को देखते हुए, हम आमतौर पर 60 सेकंड के तहत इस पूरी प्रक्रिया को पूरा कर सकते हैं।

हमारी पद्धति उन लोगों के लिए अधिक सटीक है जो ट्विटर को अधिक सक्रिय रूप से ब्राउज़ करते हैं। जिन प्रतिभागियों ने ट्विटर पर 100 या उससे अधिक लिंक पर क्लिक किया था, उनमें से नब्बे प्रतिशत उनकी पहचान से मेल खा सकते थे।

प्रतिभागियों की सहमति के बिना भी, इस तरह के एक हमले को चलाने के लिए कई कंपनियां ट्रैकिंग संसाधन करती हैं हमने अपने प्रत्येक प्रयोग प्रतिभागियों को उनके ब्राउज़िंग इतिहास के कुछ हिस्सों का उपयोग करते हुए, जो विशिष्ट ट्रैकिंग कंपनियों के लिए दृश्यमान थे, का उपयोग करने का प्रयास किया (क्योंकि कंपनियां उन पृष्ठों पर ट्रैकर हैं)। हमने पाया कि प्रतिभागियों की सही पहचान करने के लिए कई कंपनियों के संसाधन हैं

गोपनीयता 2 8अन्य deanonymization अध्ययन

कई अन्य अध्ययनों ने संवेदनशील डेटा को डीनमाइज करने के लिए सार्वजनिक रूप से उपलब्ध पदचिह्नों का उपयोग किया है

शायद इन पंक्तियों के साथ सबसे प्रसिद्ध अध्ययन द्वारा किया गया लांतानी स्वीनी 2002 में हार्वर्ड विश्वविद्यालय में उसने पता चला कि 87 प्रतिशत अमेरिकियों को विशिष्ट रूप से पहचानने योग्य था उनके ज़िप कोड, लिंग और जन्म तिथि के संयोजन के आधार पर। उन तीन विशेषताओं दोनों सार्वजनिक मतदाता पंजीकरण डेटा (जो उसने यूएस $ 20 के लिए खरीदी थीं) और अज्ञात मेडिकल डेटा (जो व्यापक रूप से वितरित किए गए थे, क्योंकि लोगों को डेटा गुमनाम था) में उपलब्ध था। इन डेटा स्रोतों को जोड़कर, उन्हें मैसाचुसेट्स के गवर्नर के मेडिकल रिकॉर्ड मिले।

2006 में, Netflix एक प्रतियोगिता भाग गया अपनी फिल्म सिफारिशों की गुणवत्ता में सुधार लाने के लिए उन्होंने लोगों की मूवी रेटिंग्स के एक अनाम डेटासेट को जारी किया, और टीम को $ 1 लाख की पेशकश की, जो 10 प्रतिशत से उनकी सिफारिश अल्गोरिदम को बेहतर कर सके। कंप्यूटर वैज्ञानिकों अरविंद नारायणन और विटाली शमतिकोव यह देखा गया कि जिन लोगों को देखा गया फिल्में बहुत विशिष्ट थीं, और डेटासेट में अधिकांश लोग उनकी फिल्मों के एक छोटे समूह के आधार पर विशिष्ट रूप से पहचाने जाने योग्य थे। दूसरे शब्दों में, Netflix फिल्म विकल्पों और आईएमडीबी की समीक्षा के आधार पर, शोधकर्ताओं ने यह निर्धारित करने में सक्षम थे कि उन Netflix उपयोगकर्ताओं को वास्तव में कौन थे।

सोशल मीडिया के उदय के साथ, अधिक से अधिक लोग जानकारी साझा कर रहे हैं जो अहानिकारक लगता है, लेकिन वास्तव में बहुत सारी व्यक्तिगत जानकारी का पता चलता है के नेतृत्व में एक अध्ययन मीकल कोसिंस्की कैम्ब्रिज विश्वविद्यालय में फेसबुक का इस्तेमाल लोगों की भविष्यवाणी करना पसंद करता है यौन अभिविन्यास, राजनीतिक विचार और व्यक्तित्व लक्षण.

के नेतृत्व में एक अन्य टीम गिल्बर्ट वंड्रेसक टेक्नोलॉजी के विएना विश्वविद्यालय में, एक "डीनामाइज़ेशन मशीन" का निर्माण किया जिसने सोचा कि लोग किस प्रकार के लोग सोशल नेटवर्क एक्सिंग का हिस्सा थे, और इसका उपयोग यह पता लगाने के लिए कि वे कौन थे - चूंकि जिन समूहों का आप हिस्सा हैं, वे अक्सर विशिष्ट रूप से पहचानने के लिए पर्याप्त हैं आप।

आप क्या कर सकते है

इनमें से अधिकतर हमलों के खिलाफ बचाव करने के लिए मुश्किल हैं, जब तक कि आप इंटरनेट का उपयोग बंद न करें या सार्वजनिक जीवन में भाग ले रहे हों।

यहां तक ​​कि अगर आप इंटरनेट का उपयोग बंद कर देते हैं, तो कंपनियां अब भी आपके डेटा एकत्र कर सकती हैं। यदि आपके कई मित्र फेसबुक पर अपने संपर्कों को अपलोड करते हैं, और आपका नंबर उनकी सभी संपर्क सूचियों में है, तो फेसबुक आपके बारे में भविष्यवाणी कर सकता है, भले ही आप उनकी सेवा का इस्तेमाल न करते हों

हमारे जैसे एल्गोरिदम को डीनोमाइज करने से बचाने का सबसे अच्छा तरीका उन लोगों के सेट को सीमित करना है, जिनके पास आपके अनाम ब्राउजिंग डेटा तक पहुंच है। जैसे ब्राउज़र एक्सटेंशन Ghostery तीसरे पक्ष के ट्रैकर ब्लॉक करें इसका मतलब है कि, भले ही जिस वेबसाइट पर आप जा रहे हों, वह पता चलेगा कि आप उन पर जा रहे हैं, विज्ञापन कंपनियों जो अपने पृष्ठ पर विज्ञापन दिखाती हैं, वे आपके ब्राउज़िंग डेटा को इकट्ठा नहीं कर पाएंगे और इसे कई साइटों पर एकत्रित नहीं कर सकेंगे।

यदि आप एक वेबमास्टर हैं, तो आप अपने उपयोगकर्ताओं को अपनी साइट का उपयोग करके ब्राउज़ करने देकर उनकी सहायता कर सकते हैं HTTPS। HTTP का उपयोग ब्राउज़ करने से हमलावरों को नेटवर्क ट्रैफ़िक सूँघने के द्वारा अपना ब्राउज़िंग इतिहास प्राप्त करने की अनुमति मिलती है, जो उन्हें इस हमले को पूरा करने देता है। कई वेबसाइटें पहले से ही HTTPS पर स्विच कर चुकी हैं; जब हमने एक नेटवर्क यातायात सूंघ के परिप्रेक्ष्य से हमारे डीनोमाइजेशन प्रयोग को दोहराया, तो केवल 31 प्रतिशत प्रतिभागियों को डीनमाइज्म किया जा सकता है।

हालांकि, बहुत कम आप आम तौर पर डीनोमाइमाइजेशन हमलों के विरुद्ध अपने आप को बचाने के लिए कर सकते हैं, और संभवत: सबसे अच्छी कार्रवाई करने के लिए अपनी उम्मीदों को समायोजित करना है। इस डिजिटल युग में कुछ भी निजी नहीं है

के बारे में लेखक

जेसिका सु, पीएच.डी. स्टैनफोर्ड में छात्र, स्टैनफोर्ड विश्वविद्यालय

यह आलेख मूलतः पर प्रकाशित हुआ था वार्तालाप। को पढ़िए मूल लेख.

संबंधित पुस्तकें

at इनरसेल्फ मार्केट और अमेज़न