भ्रम को साफ करने सहसंबंध और करणीय के बीच 

यहां एक ऐतिहासिक स्थान है जिसे आप जानते नहीं हैं। न्यू इंग्लैंड में रहने वाले मेथोडिस्ट मंत्रियों की संख्या में वृद्धि हुई, इसलिए 1860 और 1940 वर्षों के बीच में भी बोस्टन में आयात किए गए क्यूबा रम की राशि भी थी - और ये दोनों एक बहुत ही समान तरीके से बढ़ रहे हैं। इस प्रकार, मेथोडिस्ट मंत्रियों ने उस समय की अवधि में बहुत सारे रम खरीदे होंगे!

दरअसल, नहीं, यह आकर्षित करने के लिए एक मूर्ख निष्कर्ष है सचमुच क्या हो रहा है कि दोनों मात्राएं - मेथोडिस्ट मंत्री और क्यूबा रम - अन्य कारकों द्वारा उठाए गए थे, जैसे जनसंख्या वृद्धि

गलत निष्कर्ष तक पहुंचने में, हमने बहुत-बहुत आम गलती की है करणीय साथ भ्रमित सह-संबंध.

क्या फर्क पड़ता है?

दो मात्रा होने के लिए कहा जाता है सहसंबद्ध  यदि दोनों एक साथ ("सकारात्मक सहसंबद्ध") वृद्धि या घटती रहती है, या यदि कोई अन्य घटता है और जब अन्य कम हो जाता है ("नकारात्मक सहसंबंधित")।

सहसंबंध आसानी के सांख्यिकीय माप के माध्यम से पता चला है पियरसन के सहसंबंध गुणांक, जो इंगित करता है कि दो मात्रा एक साथ कसकर बंद हो जाती है- 1 से (पूरी तरह से नकारात्मक सहसंबंधित) 0 के माध्यम से (सभी सहसंबद्ध नहीं) और 1 तक (पूरी तरह से सकारात्मक सहसंबंधित)।


आंतरिक सदस्यता ग्राफिक


 causation1tylervigen.com

लेकिन सिर्फ इसलिए कि दो मात्राएं सहसंबद्ध हैं इसका मतलब यह नहीं है कि एक सीधे है के कारण दूसरे को बदलने के लिए सहसंबंध प्रोत्साहन नहीं करता है, जैसे बादल मौसम वर्षा का मतलब नहीं है, भले ही रिवर्स सच है।

यदि दो मात्राएं सहसंबद्ध हैं तो एक वास्तविक कारण-और-प्रभाव संबंध (जैसे कि बारिश स्तर और छाता की बिक्री) हो सकती है, लेकिन हो सकता है कि अन्य चर दोनों गाड़ी चला रहे हों (जैसे समुद्री डाकू संख्या और ग्लोबल वार्मिंग), या शायद यह सिर्फ संयोग है (जैसे अमेरिकी पनीर की खपत और गलती-द्वारा-बेडसेट).

यहां तक ​​कि जहां करणीय मौजूद है, हम सावधान प्रभाव से कारण मिश्रण करने के लिए नहीं होना चाहिए, वरना हम उदाहरण के लिए, समाप्त हो सकता है, कि हीटर का एक बढ़ा उपयोग ठंडा मौसम का कारण बनता है।

आदेश में कारण और प्रभाव स्थापित करने के लिए, हम आंकड़ों से परे जाकर (एक वैज्ञानिक या ऐतिहासिक प्रकृति के) अलग सबूत और तार्किक तर्क के लिए देखने की जरूरत है। सहसंबंध पहली जगह में इस तरह के सबूत की तलाश में जाने के लिए हमें संकेत हो सकता है, लेकिन यह कोई अपने आप में एक सबूत का मतलब है।

सूक्ष्म मुद्दे

हालांकि उपरोक्त उदाहरण जाहिर मूर्ख थे, सहसंबंध बहुत बार तरीके है कि तुरंत वास्तविक दुनिया में स्पष्ट नहीं कर रहे हैं में करणीय के लिए गलत है। जब पढ़ने और आँकड़ों को समझने, एक समझने के लिए कि क्या वास्तव में डेटा और उसके आंकड़े संकेत दे रही हो महान ख्याल रखना चाहिए - और अधिक महत्वपूर्ण बात, वे क्या कर रहे हैं नहीं जिसका अर्थ है।

 causation2

व्याख्या डेटा में सावधानी के लिए जरूरत से एक उदाहरण हाल ही में उत्साह इस साल के शुरू में स्पष्ट groundbreaking आसपास है गुरुत्वाकर्षण तरंगों का पता लगाना - एक घोषणा जो किया गया लगता है समय से पहले ही, डेटा को प्रभावित करने वाले सभी वेरिएबल्स से पहले के लिए जिम्मेदार थे।

दुर्भाग्य से, सांख्यिकी, संभावनाओं और जोखिम का विश्लेषण करने के लिए एक कौशल सेट में तार नहीं है हमारे मानव अंतर्ज्ञान, और ऐसा करने के लिए सभी बहुत आसान है भटक नेतृत्व किया संपूर्ण पुस्तकें उन सूक्ष्म तरीकों पर लिखे गए हैं जिनमें आँकड़े गलत तरीके से व्याख्या किए जा सकते हैं (या भ्रामक करने के लिए इस्तेमाल किया जा सकता है)। अपने गार्ड को बनाए रखने में मदद करने के लिए, यहां कुछ सामान्य फिसलन सांख्यिकीय समस्याएं हैं जिन्हें आपको अवगत होना चाहिए:

1) स्वस्थ कार्यकर्ता प्रभाव, जहां कभी-कभी दो समूहों को एक स्तर के खेल मैदान से सीधे तुलना नहीं किया जा सकता।

अंतरिक्ष यान के समूह के स्वास्थ्य के साथ कार्यालय कार्यकर्ताओं के एक समूह के स्वास्थ्य की तुलना करते हुए एक काल्पनिक अध्ययन पर विचार करें। यदि अध्ययन में दोनों के बीच कोई महत्वपूर्ण अंतर नहीं दिखाया गया है - स्वास्थ्य और काम के माहौल के बीच कोई संबंध नहीं है - क्या हम यह निष्कर्ष निकालना चाहते हैं कि अंतरिक्ष और अंतरिक्ष में रहने वाले अंतरिक्ष यात्रीों के लिए कोई दीर्घकालिक स्वास्थ्य जोखिम नहीं है?

नहीं! समूह समान स्तर पर नहीं हैं: अंतरिक्ष यात्री कोर स्क्रीन आवेदकों को स्वस्थ उम्मीदवारों को खोजने के लिए, जो "माइक्रोग्राविटी" में रहने के प्रभावों का लगातार विरोध करने के लिए एक व्यापक स्वास्थ्य व्यवस्था बनाए रखते हैं

इसलिए हम अपेक्षा करते हैं कि वे कार्यालय श्रमिकों की तुलना में औसतन महत्वपूर्ण स्वस्थ हो, और यदि वे नहीं थे तो उन्हें सही मायने में चिंतित होना चाहिए।

2) वर्गीकरण और स्टेज प्रवासन प्रभाव - समूहों के बीच लोगों को फेरबदल करने से सांख्यिकीय परिणामों पर नाटकीय प्रभाव पड़ सकता है।

इसे इस रूप में भी जाना जाता है विल रोजर्स प्रभाव, अमेरिकी हास्य अभिनेता के बाद जो कथित तौर पर कटा हुआ था:

Okies ओक्लाहोमा छोड़ दिया और कैलिफोर्निया में ले जाया गया है, वे दोनों ही राज्यों में औसत बुद्धि के स्तर को उठाया था।

उदाहरण के लिए, मित्रों के एक बड़े समूह को "लघु" समूह और एक "लंबा" समूह (शायद एक तस्वीर के लिए उन्हें व्यवस्थित करने के लिए) में विभाजित करने की कल्पना करें। ऐसा करने के बाद, दोनों समूहों की औसत ऊंचाई एक बार में बढ़ाना आश्चर्यजनक रूप से आसान है

बस "छोटे" समूह में जाने के लिए "लंबा" समूह में कम से कम व्यक्ति पूछें "लंबा" समूह अपने सबसे कम से कम सदस्य को खो देता है, इस प्रकार उनकी औसत ऊंचाई को बढ़ाता है - लेकिन "लघु" समूह अभी तक अपना सबसे बड़ा सदस्य बना लेता है, और इस प्रकार औसत ऊंचाई में भी लाभ मिलता है

इसका चिकित्सा अध्ययनों में प्रमुख प्रभाव पड़ता है, जहां अक्सर रोगियों को एक नए उपचार की जांच के दौरान "स्वस्थ" या "अस्वास्थ्यकर" समूहों में हल किया जाता है। यदि नैदानिक ​​विधियों में सुधार हुआ है, तो कुछ बहुत-थोड़ा-अस्वास्थ्यकर रोगियों को पुन: वर्गीकृत किया जा सकता है- दोनों समूहों के स्वास्थ्य परिणामों में सुधार होता है, भले ही इलाज कैसे प्रभावी है (या नहीं)

 causation3डेटा के बीच चुनना और चुनना गलत निष्कर्ष हो सकता है संदेहास्पद ठंड (नीला) की अवधि देखते हैं जब डेटा वास्तव में दीर्घकालिक वार्मिंग (हरा) दिखाता है। skepticalscience.com 

3) डाटा खनन - डेटा के एक बहुतायत मौजूद है जब, टुकड़े टुकड़े और चेरी उठाया किसी भी वांछित निष्कर्ष का समर्थन करने के लिए हो सकता है।

यह खराब सांख्यिकीय अभ्यास है, लेकिन अगर जानबूझ कर किया मूल, पूर्ण डेटा सेट के ज्ञान के बिना हाजिर होना कठिन हो सकता है।

उदाहरण के लिए, ग्लोबल वार्मिंग डेटा के दो व्याख्याओं को दिखाते हुए उपरोक्त ग्राफ़ पर विचार करें। या फ्लोराइड - छोटी मात्रा में यह इतिहास में सबसे प्रभावी रोकथाम वाली दवाओं में से एक है, लेकिन सकारात्मक प्रभाव पूरी तरह से गायब हो जाता है अगर कोई केवल कभी भी फ्लोराइड के विषाक्त मात्रा को समझता है।

इसी तरह के कारणों के लिए, यह महत्वपूर्ण है कि प्रयोग के शुरू होने से पहले दिए गए सांख्यिकीय प्रयोग की प्रक्रियाएं तय की जाती हैं और फिर तब तक अपरिवर्तित रहें जब तक प्रयोग समाप्त नहीं हो जाता।

4) क्लस्टरिंग - जो पूरी तरह यादृच्छिक डेटा में भी उम्मीद की जानी चाहिए।

एक चिकित्सा अध्ययन पर विचार करें कि कैंसर या मल्टीपल स्केलेरोसिस जैसे किसी विशेष बीमारी के लक्षण कैसा हैं भौगोलिक रूप से वितरित। अगर रोग यादृच्छिक (और पर्यावरण का कोई असर नहीं) पर हमला होता है तो हम मरीजों के कई समूहों को देखने की उम्मीद करते हैं जैसे कि पाठ्यक्रम की बात है। यदि रोगियों को समान रूप से समान रूप से फैलाया जाता है, तो वितरण सबसे अन्तर्निर्मित होगा!

इसलिए एक क्लस्टर की उपस्थिति, या मामलों के छोटे समूहों की संख्या पूरी तरह से सामान्य है। परिष्कृत सांख्यिकीय तरीकों को यह निर्धारित करने के लिए जरूरी है कि उस क्षेत्र में कुछ बीमारी पैदा करने के कारण कितना क्लस्टरिंग आवश्यक है

दुर्भाग्य से, कोई भी क्लस्टर बिल्कुल भी - एक भी महत्वपूर्ण नहीं - एक आसान (और पहली नज़र, सम्मोहक) समाचार शीर्षक के लिए बनाता है

 causation4

सांख्यिकीय विश्लेषण, किसी भी अन्य शक्तिशाली उपकरण की तरह, बहुत सावधानी से इस्तेमाल किया जाना चाहिए - और विशेष रूप से, एक को हमेशा इस बात पर ध्यान रखना चाहिए कि दो मात्राएं सहसंबद्ध होने के तथ्य के आधार पर निष्कर्ष निकालना चाहिए।

इसके बजाय, हमें हमेशा कारण और प्रभाव के लिए बहस करने के लिए अलग-अलग साक्ष्यों पर जोर देना चाहिए - और यह सबूत एक एकल सांख्यिकीय संख्या के रूप में नहीं आएगा।

प्रतीत होता है कि सम्बद्ध संबंध, दिए गए जीनों और बीच में कहते हैं एक प्रकार का पागलपन या जो उच्च वसा वाले आहार और हृदय रोग, बहुत संदिग्ध कार्यप्रणाली पर आधारित होने की संभावना है।

हम शायद इन प्रजातियों से निपटने के लिए संज्ञानात्मक रूप से बीमार हैं। कनाडाई शिक्षक के रूप में कयरान इगन इसे अपनी पुस्तक में डाल दिया यह शुरुआत से गलत हो रही है:

बुरी खबर यह है कि हमारे विकास ने हमें छोटे, स्थिर, शिकारी-संग्रहकर्ता समाजों में रहने के लिए सुसज्जित किया है। हम प्लीस्टोसिन लोगों हैं, लेकिन हमारे सुदूर दिमाग ने बड़े पैमाने पर, बहुसांस्कृतिक, तकनीकी तौर पर परिष्कृत और तेजी से बदलते समाजों को हमारे लिए रहने के लिए बनाया है।

परिणामस्वरूप, हमें मौके में अर्थ को देखने के लिए प्रलोभन का विरोध करना और सहसंबंध और कार्यकारण को भ्रमित करना चाहिए।वार्तालाप

यह आलेख मूलतः पर प्रकाशित हुआ था वार्तालाप
पढ़ना मूल लेख.


लेखक के बारे में

borwein जोनाथनजोनाथन बोरविन (जॉन) न्यूकैसल विश्वविद्यालय में गणित के लॉरेट प्रोफेसर हैं। वह न्यूकैसल विश्वविद्यालय में गणित के लॉरेट प्रोफेसर हैं और सेंटर फॉर कम्प्यूटर असिस्टेड रिसर्च मैथमैटिक्स और इसके एप्लीकेशन (सीएआरएएमए) के निदेशक हैं। उन्होंने कार्नेगी-मेलन, डलहौसी, साइमन फ्रेजर, और वॉटरू विश्वविद्यालयों में काम किया है और कंप्यूटिंग में दो कनाडा रिसर्च अध्यक्षों का आयोजन किया है।

गुलाब माइकलमाइकल रोज एक न्यूकैसल विश्वविद्यालय में पीएचडी उम्मीदवार, गणितीय और भौतिक विज्ञान विद्यालय है। ऑस्ट्रेलियाई न्यूकैसल विश्वविद्यालय में लॉरेट प्रोफेसर जॉन बोरविन के पर्यवेक्षण के तहत न्यूमेटैक्ट पीएचडी छात्र के छात्र। वर्तमान में फ्रैक्टल गणित को मस्तिष्क के संक्रमित वितरण मॉडलिंग के लिए आवेदन करने में शोध के साथ सहायता करना।

प्रकटीकरण वाक्य: लेखकों ने इस लेख से लाभान्वित होने वाले किसी भी कंपनी या संगठन से धन प्राप्त करने, परामर्श करने, प्राप्त करने या प्राप्त करने के लिए काम नहीं किया है। उनके पास कोई प्रासंगिक संबद्धता भी नहीं है


की सिफारिश की पुस्तक:

पैसा, सेक्स, युद्ध, कर्मा: एक बौद्ध क्रांति के लिए नोट्स
डेविड आर। लॉय द्वारा

पैसा, सेक्स, युद्ध, कर्मा: एक बौद्ध क्रांति डेविड आर लॉय द्वारा लिए नोट्स।डेविड लॉय बौद्ध विश्वदृष्टि के सबसे शक्तिशाली अधिवक्ताओं में से एक बन गया है, और समझाते हुए कि आधुनिक दुनिया के समाजशास्त्रीय परिदृश्य को बदलने की कोई भी क्षमता नहीं है। में पैसा, लिंग, युद्ध, कर्म, वह कई-कई गैर-गलत बौद्ध स्टेपल्स - कर्मा, स्वयं की प्रकृति, व्यक्तिगत और सामाजिक दोनों स्तरों पर मुसीबतों के कारण-और हमारी सामूहिक भावना के पीछे के वास्तविक कारणों के "तेज" , "क्या यह समय, धन, लिंग, सुरक्षा ... यहां तक ​​कि युद्ध भी है? दाऊद की "बौद्ध क्रांति" हमारे जीवन, हमारे ग्रह, सामूहिक भ्रमों, हमारी भाषा, संस्कृति और यहां तक ​​कि हमारी आध्यात्मिकता के तरीकों पर पहुंचने के तरीके में एक क्रांतिकारी परिवर्तन से कम नहीं है।

अधिक जानकारी और / या अमेज़न पर इस किताब के आदेश के लिए यहाँ क्लिक करें.