भ्रम को साफ करने सहसंबंध और करणीय के बीच

भ्रम को साफ करने सहसंबंध और करणीय के बीच

यहां एक ऐतिहासिक स्थान है जिसे आप जानते नहीं हैं। न्यू इंग्लैंड में रहने वाले मेथोडिस्ट मंत्रियों की संख्या में वृद्धि हुई, इसलिए 1860 और 1940 वर्षों के बीच में भी बोस्टन में आयात किए गए क्यूबा रम की राशि भी थी - और ये दोनों एक बहुत ही समान तरीके से बढ़ रहे हैं। इस प्रकार, मेथोडिस्ट मंत्रियों ने उस समय की अवधि में बहुत सारे रम खरीदे होंगे!

दरअसल, नहीं, यह आकर्षित करने के लिए एक मूर्ख निष्कर्ष है सचमुच क्या हो रहा है कि दोनों मात्राएं - मेथोडिस्ट मंत्री और क्यूबा रम - अन्य कारकों द्वारा उठाए गए थे, जैसे जनसंख्या वृद्धि

गलत निष्कर्ष तक पहुंचने में, हमने बहुत-बहुत आम गलती की है करणीय साथ भ्रमित सह-संबंध.

क्या फर्क पड़ता है?

दो मात्रा होने के लिए कहा जाता है सहसंबद्ध यदि दोनों एक साथ ("सकारात्मक सहसंबद्ध") वृद्धि या घटती रहती है, या यदि कोई अन्य घटता है और जब अन्य कम हो जाता है ("नकारात्मक सहसंबंधित")।

सहसंबंध आसानी के सांख्यिकीय माप के माध्यम से पता चला है पियरसन के सहसंबंध गुणांक, जो इंगित करता है कि दो मात्रा एक साथ कसकर बंद हो जाती है- 1 से (पूरी तरह से नकारात्मक सहसंबंधित) 0 के माध्यम से (सभी सहसंबद्ध नहीं) और 1 तक (पूरी तरह से सकारात्मक सहसंबंधित)।

causation1tylervigen.com

लेकिन सिर्फ इसलिए कि दो मात्राएं सहसंबद्ध हैं इसका मतलब यह नहीं है कि एक सीधे है के कारण दूसरे को बदलने के लिए सहसंबंध प्रोत्साहन नहीं करता है, जैसे बादल मौसम वर्षा का मतलब नहीं है, भले ही रिवर्स सच है।

यदि दो मात्राएं सहसंबद्ध हैं तो एक वास्तविक कारण-और-प्रभाव संबंध (जैसे कि बारिश स्तर और छाता की बिक्री) हो सकती है, लेकिन हो सकता है कि अन्य चर दोनों गाड़ी चला रहे हों (जैसे समुद्री डाकू संख्या और ग्लोबल वार्मिंग), या शायद यह सिर्फ संयोग है (जैसे अमेरिकी पनीर की खपत और गलती-द्वारा-बेडसेट).

यहां तक ​​कि जहां करणीय मौजूद है, हम सावधान प्रभाव से कारण मिश्रण करने के लिए नहीं होना चाहिए, वरना हम उदाहरण के लिए, समाप्त हो सकता है, कि हीटर का एक बढ़ा उपयोग ठंडा मौसम का कारण बनता है।

आदेश में कारण और प्रभाव स्थापित करने के लिए, हम आंकड़ों से परे जाकर (एक वैज्ञानिक या ऐतिहासिक प्रकृति के) अलग सबूत और तार्किक तर्क के लिए देखने की जरूरत है। सहसंबंध पहली जगह में इस तरह के सबूत की तलाश में जाने के लिए हमें संकेत हो सकता है, लेकिन यह कोई अपने आप में एक सबूत का मतलब है।

सूक्ष्म मुद्दे

हालांकि उपरोक्त उदाहरण जाहिर मूर्ख थे, सहसंबंध बहुत बार तरीके है कि तुरंत वास्तविक दुनिया में स्पष्ट नहीं कर रहे हैं में करणीय के लिए गलत है। जब पढ़ने और आँकड़ों को समझने, एक समझने के लिए कि क्या वास्तव में डेटा और उसके आंकड़े संकेत दे रही हो महान ख्याल रखना चाहिए - और अधिक महत्वपूर्ण बात, वे क्या कर रहे हैं नहीं जिसका अर्थ है।

causation2

व्याख्या डेटा में सावधानी के लिए जरूरत से एक उदाहरण हाल ही में उत्साह इस साल के शुरू में स्पष्ट groundbreaking आसपास है गुरुत्वाकर्षण तरंगों का पता लगाना - एक घोषणा जो किया गया लगता है समय से पहले ही, डेटा को प्रभावित करने वाले सभी वेरिएबल्स से पहले के लिए जिम्मेदार थे।

दुर्भाग्य से, सांख्यिकी, संभावनाओं और जोखिम का विश्लेषण करने के लिए एक कौशल सेट में तार नहीं है हमारे मानव अंतर्ज्ञान, और ऐसा करने के लिए सभी बहुत आसान है भटक नेतृत्व किया संपूर्ण पुस्तकें उन सूक्ष्म तरीकों पर लिखे गए हैं जिनमें आँकड़े गलत तरीके से व्याख्या किए जा सकते हैं (या भ्रामक करने के लिए इस्तेमाल किया जा सकता है)। अपने गार्ड को बनाए रखने में मदद करने के लिए, यहां कुछ सामान्य फिसलन सांख्यिकीय समस्याएं हैं जिन्हें आपको अवगत होना चाहिए:

1) स्वस्थ कार्यकर्ता प्रभाव, जहां कभी-कभी दो समूहों को एक स्तर के खेल मैदान से सीधे तुलना नहीं किया जा सकता।

अंतरिक्ष यान के समूह के स्वास्थ्य के साथ कार्यालय कार्यकर्ताओं के एक समूह के स्वास्थ्य की तुलना करते हुए एक काल्पनिक अध्ययन पर विचार करें। यदि अध्ययन में दोनों के बीच कोई महत्वपूर्ण अंतर नहीं दिखाया गया है - स्वास्थ्य और काम के माहौल के बीच कोई संबंध नहीं है - क्या हम यह निष्कर्ष निकालना चाहते हैं कि अंतरिक्ष और अंतरिक्ष में रहने वाले अंतरिक्ष यात्रीों के लिए कोई दीर्घकालिक स्वास्थ्य जोखिम नहीं है?

नहीं! समूह समान स्तर पर नहीं हैं: अंतरिक्ष यात्री कोर स्क्रीन आवेदकों को स्वस्थ उम्मीदवारों को खोजने के लिए, जो "माइक्रोग्राविटी" में रहने के प्रभावों का लगातार विरोध करने के लिए एक व्यापक स्वास्थ्य व्यवस्था बनाए रखते हैं

इसलिए हम अपेक्षा करते हैं कि वे कार्यालय श्रमिकों की तुलना में औसतन महत्वपूर्ण स्वस्थ हो, और यदि वे नहीं थे तो उन्हें सही मायने में चिंतित होना चाहिए।

2) वर्गीकरण और स्टेज प्रवासन प्रभाव - समूहों के बीच लोगों को फेरबदल करने से सांख्यिकीय परिणामों पर नाटकीय प्रभाव पड़ सकता है।

इसे इस रूप में भी जाना जाता है विल रोजर्स प्रभाव, अमेरिकी हास्य अभिनेता के बाद जो कथित तौर पर कटा हुआ था:

Okies ओक्लाहोमा छोड़ दिया और कैलिफोर्निया में ले जाया गया है, वे दोनों ही राज्यों में औसत बुद्धि के स्तर को उठाया था।

उदाहरण के लिए, मित्रों के एक बड़े समूह को "लघु" समूह और एक "लंबा" समूह (शायद एक तस्वीर के लिए उन्हें व्यवस्थित करने के लिए) में विभाजित करने की कल्पना करें। ऐसा करने के बाद, दोनों समूहों की औसत ऊंचाई एक बार में बढ़ाना आश्चर्यजनक रूप से आसान है

बस "छोटे" समूह में जाने के लिए "लंबा" समूह में कम से कम व्यक्ति पूछें "लंबा" समूह अपने सबसे कम से कम सदस्य को खो देता है, इस प्रकार उनकी औसत ऊंचाई को बढ़ाता है - लेकिन "लघु" समूह अभी तक अपना सबसे बड़ा सदस्य बना लेता है, और इस प्रकार औसत ऊंचाई में भी लाभ मिलता है

इसका चिकित्सा अध्ययनों में प्रमुख प्रभाव पड़ता है, जहां अक्सर रोगियों को एक नए उपचार की जांच के दौरान "स्वस्थ" या "अस्वास्थ्यकर" समूहों में हल किया जाता है। यदि नैदानिक ​​विधियों में सुधार हुआ है, तो कुछ बहुत-थोड़ा-अस्वास्थ्यकर रोगियों को पुन: वर्गीकृत किया जा सकता है- दोनों समूहों के स्वास्थ्य परिणामों में सुधार होता है, भले ही इलाज कैसे प्रभावी है (या नहीं)

causation3डेटा के बीच चुनना और चुनना गलत निष्कर्ष हो सकता है संदेहास्पद ठंड (नीला) की अवधि देखते हैं जब डेटा वास्तव में दीर्घकालिक वार्मिंग (हरा) दिखाता है। skepticalscience.com

3) डाटा खनन - डेटा के एक बहुतायत मौजूद है जब, टुकड़े टुकड़े और चेरी उठाया किसी भी वांछित निष्कर्ष का समर्थन करने के लिए हो सकता है।

यह खराब सांख्यिकीय अभ्यास है, लेकिन अगर जानबूझ कर किया मूल, पूर्ण डेटा सेट के ज्ञान के बिना हाजिर होना कठिन हो सकता है।

उदाहरण के लिए, ग्लोबल वार्मिंग डेटा के दो व्याख्याओं को दिखाते हुए उपरोक्त ग्राफ़ पर विचार करें। या फ्लोराइड - छोटी मात्रा में यह इतिहास में सबसे प्रभावी रोकथाम वाली दवाओं में से एक है, लेकिन सकारात्मक प्रभाव पूरी तरह से गायब हो जाता है अगर कोई केवल कभी भी फ्लोराइड के विषाक्त मात्रा को समझता है।

इसी तरह के कारणों के लिए, यह महत्वपूर्ण है कि प्रयोग के शुरू होने से पहले दिए गए सांख्यिकीय प्रयोग की प्रक्रियाएं तय की जाती हैं और फिर तब तक अपरिवर्तित रहें जब तक प्रयोग समाप्त नहीं हो जाता।

4) क्लस्टरिंग - जो पूरी तरह यादृच्छिक डेटा में भी उम्मीद की जानी चाहिए।

एक चिकित्सा अध्ययन पर विचार करें कि कैंसर या मल्टीपल स्केलेरोसिस जैसे किसी विशेष बीमारी के लक्षण कैसा हैं भौगोलिक रूप से वितरित। अगर रोग यादृच्छिक (और पर्यावरण का कोई असर नहीं) पर हमला होता है तो हम मरीजों के कई समूहों को देखने की उम्मीद करते हैं जैसे कि पाठ्यक्रम की बात है। यदि रोगियों को समान रूप से समान रूप से फैलाया जाता है, तो वितरण सबसे अन्तर्निर्मित होगा!

इसलिए एक क्लस्टर की उपस्थिति, या मामलों के छोटे समूहों की संख्या पूरी तरह से सामान्य है। परिष्कृत सांख्यिकीय तरीकों को यह निर्धारित करने के लिए जरूरी है कि उस क्षेत्र में कुछ बीमारी पैदा करने के कारण कितना क्लस्टरिंग आवश्यक है

दुर्भाग्य से, कोई भी क्लस्टर बिल्कुल भी - एक भी महत्वपूर्ण नहीं - एक आसान (और पहली नज़र, सम्मोहक) समाचार शीर्षक के लिए बनाता है

causation4

सांख्यिकीय विश्लेषण, किसी भी अन्य शक्तिशाली उपकरण की तरह, बहुत सावधानी से इस्तेमाल किया जाना चाहिए - और विशेष रूप से, एक को हमेशा इस बात पर ध्यान रखना चाहिए कि दो मात्राएं सहसंबद्ध होने के तथ्य के आधार पर निष्कर्ष निकालना चाहिए।

इसके बजाय, हमें हमेशा कारण और प्रभाव के लिए बहस करने के लिए अलग-अलग साक्ष्यों पर जोर देना चाहिए - और यह सबूत एक एकल सांख्यिकीय संख्या के रूप में नहीं आएगा।

प्रतीत होता है कि सम्बद्ध संबंध, दिए गए जीनों और बीच में कहते हैं एक प्रकार का पागलपन या जो उच्च वसा वाले आहार और हृदय रोग, बहुत संदिग्ध कार्यप्रणाली पर आधारित होने की संभावना है।

हम शायद इन प्रजातियों से निपटने के लिए संज्ञानात्मक रूप से बीमार हैं। कनाडाई शिक्षक के रूप में कयरान इगन इसे अपनी पुस्तक में डाल दिया यह शुरुआत से गलत हो रही है:

बुरी खबर यह है कि हमारे विकास ने हमें छोटे, स्थिर, शिकारी-संग्रहकर्ता समाजों में रहने के लिए सुसज्जित किया है। हम प्लीस्टोसिन लोगों हैं, लेकिन हमारे सुदूर दिमाग ने बड़े पैमाने पर, बहुसांस्कृतिक, तकनीकी तौर पर परिष्कृत और तेजी से बदलते समाजों को हमारे लिए रहने के लिए बनाया है।

परिणामस्वरूप, हमें मौके में अर्थ को देखने के लिए प्रलोभन का विरोध करना और सहसंबंध और कार्यकारण को भ्रमित करना चाहिए।वार्तालाप

यह आलेख मूलतः पर प्रकाशित हुआ था वार्तालाप
पढ़ना मूल लेख.


लेखक के बारे में

borwein जोनाथनजोनाथन बोरविन (जॉन) न्यूकैसल विश्वविद्यालय में गणित के लॉरेट प्रोफेसर हैं। वह न्यूकैसल विश्वविद्यालय में गणित के लॉरेट प्रोफेसर हैं और सेंटर फॉर कम्प्यूटर असिस्टेड रिसर्च मैथमैटिक्स और इसके एप्लीकेशन (सीएआरएएमए) के निदेशक हैं। उन्होंने कार्नेगी-मेलन, डलहौसी, साइमन फ्रेजर, और वॉटरू विश्वविद्यालयों में काम किया है और कंप्यूटिंग में दो कनाडा रिसर्च अध्यक्षों का आयोजन किया है।

गुलाब माइकलमाइकल रोज एक न्यूकैसल विश्वविद्यालय में पीएचडी उम्मीदवार, गणितीय और भौतिक विज्ञान विद्यालय है। ऑस्ट्रेलियाई न्यूकैसल विश्वविद्यालय में लॉरेट प्रोफेसर जॉन बोरविन के पर्यवेक्षण के तहत न्यूमेटैक्ट पीएचडी छात्र के छात्र। वर्तमान में फ्रैक्टल गणित को मस्तिष्क के संक्रमित वितरण मॉडलिंग के लिए आवेदन करने में शोध के साथ सहायता करना।

प्रकटीकरण वाक्य: लेखकों ने इस लेख से लाभान्वित होने वाले किसी भी कंपनी या संगठन से धन प्राप्त करने, परामर्श करने, प्राप्त करने या प्राप्त करने के लिए काम नहीं किया है। उनके पास कोई प्रासंगिक संबद्धता भी नहीं है


की सिफारिश की पुस्तक:

पैसा, सेक्स, युद्ध, कर्मा: एक बौद्ध क्रांति के लिए नोट्स
डेविड आर। लॉय द्वारा

पैसा, सेक्स, युद्ध, कर्मा: एक बौद्ध क्रांति डेविड आर लॉय द्वारा लिए नोट्स।डेविड लॉय बौद्ध विश्वदृष्टि के सबसे शक्तिशाली अधिवक्ताओं में से एक बन गया है, और समझाते हुए कि आधुनिक दुनिया के समाजशास्त्रीय परिदृश्य को बदलने की कोई भी क्षमता नहीं है। में पैसा, लिंग, युद्ध, कर्म, वह कई-कई गैर-गलत बौद्ध स्टेपल्स - कर्मा, स्वयं की प्रकृति, व्यक्तिगत और सामाजिक दोनों स्तरों पर मुसीबतों के कारण-और हमारी सामूहिक भावना के पीछे के वास्तविक कारणों के "तेज" , "क्या यह समय, धन, लिंग, सुरक्षा ... यहां तक ​​कि युद्ध भी है? दाऊद की "बौद्ध क्रांति" हमारे जीवन, हमारे ग्रह, सामूहिक भ्रमों, हमारी भाषा, संस्कृति और यहां तक ​​कि हमारी आध्यात्मिकता के तरीकों पर पहुंचने के तरीके में एक क्रांतिकारी परिवर्तन से कम नहीं है।

अधिक जानकारी और / या अमेज़न पर इस किताब के आदेश के लिए यहाँ क्लिक करें.


आपको यह भी पसंद आ सकता हैं

enafarzh-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

InnerSelf पर का पालन करें

फेसबुक आइकनट्विटर आइकनआरएसएस आइकन

ईमेल से नवीनतम प्राप्त करें

{Emailcloak = बंद}

इनर्सल्फ़ आवाज

सूचना चिकित्सा: स्वास्थ्य और चिकित्सा में नया प्रतिमान
सूचना चिकित्सा स्वास्थ्य और हीलिंग में नया प्रतिमान है
by एरविन लेज़्लो और पियर मारियो बियावा, एमडी।
बिना शर्त के प्यार का चुनाव: दुनिया को बिना शर्त प्यार की जरूरत है
बिना शर्त के प्यार का चुनाव: दुनिया को बिना शर्त प्यार की जरूरत है
by एलीन कैडी एमबीई और डेविड अर्ल प्लैट्स, पीएचडी।

सबसे ज़्यादा पढ़ा हुआ

माया और हमारे समकालीन अर्थ के लिए खोज
माया और हमारे समकालीन अर्थ के लिए खोज
by गैब्रिएला जुआरोज़-लांडा
घर का बना आइसक्रीम रेसिपी
by साफ और स्वादिष्ट