यहां एक ऐतिहासिक स्थान है जिसे आप जानते नहीं हैं। न्यू इंग्लैंड में रहने वाले मेथोडिस्ट मंत्रियों की संख्या में वृद्धि हुई, इसलिए 1860 और 1940 वर्षों के बीच में भी बोस्टन में आयात किए गए क्यूबा रम की राशि भी थी - और ये दोनों एक बहुत ही समान तरीके से बढ़ रहे हैं। इस प्रकार, मेथोडिस्ट मंत्रियों ने उस समय की अवधि में बहुत सारे रम खरीदे होंगे!
दरअसल, नहीं, यह आकर्षित करने के लिए एक मूर्ख निष्कर्ष है सचमुच क्या हो रहा है कि दोनों मात्राएं - मेथोडिस्ट मंत्री और क्यूबा रम - अन्य कारकों द्वारा उठाए गए थे, जैसे जनसंख्या वृद्धि
गलत निष्कर्ष तक पहुंचने में, हमने बहुत-बहुत आम गलती की है करणीय साथ भ्रमित सह-संबंध.
क्या फर्क पड़ता है?
दो मात्रा होने के लिए कहा जाता है सहसंबद्ध यदि दोनों एक साथ ("सकारात्मक सहसंबद्ध") वृद्धि या घटती रहती है, या यदि कोई अन्य घटता है और जब अन्य कम हो जाता है ("नकारात्मक सहसंबंधित")।
सहसंबंध आसानी के सांख्यिकीय माप के माध्यम से पता चला है पियरसन के सहसंबंध गुणांक, जो इंगित करता है कि दो मात्रा एक साथ कसकर बंद हो जाती है- 1 से (पूरी तरह से नकारात्मक सहसंबंधित) 0 के माध्यम से (सभी सहसंबद्ध नहीं) और 1 तक (पूरी तरह से सकारात्मक सहसंबंधित)।
लेकिन सिर्फ इसलिए कि दो मात्राएं सहसंबद्ध हैं इसका मतलब यह नहीं है कि एक सीधे है के कारण दूसरे को बदलने के लिए सहसंबंध प्रोत्साहन नहीं करता है, जैसे बादल मौसम वर्षा का मतलब नहीं है, भले ही रिवर्स सच है।
यदि दो मात्राएं सहसंबद्ध हैं तो एक वास्तविक कारण-और-प्रभाव संबंध (जैसे कि बारिश स्तर और छाता की बिक्री) हो सकती है, लेकिन हो सकता है कि अन्य चर दोनों गाड़ी चला रहे हों (जैसे समुद्री डाकू संख्या और ग्लोबल वार्मिंग), या शायद यह सिर्फ संयोग है (जैसे अमेरिकी पनीर की खपत और गलती-द्वारा-बेडसेट).
यहां तक कि जहां करणीय मौजूद है, हम सावधान प्रभाव से कारण मिश्रण करने के लिए नहीं होना चाहिए, वरना हम उदाहरण के लिए, समाप्त हो सकता है, कि हीटर का एक बढ़ा उपयोग ठंडा मौसम का कारण बनता है।
आदेश में कारण और प्रभाव स्थापित करने के लिए, हम आंकड़ों से परे जाकर (एक वैज्ञानिक या ऐतिहासिक प्रकृति के) अलग सबूत और तार्किक तर्क के लिए देखने की जरूरत है। सहसंबंध पहली जगह में इस तरह के सबूत की तलाश में जाने के लिए हमें संकेत हो सकता है, लेकिन यह कोई अपने आप में एक सबूत का मतलब है।
सूक्ष्म मुद्दे
हालांकि उपरोक्त उदाहरण जाहिर मूर्ख थे, सहसंबंध बहुत बार तरीके है कि तुरंत वास्तविक दुनिया में स्पष्ट नहीं कर रहे हैं में करणीय के लिए गलत है। जब पढ़ने और आँकड़ों को समझने, एक समझने के लिए कि क्या वास्तव में डेटा और उसके आंकड़े संकेत दे रही हो महान ख्याल रखना चाहिए - और अधिक महत्वपूर्ण बात, वे क्या कर रहे हैं नहीं जिसका अर्थ है।
व्याख्या डेटा में सावधानी के लिए जरूरत से एक उदाहरण हाल ही में उत्साह इस साल के शुरू में स्पष्ट groundbreaking आसपास है गुरुत्वाकर्षण तरंगों का पता लगाना - एक घोषणा जो किया गया लगता है समय से पहले ही, डेटा को प्रभावित करने वाले सभी वेरिएबल्स से पहले के लिए जिम्मेदार थे।
दुर्भाग्य से, सांख्यिकी, संभावनाओं और जोखिम का विश्लेषण करने के लिए एक कौशल सेट में तार नहीं है हमारे मानव अंतर्ज्ञान, और ऐसा करने के लिए सभी बहुत आसान है भटक नेतृत्व किया संपूर्ण पुस्तकें उन सूक्ष्म तरीकों पर लिखे गए हैं जिनमें आँकड़े गलत तरीके से व्याख्या किए जा सकते हैं (या भ्रामक करने के लिए इस्तेमाल किया जा सकता है)। अपने गार्ड को बनाए रखने में मदद करने के लिए, यहां कुछ सामान्य फिसलन सांख्यिकीय समस्याएं हैं जिन्हें आपको अवगत होना चाहिए:
1) स्वस्थ कार्यकर्ता प्रभाव, जहां कभी-कभी दो समूहों को एक स्तर के खेल मैदान से सीधे तुलना नहीं किया जा सकता।
अंतरिक्ष यान के समूह के स्वास्थ्य के साथ कार्यालय कार्यकर्ताओं के एक समूह के स्वास्थ्य की तुलना करते हुए एक काल्पनिक अध्ययन पर विचार करें। यदि अध्ययन में दोनों के बीच कोई महत्वपूर्ण अंतर नहीं दिखाया गया है - स्वास्थ्य और काम के माहौल के बीच कोई संबंध नहीं है - क्या हम यह निष्कर्ष निकालना चाहते हैं कि अंतरिक्ष और अंतरिक्ष में रहने वाले अंतरिक्ष यात्रीों के लिए कोई दीर्घकालिक स्वास्थ्य जोखिम नहीं है?
नहीं! समूह समान स्तर पर नहीं हैं: अंतरिक्ष यात्री कोर स्क्रीन आवेदकों को स्वस्थ उम्मीदवारों को खोजने के लिए, जो "माइक्रोग्राविटी" में रहने के प्रभावों का लगातार विरोध करने के लिए एक व्यापक स्वास्थ्य व्यवस्था बनाए रखते हैं
इसलिए हम अपेक्षा करते हैं कि वे कार्यालय श्रमिकों की तुलना में औसतन महत्वपूर्ण स्वस्थ हो, और यदि वे नहीं थे तो उन्हें सही मायने में चिंतित होना चाहिए।
2) वर्गीकरण और स्टेज प्रवासन प्रभाव - समूहों के बीच लोगों को फेरबदल करने से सांख्यिकीय परिणामों पर नाटकीय प्रभाव पड़ सकता है।
इसे इस रूप में भी जाना जाता है विल रोजर्स प्रभाव, अमेरिकी हास्य अभिनेता के बाद जो कथित तौर पर कटा हुआ था:
Okies ओक्लाहोमा छोड़ दिया और कैलिफोर्निया में ले जाया गया है, वे दोनों ही राज्यों में औसत बुद्धि के स्तर को उठाया था।
उदाहरण के लिए, मित्रों के एक बड़े समूह को "लघु" समूह और एक "लंबा" समूह (शायद एक तस्वीर के लिए उन्हें व्यवस्थित करने के लिए) में विभाजित करने की कल्पना करें। ऐसा करने के बाद, दोनों समूहों की औसत ऊंचाई एक बार में बढ़ाना आश्चर्यजनक रूप से आसान है
बस "छोटे" समूह में जाने के लिए "लंबा" समूह में कम से कम व्यक्ति पूछें "लंबा" समूह अपने सबसे कम से कम सदस्य को खो देता है, इस प्रकार उनकी औसत ऊंचाई को बढ़ाता है - लेकिन "लघु" समूह अभी तक अपना सबसे बड़ा सदस्य बना लेता है, और इस प्रकार औसत ऊंचाई में भी लाभ मिलता है
इसका चिकित्सा अध्ययनों में प्रमुख प्रभाव पड़ता है, जहां अक्सर रोगियों को एक नए उपचार की जांच के दौरान "स्वस्थ" या "अस्वास्थ्यकर" समूहों में हल किया जाता है। यदि नैदानिक विधियों में सुधार हुआ है, तो कुछ बहुत-थोड़ा-अस्वास्थ्यकर रोगियों को पुन: वर्गीकृत किया जा सकता है- दोनों समूहों के स्वास्थ्य परिणामों में सुधार होता है, भले ही इलाज कैसे प्रभावी है (या नहीं)
3) डाटा खनन - डेटा के एक बहुतायत मौजूद है जब, टुकड़े टुकड़े और चेरी उठाया किसी भी वांछित निष्कर्ष का समर्थन करने के लिए हो सकता है।
यह खराब सांख्यिकीय अभ्यास है, लेकिन अगर जानबूझ कर किया मूल, पूर्ण डेटा सेट के ज्ञान के बिना हाजिर होना कठिन हो सकता है।
उदाहरण के लिए, ग्लोबल वार्मिंग डेटा के दो व्याख्याओं को दिखाते हुए उपरोक्त ग्राफ़ पर विचार करें। या फ्लोराइड - छोटी मात्रा में यह इतिहास में सबसे प्रभावी रोकथाम वाली दवाओं में से एक है, लेकिन सकारात्मक प्रभाव पूरी तरह से गायब हो जाता है अगर कोई केवल कभी भी फ्लोराइड के विषाक्त मात्रा को समझता है।
इसी तरह के कारणों के लिए, यह महत्वपूर्ण है कि प्रयोग के शुरू होने से पहले दिए गए सांख्यिकीय प्रयोग की प्रक्रियाएं तय की जाती हैं और फिर तब तक अपरिवर्तित रहें जब तक प्रयोग समाप्त नहीं हो जाता।
4) क्लस्टरिंग - जो पूरी तरह यादृच्छिक डेटा में भी उम्मीद की जानी चाहिए।
एक चिकित्सा अध्ययन पर विचार करें कि कैंसर या मल्टीपल स्केलेरोसिस जैसे किसी विशेष बीमारी के लक्षण कैसा हैं भौगोलिक रूप से वितरित। अगर रोग यादृच्छिक (और पर्यावरण का कोई असर नहीं) पर हमला होता है तो हम मरीजों के कई समूहों को देखने की उम्मीद करते हैं जैसे कि पाठ्यक्रम की बात है। यदि रोगियों को समान रूप से समान रूप से फैलाया जाता है, तो वितरण सबसे अन्तर्निर्मित होगा!
इसलिए एक क्लस्टर की उपस्थिति, या मामलों के छोटे समूहों की संख्या पूरी तरह से सामान्य है। परिष्कृत सांख्यिकीय तरीकों को यह निर्धारित करने के लिए जरूरी है कि उस क्षेत्र में कुछ बीमारी पैदा करने के कारण कितना क्लस्टरिंग आवश्यक है
दुर्भाग्य से, कोई भी क्लस्टर बिल्कुल भी - एक भी महत्वपूर्ण नहीं - एक आसान (और पहली नज़र, सम्मोहक) समाचार शीर्षक के लिए बनाता है
सांख्यिकीय विश्लेषण, किसी भी अन्य शक्तिशाली उपकरण की तरह, बहुत सावधानी से इस्तेमाल किया जाना चाहिए - और विशेष रूप से, एक को हमेशा इस बात पर ध्यान रखना चाहिए कि दो मात्राएं सहसंबद्ध होने के तथ्य के आधार पर निष्कर्ष निकालना चाहिए।
इसके बजाय, हमें हमेशा कारण और प्रभाव के लिए बहस करने के लिए अलग-अलग साक्ष्यों पर जोर देना चाहिए - और यह सबूत एक एकल सांख्यिकीय संख्या के रूप में नहीं आएगा।
प्रतीत होता है कि सम्बद्ध संबंध, दिए गए जीनों और बीच में कहते हैं एक प्रकार का पागलपन या जो उच्च वसा वाले आहार और हृदय रोग, बहुत संदिग्ध कार्यप्रणाली पर आधारित होने की संभावना है।
हम शायद इन प्रजातियों से निपटने के लिए संज्ञानात्मक रूप से बीमार हैं। कनाडाई शिक्षक के रूप में कयरान इगन इसे अपनी पुस्तक में डाल दिया यह शुरुआत से गलत हो रही है:
बुरी खबर यह है कि हमारे विकास ने हमें छोटे, स्थिर, शिकारी-संग्रहकर्ता समाजों में रहने के लिए सुसज्जित किया है। हम प्लीस्टोसिन लोगों हैं, लेकिन हमारे सुदूर दिमाग ने बड़े पैमाने पर, बहुसांस्कृतिक, तकनीकी तौर पर परिष्कृत और तेजी से बदलते समाजों को हमारे लिए रहने के लिए बनाया है।
परिणामस्वरूप, हमें मौके में अर्थ को देखने के लिए प्रलोभन का विरोध करना और सहसंबंध और कार्यकारण को भ्रमित करना चाहिए।
यह आलेख मूलतः पर प्रकाशित हुआ था वार्तालाप
पढ़ना मूल लेख.
लेखक के बारे में
जोनाथन बोरविन (जॉन) न्यूकैसल विश्वविद्यालय में गणित के लॉरेट प्रोफेसर हैं। वह न्यूकैसल विश्वविद्यालय में गणित के लॉरेट प्रोफेसर हैं और सेंटर फॉर कम्प्यूटर असिस्टेड रिसर्च मैथमैटिक्स और इसके एप्लीकेशन (सीएआरएएमए) के निदेशक हैं। उन्होंने कार्नेगी-मेलन, डलहौसी, साइमन फ्रेजर, और वॉटरू विश्वविद्यालयों में काम किया है और कंप्यूटिंग में दो कनाडा रिसर्च अध्यक्षों का आयोजन किया है।
माइकल रोज एक न्यूकैसल विश्वविद्यालय में पीएचडी उम्मीदवार, गणितीय और भौतिक विज्ञान विद्यालय है। ऑस्ट्रेलियाई न्यूकैसल विश्वविद्यालय में लॉरेट प्रोफेसर जॉन बोरविन के पर्यवेक्षण के तहत न्यूमेटैक्ट पीएचडी छात्र के छात्र। वर्तमान में फ्रैक्टल गणित को मस्तिष्क के संक्रमित वितरण मॉडलिंग के लिए आवेदन करने में शोध के साथ सहायता करना।
प्रकटीकरण वाक्य: लेखकों ने इस लेख से लाभान्वित होने वाले किसी भी कंपनी या संगठन से धन प्राप्त करने, परामर्श करने, प्राप्त करने या प्राप्त करने के लिए काम नहीं किया है। उनके पास कोई प्रासंगिक संबद्धता भी नहीं है
की सिफारिश की पुस्तक:
पैसा, सेक्स, युद्ध, कर्मा: एक बौद्ध क्रांति के लिए नोट्स
डेविड आर। लॉय द्वारा
डेविड लॉय बौद्ध विश्वदृष्टि के सबसे शक्तिशाली अधिवक्ताओं में से एक बन गया है, और समझाते हुए कि आधुनिक दुनिया के समाजशास्त्रीय परिदृश्य को बदलने की कोई भी क्षमता नहीं है। में पैसा, लिंग, युद्ध, कर्म, वह कई-कई गैर-गलत बौद्ध स्टेपल्स - कर्मा, स्वयं की प्रकृति, व्यक्तिगत और सामाजिक दोनों स्तरों पर मुसीबतों के कारण-और हमारी सामूहिक भावना के पीछे के वास्तविक कारणों के "तेज" , "क्या यह समय, धन, लिंग, सुरक्षा ... यहां तक कि युद्ध भी है? दाऊद की "बौद्ध क्रांति" हमारे जीवन, हमारे ग्रह, सामूहिक भ्रमों, हमारी भाषा, संस्कृति और यहां तक कि हमारी आध्यात्मिकता के तरीकों पर पहुंचने के तरीके में एक क्रांतिकारी परिवर्तन से कम नहीं है।
अधिक जानकारी और / या अमेज़न पर इस किताब के आदेश के लिए यहाँ क्लिक करें.