Εκκαθάριση σύγχυσης μεταξύ συσχέτισης και αιτιώδους συνάφειας 

Εδώ είναι ένα ιστορικό μήνυμα που μπορεί να μην γνωρίζετε. Μεταξύ των ετών 1860 και 1940, καθώς ο αριθμός των μεθοδιστών υπουργών που ζούσαν στη Νέα Αγγλία αυξήθηκε, έτσι και το ποσό του κουβανικού ρουμιού εισήχθη στη Βοστώνη - και και οι δύο αυξήθηκαν με έναν εξαιρετικά παρόμοιο τρόπο. Έτσι, οι μεθοδιστές υπουργοί πρέπει να έχουν αγοράσει πολύ ρούμι εκείνη τη χρονική περίοδο!

Στην πραγματικότητα όχι, αυτό είναι ανόητο συμπέρασμα. Αυτό που συμβαίνει πραγματικά είναι ότι και οι δύο ποσότητες - μεθοδιστές υπουργοί και κουβανικό ρούμι - οδηγήθηκαν προς τα πάνω από άλλους παράγοντες, όπως η αύξηση του πληθυσμού.

Καταλήγοντας σε αυτό το λανθασμένο συμπέρασμα, κάναμε το πολύ κοινό λάθος συγχέοντας τη συσχέτιση με την αιτιώδη συνάφεια.

Ποιά είναι η διαφορά?

Δύο ποσότητες λέγεται ότι είναι συσχετίζονται  εάν και τα δύο αυξάνονται και μειώνονται μαζί ("θετικά συσχετιζόμενα"), ή εάν το ένα αυξάνεται όταν μειώνεται το άλλο και αντίστροφα ("αρνητικά συσχετίζεται").

Ο συσχετισμός ανιχνεύεται εύκολα μέσω στατιστικών μετρήσεων του Συντελεστής συσχέτισης Pearson, το οποίο υποδεικνύει πόσο σφιχτά είναι κλειδωμένα μεταξύ τους οι δύο ποσότητες, που κυμαίνονται από -1 (απόλυτα αρνητικά συσχετιζόμενες) έως 0 (καθόλου συσχετιζόμενες) και έως 1 (απόλυτα θετικά συσχετισμένες).


εσωτερικά εγγραφείτε γραφικό


 αιτιότητα 1tylervigen.com

Αλλά επειδή συσχετίζονται δύο ποσότητες δεν σημαίνει απαραίτητα ότι το ένα είναι άμεσα προκαλώντας το άλλο να αλλάξει. Η συσχέτιση δεν συνεπάγεται αιτιώδη συνάφεια, όπως ο συννεφιασμένος καιρός δεν συνεπάγεται βροχοπτώσεις, παρόλο που ισχύει το αντίστροφο.

Εάν δύο ποσότητες συσχετίζονται, τότε μπορεί κάλλιστα να υπάρχει μια πραγματική σχέση αιτίου-αποτελέσματος (όπως τα επίπεδα βροχοπτώσεων και οι πωλήσεις ομπρελών), αλλά ίσως άλλες μεταβλητές να οδηγούν και τις δύο (όπως πειρατικοί αριθμοί και υπερθέρμανση του πλανήτη), ή ίσως είναι απλώς σύμπτωση (όπως π.χ. Αμερικανική κατανάλωση τυριού και στραγγαλισμός με σεντόνι).

Ακόμη και όταν υπάρχει αιτιώδης συνάφεια, πρέπει να είμαστε προσεκτικοί για να μην ανακατεύουμε την αιτία με το αποτέλεσμα, αλλιώς θα μπορούσαμε να συμπεράνουμε, για παράδειγμα, ότι η αυξημένη χρήση θερμαντήρων προκαλεί ψυχρότερες καιρικές συνθήκες.

Για να διαπιστωθεί η αιτία και το αποτέλεσμα, πρέπει να ξεπεράσουμε τις στατιστικές και να αναζητήσουμε ξεχωριστά στοιχεία (επιστημονικής ή ιστορικής φύσης) και λογικούς συλλογισμούς. Ο συσχετισμός μπορεί να μας ωθήσει να αναζητήσουμε τέτοια στοιχεία καταρχάς, αλλά σε καμία περίπτωση δεν αποτελεί από μόνη της απόδειξη.

Λεπτά Θέματα

Αν και τα παραπάνω παραδείγματα ήταν προφανώς ανόητα, η συσχέτιση συγχέεται πολύ συχνά ως αιτιώδης με τρόπους που δεν είναι άμεσα εμφανείς στον πραγματικό κόσμο. Όταν διαβάζετε και ερμηνεύετε στατιστικά, πρέπει να προσέχετε πολύ για να καταλάβετε τι ακριβώς υπονοούν τα δεδομένα και τα στατιστικά του - και το πιο σημαντικό, τι είναι δεν υπονοώντας

 αιτιότητα 2

Ένα πρόσφατο παράδειγμα της ανάγκης για προσοχή στην ερμηνεία των δεδομένων είναι ο ενθουσιασμός νωρίτερα φέτος γύρω από την προφανή πρωτοποριακή ανίχνευση βαρυτικών κυμάτων - μια ανακοίνωση που φαίνεται να έχει γίνει πρόωρα, πριν υπολογιστούν όλες οι μεταβλητές που επηρέασαν τα δεδομένα.

Δυστυχώς, η ανάλυση στατιστικών, πιθανοτήτων και κινδύνων δεν είναι μια δεξιότητα που έχει ενσωματωθεί στη δική μας ανθρώπινη διαίσθηση, και έτσι είναι πολύ εύκολο να παρασυρθούμε. Ολόκληρα βιβλία έχουν γραφτεί για τους λεπτούς τρόπους με τους οποίους οι στατιστικές μπορούν να παρερμηνευτούν (ή να χρησιμοποιηθούν για παραπλάνηση). Για να διατηρήσετε την προσοχή σας, εδώ είναι μερικά κοινά ολισθηρά στατιστικά προβλήματα που πρέπει να γνωρίζετε:

1) The Effect Healthy Worker, όπου μερικές φορές δύο ομάδες δεν μπορούν να συγκριθούν άμεσα σε ίσους όρους ανταγωνισμού.

Εξετάστε μια υποθετική μελέτη που συγκρίνει την υγεία μιας ομάδας υπαλλήλων γραφείου με την υγεία μιας ομάδας αστροναυτών. Εάν η μελέτη δεν δείχνει σημαντική διαφορά μεταξύ των δύο-δεν υπάρχει συσχέτιση μεταξύ της υγείας και του περιβάλλοντος εργασίας-πρέπει να συμπεράνουμε ότι η διαβίωση και η εργασία στο διάστημα δεν συνεπάγεται μακροπρόθεσμους κινδύνους για την υγεία των αστροναυτών;

Οχι! Οι ομάδες δεν βρίσκονται στην ίδια βάση: το σώμα αστροναυτών εξετάζει τους αιτούντες να βρουν υγιείς υποψηφίους, οι οποίοι στη συνέχεια διατηρούν ένα ολοκληρωμένο καθεστώς φυσικής κατάστασης προκειμένου να καταπολεμήσουν προληπτικά τις επιπτώσεις της ζωής στη «μικροβαρύτητα».

Συνεπώς, θα περιμέναμε να είναι σημαντικά πιο υγιείς από τους εργαζόμενους γραφείου, κατά μέσο όρο και θα έπρεπε να ανησυχούν αν δεν ήταν.

2) Κατηγοριοποίηση και Επίδραση Σταδιακής Μετανάστευσης - η ανακατεύθυνση ατόμων μεταξύ ομάδων μπορεί να έχει δραματικές επιπτώσεις στα στατιστικά αποτελέσματα.

Αυτό είναι επίσης γνωστό ως το Γουίλ Ρότζερς εφέ, μετά τον Αμερικανό κωμικό που φέρεται να είπε:

Όταν οι Okies έφυγαν από την Οκλαχόμα και μετακόμισαν στην Καλιφόρνια, αύξησαν το μέσο επίπεδο νοημοσύνης και στις δύο πολιτείες.

Για παράδειγμα, φανταστείτε να χωρίζετε μια μεγάλη ομάδα φίλων σε μια «κοντή» ομάδα και μια «ψηλή» ομάδα (ίσως για να τα κανονίσετε για μια φωτογραφία). Έχοντας κάνει αυτό, είναι εκπληκτικά εύκολο να αυξήσουμε το μέσο ύψος και των δύο ομάδων ταυτόχρονα.

Απλώς ζητήστε από το πιο κοντό άτομο στην ομάδα "ψηλών" να μεταβεί στην ομάδα "σύντομων". Η ομάδα "ψηλών" χάνει το μικρότερο μέλος της, αυξάνοντας έτσι το μέσο ύψος τους - αλλά η "κοντή" ομάδα κερδίζει το ψηλότερο μέλος της μέχρι τώρα, και έτσι κερδίζει επίσης το μέσο ύψος.

Αυτό έχει σημαντικές επιπτώσεις στις ιατρικές μελέτες, όπου οι ασθενείς συχνά ταξινομούνται σε "υγιείς" ή "ανθυγιεινές" ομάδες κατά τη δοκιμή μιας νέας θεραπείας. Εάν βελτιωθούν οι διαγνωστικές μέθοδοι, ορισμένοι πολύ ελαφρώς ανθυγιεινοί ασθενείς μπορεί να επανακατηγοριοποιηθούν-οδηγώντας σε βελτίωση των αποτελεσμάτων υγείας και των δύο ομάδων, ανεξάρτητα από το πόσο αποτελεσματική (ή όχι) είναι η θεραπεία.

 αιτιότητα 3Η επιλογή και η επιλογή μεταξύ των δεδομένων μπορεί να οδηγήσει σε λάθος συμπεράσματα. Οι σκεπτικιστές βλέπουν περίοδο ψύξης (μπλε) όταν τα δεδομένα δείχνουν πραγματικά μακροπρόθεσμη θέρμανση (πράσινο). skepticalscience.com 

3) Εξόρυξη δεδομένων-όταν υπάρχει πληθώρα δεδομένων, τα κομμάτια μπορούν να επιλεγούν για να υποστηρίξουν οποιοδήποτε επιθυμητό συμπέρασμα.

Αυτή είναι κακή στατιστική πρακτική, αλλά αν γίνει σκόπιμα μπορεί να είναι δύσκολο να εντοπιστεί χωρίς γνώση του αρχικού, πλήρους συνόλου δεδομένων.

Εξετάστε το παραπάνω γράφημα που δείχνει δύο ερμηνείες των δεδομένων της υπερθέρμανσης του πλανήτη, για παράδειγμα. Or φθόριο - σε μικρές ποσότητες είναι ένα από τα πιο αποτελεσματικά προληπτικά φάρμακα στην ιστορία, αλλά το θετικό αποτέλεσμα εξαφανίζεται εντελώς αν σκεφτεί κανείς ποτέ τοξικές ποσότητες φθορίου.

Για παρόμοιους λόγους, είναι σημαντικό οι διαδικασίες για ένα δεδομένο στατιστικό πείραμα να έχουν καθοριστεί πριν ξεκινήσει το πείραμα και στη συνέχεια να παραμείνουν αμετάβλητες έως ότου τελειώσει το πείραμα.

4) Ομαδοποίηση - που είναι αναμενόμενο ακόμη και σε εντελώς τυχαία δεδομένα.

Εξετάστε μια ιατρική μελέτη που εξετάζει πώς είναι μια συγκεκριμένη ασθένεια, όπως ο καρκίνος ή η σκλήρυνση κατά πλάκας γεωγραφικά κατανεμημένα. Εάν η ασθένεια χτυπήσει τυχαία (και το περιβάλλον δεν έχει καμία επίδραση) θα περιμέναμε να δούμε πολλές ομάδες ασθενών φυσικά. Εάν οι ασθενείς κατανέμονται τέλεια ομοιόμορφα, η κατανομή θα ήταν πράγματι η πιο τυχαία!

Έτσι, η παρουσία ενός μόνο συμπλέγματος ή μιας σειράς μικρών ομάδων περιπτώσεων, είναι απολύτως φυσιολογική. Απαιτούνται εξελιγμένες στατιστικές μέθοδοι για να προσδιοριστεί πόση ομαδοποίηση απαιτείται για να συναχθεί ότι κάτι σε αυτόν τον τομέα μπορεί να προκαλεί την ασθένεια.

Δυστυχώς, κάθε σύμπλεγμα-ακόμη και ένα μη σημαντικό-δημιουργεί έναν εύκολο (και με την πρώτη ματιά, συναρπαστικό) τίτλο ειδήσεων.

 αιτιότητα 4

Η στατιστική ανάλυση, όπως και κάθε άλλο ισχυρό εργαλείο, πρέπει να χρησιμοποιείται πολύ προσεκτικά - και συγκεκριμένα, πρέπει πάντα να είστε προσεκτικοί όταν βγάζετε συμπεράσματα με βάση το γεγονός ότι συσχετίζονται δύο ποσότητες.

Αντ 'αυτού, πρέπει πάντα να επιμένουμε σε ξεχωριστά στοιχεία για να υποστηρίξουμε την αιτία και το αποτέλεσμα-και αυτά τα στοιχεία δεν θα έχουν τη μορφή ενός μόνο στατιστικού αριθμού.

Φαινομενικά επιτακτικοί συσχετισμοί, ας πούμε μεταξύ δεδομένων γονιδίων και σχιζοφρένεια ή μεταξύ ενός με υψηλή περιεκτικότητα σε λιπαρά και καρδιακές παθήσεις, μπορεί να αποδειχθεί ότι βασίζονται σε πολύ αμφίβολη μεθοδολογία.

Είμαστε ίσως ως είδος γνωστικά άρρωστοι προετοιμασμένοι να αντιμετωπίσουμε αυτά τα ζητήματα. Ως Καναδός εκπαιδευτικός Κιεράν Έγκαν το έβαλε στο βιβλίο του Να γίνει λάθος από την αρχή:

Τα άσχημα νέα είναι ότι η εξέλιξή μας μάς εξόπλισε να ζούμε σε μικρές, σταθερές κοινωνίες κυνηγών-συλλεκτών. Είμαστε άνθρωποι του Πλειστόκαινου, αλλά ο μαρασμένος εγκέφαλός μας έχει δημιουργήσει μαζικές, πολυπολιτισμικές, τεχνολογικά εξελιγμένες και ταχέως μεταβαλλόμενες κοινωνίες για να ζήσουμε.

Κατά συνέπεια, πρέπει να αντισταθούμε συνεχώς στον πειρασμό να δούμε το νόημα στην τύχη και να συγχέουμε τη συσχέτιση και την αιτιότητα.Η Συνομιλία

Αυτό το άρθρο δημοσιεύθηκε αρχικά στις Η Συνομιλία
Διαβάστε το αρχικό άρθρο.


Σχετικά με τους Συγγραφείς

borwein jonathanΟ Jonathan Borwein (Jon) είναι βραβευμένος καθηγητής Μαθηματικών στο Πανεπιστήμιο του Newcastle. Είναι Βραβευμένος Καθηγητής Μαθηματικών στο Πανεπιστήμιο του Newcastle και Διευθυντής του Κέντρου Μαθηματικών Υποστήριξης Υπολογιστών και των Εφαρμογών του (CARMA). Έχει εργαστεί στα Πανεπιστήμια Carnegie-Melon, Dalhousie, Simon Fraser και Waterloo και έχει δύο Καναδικές Ερευνητικές έδρες στην πληροφορική.

τριαντάφυλλο MichaelΟ Michael Rose είναι υποψήφιος διδάκτορας, Σχολή Μαθηματικών και Φυσικών Επιστημών στο Πανεπιστήμιο του Newcastle. Φοιτητής διδακτορικών μαθηματικών υπό την επίβλεψη του βραβευμένου καθηγητή Jon Borwein στο Πανεπιστήμιο του Newcastle, Αυστραλία. Αυτή τη στιγμή βοηθάει στην έρευνα για την εφαρμογή μαθηματικών φράκταλ στη μοντελοποίηση κατανομών συνάψεων εγκεφάλου.

Δήλωση αποκάλυψης: Οι συγγραφείς δεν εργάζονται, δεν συμβουλεύονται, δεν κατέχουν μετοχές ή λαμβάνουν χρηματοδότηση από οποιαδήποτε εταιρεία ή οργανισμό που θα επωφεληθούν από αυτό το άρθρο. Δεν έχουν επίσης καμία σχετική σχέση.


Προτεινόμενο βιβλίο:

Χρήματα, Σεξ, Πόλεμος, Κάρμα: Σημειώσεις για μια Βουδιστική Επανάσταση
από τον David R. Loy.

Χρήματα, σεξ, πόλεμος, κάρμα: Σημειώσεις για μια βουδιστική επανάσταση από τον David R. Loy.Ο Ντέιβιντ Λόι έχει γίνει ένας από τους ισχυρότερους υποστηρικτές της Βουδιστικής κοσμοθεωρίας, εξηγώντας όπως κανένας άλλος την ικανότητά του να μεταμορφώνει το κοινωνικοπολιτικό τοπίο του σύγχρονου κόσμου. Σε Χρήματα, σεξ, πόλεμος, κάρμα, προσφέρει ευκρινείς και ακόμη και σοκαριστικά σαφείς παρουσιάσεις συχνά παρεξηγημένων Βουδιστικών βάσεων - τη λειτουργία του κάρμα, τη φύση του εαυτού, τις αιτίες των προβλημάτων τόσο σε ατομικό όσο και σε κοινωνικό επίπεδο - και τους πραγματικούς λόγους πίσω από τη συλλογική μας αίσθηση "ποτέ αρκετά , είτε είναι ώρα, χρήματα, σεξ, ασφάλεια ... ακόμη και πόλεμος. Η «Βουδιστική Επανάσταση» του Δαβίδ δεν είναι τίποτα λιγότερο από μια ριζική αλλαγή στον τρόπο με τον οποίο μπορούμε να προσεγγίσουμε τη ζωή μας, τον πλανήτη μας, τις συλλογικές αυταπάτες που διαπερνούν τη γλώσσα, τον πολιτισμό μας, ακόμη και την πνευματικότητα μας.

Κάντε κλικ εδώ για περισσότερες πληροφορίες ή / και για να παραγγείλετε αυτό το βιβλίο στο Amazon.