Έχουμε 2 οδηγούς. Ο Α έχει οδηγήσει 100 χιλιάδες χιλιόμετρα και έχει τρακάρει 3 φορές. Ο Β έχει οδηγήσει 80 χιλιάδες χιλιόμετρα και έχει τρακάρει 4 φορές. Ποιος είναι ο πιο ασφαλής οδηγός για να μας πάει από την Αθήνα στη Θεσ/νίκη?
Έχουμε 2 χειρούργους. Ο Α σε 100 επεμβάσεις έχει 95 ασθενείς που επιβίωσαν. Ο Β σε 80 επεμβάσεις έχει 72 ασθενείς που επιβίωσαν. Σε ποιον θα πηγαίνατε να σας εγχειρίσει?
Γνωρίζοντας μόνον αυτά τα δεδομένα όλοι μας θα απαντούσαμε στον Α οδηγό/χειρούργο. Όταν όμως στη στατιστική είτε λόγω άγνοιας δεδομένων είτε λόγω σκοπιμότητας παραλείπουμε κάποια μετα-δεδομένα (metadata) μπορούμε εύκολα να παρασυρθούμε σε λάθος συμπεράσματα. Αυτό έρχεται και εξηγεί το παράδοξο του Simpson (ή αλλιώς παράδοξο Simpson-Yule) που πήρε το όνομά του από τον μαθηματικό Edward Simpson που το ανέλυσε στο Journal of the Royal Statistics Society το 1951 σε ένα άρθρο του με τίτλο «Η ερμηνεία της αλληλεπίδρασης σε πίνακες έκτακτης ανάγκης». Το όλο πρόβλημα που εξετάζει το άρθρο αυτό έχει να κάνει με τις παραμελημένες μεταβλητές όταν μέσω της στατιστικής εξετάζουμε ένα φαινόμενο.
Πίσω στα παραδείγματά μας, εάν προσθέσουμε τη μεταβλητή της επικινδυνότητας του δρόμου μπορεί να έχουμε τελείως διαφορετικό συμπέρασμα. Εάν ο οδηγός Α που τρακάρει μία φορά ανά 33.3 χιλιάδες χιλιόμετρα οδηγάει στην Κορίνθου-Τριπόλεως όλη τη βάρδια του ενώ ο οδηγός Β που τρακάρει μια φορά ανά 20 χιλιάδες χιλιόμετρα οδηγάει στην Πύργου-Πατρών τότε ποιον θα προτιμούσατε σαν οδηγό? Στην Πύργου-Πατρών γίνονται υπερ-πολλαπλάσια τροχαία ατυχήματα και όποιος γνωρίζει και τους δύο δρόμους αυτούς σίγουρα θα διάλεγε τον Β οδηγό παρά τα αρχικά δεδομένα που μπορεί να ήταν σαφή, αλλά αποδεικνύονται ελλιπή.
Αντιστοίχως εάν ο χειρούργος Α ειδικεύεται σε επεμβάσεις που έχουν ελάχιστη θνητότητα ενώ ο Β σε επεμβάσεις δύσκολες με ρίσκο σε ασθενείς σε τελικά στάδια, αλλάζει και η επιλογή μας ως προς το ποιος είναι καλύτερος χειρούργος.
Κάτι αντίστοιχο συμβαίνει με τα δεδομένα που μας έρχονται από το Ισραήλ ως προς τις λεγόμενες breakthrough λοιμώξεις και τις νοσηλείες και θανάτους που προκύπτουν από αυτές στις ομάδες εμβολιασμένων και ανεμβολίαστων ασθενών κατά της νόσου COVID19.
Η κύρια μάζα των εμβολιασμένων που αποτελούν συνολικά γύρω στο 65% του πληθυσμού βρίσκεται σε ηλικίες 50+ και μεσοσταθμικά ως σύνολο είναι πολύ επιβαρυμένη με υποκείμενα νοσήματα που επηρεάζουν την ανοσολογική απόκριση. Η μάζα των ανεμβολίαστων από την άλλη βρίσκεται κυρίως στην περιοχή 50- χωρίς άλλα προβλήματα υγείας. Το να μετράμε απευθείας νοσηλείες και θανάτους από τις ομάδες αυτές χωρίς να λαμβάνουμε υπόψην μας τις μεταβλητές - παραμελημένες μεταβλητές - μας οδηγεί καραντί σε μια κλασσική περίπτωση εφαρμογής του παραδόξου του Simpson.
Μια ανάλυση πάνω στην εφαρμογή του Simpson πάνω στο Ισραήλ μπορούμε να βρούμε στο https://www.covid-datascience.com/post/israeli-data-how-can-efficacy-vs-severe-disease-be-strong-when-60-of-hospitalized-are-vaccinated
Τα εμβόλια δουλεύουν. Δεν είναι τα πρώτα που έχουν breakthrough λοιμώξεις. Και το εμβόλιο της ιλαράς έχει λοιμώξεις που ξεφεύγουν και παρά το ότι έχει τεράστιο Rt ως ιός έχει εξαφανιστεί εκεί όπου έχουμε μαζικούς εμβολιασμούς. Τείχος ανοσίας θα χτιστεί αν εμβολιάσουμε το σύνολο και συνεχίζουμε κάθε χρόνο να το προμηθεύουμε με κατάλληλο εμβόλιο.
Μην ακούτε Κούβελες, Φαρσαλινούς, Πουλάδες και λοιπά παρατράγουδα. Τα εμβόλια δεν είναι από μόνα τους η λύση, είναι όμως η απαραίτητη προϋπόθεση για οποιαδήποτε λύση.Εμβολιαστείτε!
Έχουμε 2 χειρούργους. Ο Α σε 100 επεμβάσεις έχει 95 ασθενείς που επιβίωσαν. Ο Β σε 80 επεμβάσεις έχει 72 ασθενείς που επιβίωσαν. Σε ποιον θα πηγαίνατε να σας εγχειρίσει?
Γνωρίζοντας μόνον αυτά τα δεδομένα όλοι μας θα απαντούσαμε στον Α οδηγό/χειρούργο. Όταν όμως στη στατιστική είτε λόγω άγνοιας δεδομένων είτε λόγω σκοπιμότητας παραλείπουμε κάποια μετα-δεδομένα (metadata) μπορούμε εύκολα να παρασυρθούμε σε λάθος συμπεράσματα. Αυτό έρχεται και εξηγεί το παράδοξο του Simpson (ή αλλιώς παράδοξο Simpson-Yule) που πήρε το όνομά του από τον μαθηματικό Edward Simpson που το ανέλυσε στο Journal of the Royal Statistics Society το 1951 σε ένα άρθρο του με τίτλο «Η ερμηνεία της αλληλεπίδρασης σε πίνακες έκτακτης ανάγκης». Το όλο πρόβλημα που εξετάζει το άρθρο αυτό έχει να κάνει με τις παραμελημένες μεταβλητές όταν μέσω της στατιστικής εξετάζουμε ένα φαινόμενο.
Πίσω στα παραδείγματά μας, εάν προσθέσουμε τη μεταβλητή της επικινδυνότητας του δρόμου μπορεί να έχουμε τελείως διαφορετικό συμπέρασμα. Εάν ο οδηγός Α που τρακάρει μία φορά ανά 33.3 χιλιάδες χιλιόμετρα οδηγάει στην Κορίνθου-Τριπόλεως όλη τη βάρδια του ενώ ο οδηγός Β που τρακάρει μια φορά ανά 20 χιλιάδες χιλιόμετρα οδηγάει στην Πύργου-Πατρών τότε ποιον θα προτιμούσατε σαν οδηγό? Στην Πύργου-Πατρών γίνονται υπερ-πολλαπλάσια τροχαία ατυχήματα και όποιος γνωρίζει και τους δύο δρόμους αυτούς σίγουρα θα διάλεγε τον Β οδηγό παρά τα αρχικά δεδομένα που μπορεί να ήταν σαφή, αλλά αποδεικνύονται ελλιπή.
Αντιστοίχως εάν ο χειρούργος Α ειδικεύεται σε επεμβάσεις που έχουν ελάχιστη θνητότητα ενώ ο Β σε επεμβάσεις δύσκολες με ρίσκο σε ασθενείς σε τελικά στάδια, αλλάζει και η επιλογή μας ως προς το ποιος είναι καλύτερος χειρούργος.
Κάτι αντίστοιχο συμβαίνει με τα δεδομένα που μας έρχονται από το Ισραήλ ως προς τις λεγόμενες breakthrough λοιμώξεις και τις νοσηλείες και θανάτους που προκύπτουν από αυτές στις ομάδες εμβολιασμένων και ανεμβολίαστων ασθενών κατά της νόσου COVID19.
Η κύρια μάζα των εμβολιασμένων που αποτελούν συνολικά γύρω στο 65% του πληθυσμού βρίσκεται σε ηλικίες 50+ και μεσοσταθμικά ως σύνολο είναι πολύ επιβαρυμένη με υποκείμενα νοσήματα που επηρεάζουν την ανοσολογική απόκριση. Η μάζα των ανεμβολίαστων από την άλλη βρίσκεται κυρίως στην περιοχή 50- χωρίς άλλα προβλήματα υγείας. Το να μετράμε απευθείας νοσηλείες και θανάτους από τις ομάδες αυτές χωρίς να λαμβάνουμε υπόψην μας τις μεταβλητές - παραμελημένες μεταβλητές - μας οδηγεί καραντί σε μια κλασσική περίπτωση εφαρμογής του παραδόξου του Simpson.
Μια ανάλυση πάνω στην εφαρμογή του Simpson πάνω στο Ισραήλ μπορούμε να βρούμε στο https://www.covid-datascience.com/post/israeli-data-how-can-efficacy-vs-severe-disease-be-strong-when-60-of-hospitalized-are-vaccinated
Μην ακούτε Κούβελες, Φαρσαλινούς, Πουλάδες και λοιπά παρατράγουδα. Τα εμβόλια δεν είναι από μόνα τους η λύση, είναι όμως η απαραίτητη προϋπόθεση για οποιαδήποτε λύση.