Κυριακή 11 Αυγούστου 2024

Η ιστορία της σύγχρονης Στατιστικής και μια διαμάχη για την ψυχή της Επιστήμης

Ο Sir R.A Fischer (1890 – 1962), θεωρείται και δικαίως, ο “πατέρας” της κλασικής προσέγγισης στην Στατιστική. Η συμβολή του σε αυτόν τον κρίσιμο τομέα για την επιστήμη, είναι ανυπολόγιστη. Χρειάζεται, δε, ειδική μονογραφία για να συμπυκνωθεί το σύνολο του έργου του. Θα αναφερθούν, όμως, δύο τουλάχιστον σημεία: Η ανάλυση και περιγραφή της “Null Hypothesis” και η “Στατιστική Σημαντικότητα” με βάση την p – value.

Στο μνημειώδες έργο του, The Design of Experiments, αναπτύσσει την θεωρία της Null Hypothesis (Ho), που είναι κρίσιμη στην λειτουργία της σύγχρονης επιστήμης και ειδικά της Ιατρικής.

Ας σκεφτούμε, λοιπόν, την σύγκριση αποτελεσματικότητας δύο φαρμάκων για την ίδια νόσο. Ενός παλαιότερου κι ενός καινούργιου, του οποίου επιθυμούμε να ελέγξουμε τη δραστικότητα. Κάνουμε την αρχική υπόθεση Ηο, ότι το νέο φάρμακο δεν είναι πιο αποτελεσματικό. Κατόπιν, συγκεντρώνουμε εμπειρικά και πειραματικά στοιχεία και με τη χρήση μιας μικρής p value, συνήθως p<0,05, συμπεραίνουμε ότι η Ho μπορεί με κάποια ασφάλεια να απορριφθεί, αν το νέο φάρμακο είναι πιο αποτελεσματικό. Η μεθοδολογία αυτή αποτελεί σημαντικό κεφάλαιο της κλασικής προσέγγισης στην Στατιστική και χρησιμοποιείται σε μεγάλη έκταση μέχρι και σήμερα. Ονομάζεται “Συχνοτική”- “Frequentist” προσέγγιση και σήμερα κυριαρχεί σε επιστήμες όπως η Ιατρική, η Ψυχολογία και η Βιολογία, αφού έχει άμεση σύνδεση με τον “πραγματικό” κόσμο με την έννοια ότι θεωρεί την Πιθανότητα, ως Συχνότητα με την οποία εμφανίζεται ένα φαινόμενο. Η μεθοδολογία αυτή αναπτύχθηκε από τους μεγαλοφυείς R. Fisher, F. Galton και Κ.Pearson. Η προσφορά της στην πρόοδο της Επιστήμης είναι μεγάλη.

Παρά ταύτα, πάσχει από βαρύτατα μεθοδολογικά προβλήματα:

α) Σε αντίθεση με την επιστημονική μέθοδο, κινείται λογικά από την Υπόθεση, την οποία θεωρεί αρχικώς ως αληθή, προς την συλλογή εμπειρικών στοιχείων που την απορρίπτουν ή όχι. Στην Επιστήμη, όμως, δεν είμαστε δογματικοί: κινούμαστε από τα εμπειρικά δεδομένα προς την ανάπτυξη θεωριών και όχι αντίστροφα. Δηλαδή, “χτίζουμε” τις θεωρίες μας με βάση την Πραγματικότητα και δεν διαλέγουμε στοιχεία της Πραγματικότητας που θα “στηρίξουν” τις θεωρίες μας. Δεν κάνουμε “cherry picking”. Το ζήτημα αυτό είναι κρίσιμο, αφού ανεκδοτολογικά λέγεται ότι “μπορούμε στατιστικά, να δικαιολογήσουμε οτιδήποτε” αρκεί να διαλέξουμε τα εμπειρικά στοιχεί που να μας “βολεύουν”. Έτσι, η Φορά της Στατιστικής Συχνοτικής Προσέγγισης, είναι αντίστροφη από ττη Επιστημονική Μέθοδο, ως προς το δίπτυχο: Στοιχεία Πραγματικότητας και Ανάπτυξη Θεωριών.

β) Μια ακόμα μεθοδολογική αδυναμία της κλασικής προσέγγισης στην Στατιστική, το γεγονός ότι τα στατιστικά “εργαλεία” όπως η p – value που εισήγαγε ο Fischer και άλλοι, είναι ad – hoc στατιστικά εργαλεία που εισήχθησαν εκ των υστέρων για να δικαιολογήσουν ή όχι την απόρριψη μιας υπόθεσης.

γ) η κλασσική στατιστική θεώρηση του Fischer και άλλων, είναι μια μέθοδος “Μαύρου Κουτιού”. Δηλαδή, δεν εξετάζει τους βιοχημικούς μηχανισμούς πίσω από μια συσχέτιση, αλλά διαπιστώνει αιτιακές σχέσεις, μόνο και μόνο επειδή υπάρχει στατιστική σημαντικότητα ανάμεσα σε δύο φαινόμενα. Κάτι τέτοιο δεν αρκεί. Για να διαπιστωθεί αιτι;ακή σχέση ανάμεσα σε ένα φαινόμενο και ένα άλλο, απαιτείται εκτός από ισχυρή στατιστική συσχέτιση και η ανάλυση των υποκείμενων μηχανισμών που οδηγούν σε αυτόν τον συμπερασμό. Έτσι, δεν θα μπορούσαμε να οδηγηθούμε σε ανάπτυξη ενός αιτιακού μηχανισμού ανάμεσα στην αύξηση των σιδηροδρομικών ατυχημάτων και τον πληθωρισμό, ακόμα κι αν τα δύο αυτά μεγέθη κινούνταν χρονικά παράλληλα. για έναν τέτοιο συμπερασμό, δεν αρκούν τα στατιστικά στοιχεία, αλλά απαιτείται και η εξήγηση μέσω ενός λογικώς αποδεκτού μηχανισμού.

δ) Η Συχνοτική Προσέγγιση, αντιμετωπίζει την έννοια της Πιθανότητας, ως Συχνότητας Εμφάνισης ενός φαινομένου. Στην πραγματικότητα, η Πιθανότητα είναι ένα οντολογικά διαφορετικό φαινόμενο, δεδομένου ότι μπορεί να υφίσταται η Πιθανότητα, χωρίς να εμφανιστεί ως μετρήσιμο μέγεθος στον κόσμο, ή μπορεί να μην υπάρχει η δυνατότητα μέτρησής του.

Είναι προφανές από τα ανωτέρω, ότι η κλασσική στατιστική θεώρηση πάσχει πανταχόθεν, μεθοδολογικά.

Ήδη, στην επιστημονική μεθοδολογία, αυξάνεται συνεχώς η χρήση των λεγόμενων Μπεϋζιανών μεθόδων στην Στατιστική, από το περίφημο Θεώρημα του Bayes (1701 – 1761). To θεώρημα αυτό, σε γενικές γραμμές μας λέει ότι δεν αρκούν τα στατιστικά στοιχεία για να τεκμηριώσουμε μια αιτιακή σχέση, αλλά απαιτείται και η χρήση ορθολογικών μηχανισμών λόγου χάρη στην Ιατρική, Βιοχημείας ή Φυσιολογίας. Επίσης, χρησιμοποιεί τα λεγόμενα “priors“, δηλαδή ορθολογικές εκτιμήσεις της γενικής πιθανότητας να συμβεί κάτι, ενώ ιδιοφυώς ενσωματώνει στις στατιστικές αναλύσεις μας έναν ακόμα εξαιρετικό μηχανισμό: Της αναθεώρησης των απόψεών μας, υπό το φως νέων ορθολογικών στοιχείων, τα οποία οφείλουμε να ενσωματώνουμε στο σύνολό τους και όχι επιλεκτικά. Αυτή η μεθοδολογία δεν είναι, λοιπόν, δογματική, αφού εισέρχεται σε υποκείμενους μηχανισμούς (mechanista method) και έτσι δυνάμεθα να διαχωρίσουμε την επιστήμη, από την δογματική, άκαμπτη και ανθεκτική στο ορθολογικό επιχείρημα ψευδο – επιστήμη.

Ας δούμε ένα παράδειγμα Μπευζιανής λειτουργίας:

Ας υποθέσουμε σπάνια πάθηση που εμφανίζεται σε 1 στους 5.000 ανθρώπους. Το Κράτος, υποθετικώς αγοράζει από εταιρεία 100.000 τεστ ετησίως για να κάνει σε κάθε παιδί που γεννιέται. Η εταιρεία διατείνεται σωστά, ότι το τεστ είναι υψηλής ακριβείας, με 99% ευαισθησία και 98% ειδικότητα.

Το τεστ γίνεται σε όλα ανεξαιρέτως, τα νεογέννητα, χωρίς να προηγηθεί κάποια ιατρική εξέταση, ως screening test.

Ένα παιδάκι, βγαίνει “θετικό” στην εξέταση.

Ποια είναι η πιθανότητα να πάσχει από την σπάνια πάθηση;

Παρά την υψηλή ειδικότητα και ευαισθησία του τεστ, η πιθανότητα δεν είναι ούτε 99% ούτε 98%.

Είναι πολύ χαμηλότερη.

Ας δούμε γιατί:.Στα 100.000 παιδάκια, μόλις 20 θα έχουν την πάθηση (100.000 × 0,0002=20)
Αληθώς θετικά TP θα είναι τα TP=20×0,99=19,8
Ψευδώς Αρνητικά, FN=20 -19,8=0,2
Αληθώς Αρνητικά, TN=0,98×99.980=97.980,4
Ψευδώς Θετικά, FP=99.980 – 97.980,4=1999,6

Σύνολο Θετικών τεστ στα 100.000 νεογέννητα=19,8+1999,6=2019,4

Συνεπώς, η αναλογία αληθώς θετικών τεστ προς το σύνολο των θετικών, είναι 19,8/2019,4, δηλαδή, περίπου 1%.

⚠️Συνεπώς, η πιθανότητα το νεογέννητο να πάσχει από την σπάνια πάθηση, αν έχει θετικό τεστ, θα είναι μόλις 1%. Παρά το θετικό τεστ.

Κατά την Μπεϋζιανή μέθοδο, όπως παραπάνω, δεν προϋποθέτουμε κάποια “καλή” ή “κακή” αποτελεσματικότητα του test και επιπλέον, χρησιμοποιούμε την “prior ή Βase Rate” πιθανότητα της επίπτωσης της νόσου στον γενικό πληθυσμό 1/5000 . Δεν μας αρκεί η υψηλή ευαισθησία και ειδικότητα του test για να βγάλουμε τα συμπεράσματά μας, αλλά διερευνούμε την περίπτωσή μας με βάση την αρκετά σπάνια επίπτωση της πάθησης. Η μη χρήση της επίπτωσης 1/5000 θα οδηγούσε στο λογικό σφάλμα της Base Rate Fallacy.

Είναι, λοιπόν, προφανές ότι με την επιλογή κατάλληλων εμπειρικών στοιχείων, αν δεν ληφθούν υπόψη οι Prior Probabilities και οι Mηχανισμοί, μπορεί όντως, να πει κανείς ψέματα με την χρήση των κλασσικών στατιστικών μεθόδων, αρκεί να κάνει το κατάλληλο “Cherry Picking” στοιχείων.

Αυτό ακριβώς και έπραξε και ο “πατέρας” της κλασικής Στατιστικής, ο Sir R.A Fischer, σε δύο τουλάχιστον περιπτώσεις. Στην επιβεβαιωμένη του εμπλοκή με την ψευδο – επιστήμη της Ευγονικής, της οποίας υπήρξε καίριος υποστηρικτής, όπως και των ναζί ευγονιστών που ήταν γνωστό ότι προσπαθούσαν να “απαλλάξουν” το Ανθρώπινο Είδος από όσους οι ίδιοι θεωρούσαν “ανεπιθύμητους”. Ο R.A Fischer ήταν φίλος, συνεργάτης και υποστηρικτής του άθλιου ναζί ευγονιστή Ο.F von Verschuer ο οποίος ήταν και ο δάσκαλος του εγκληματία “γιατρού” και ευγονιστή J. Mengele. Μάλιστα, ο Fischer προσπάθησε κατ’ επανάληψη να φέρει τον Verschuer στο Λονδίνο για να συνεργαστεί με τους Βρετανούς, παρά το εγκληματικό του παρελθόν συνεργασίας με τους ναζί και χρήσης “ευγονικών” μεθόδων για την εξάλειψη των ανεπιθύμητων γενετικά φυλών και ανθρώπων. Το 1952, μάλιστα, προσπάθησε ευτυχώς χωρίς επιτυχία, να αντιπαρατεθεί με το επίσημο κείμενο της UNESCO κατά του ρατσισμού. Και η περίπτωση στήριξης του Verschuer αλλά και η υπόθεση της UNESCO έλαβαν χώρα μετά τις τρομακτικές αποκαλύψεις για τον ρόλο της Ευγονικής στα ρατσιστικά εγκλήματα των ναζί και προφανέστατα, δεν μπορούσαν να ενταχθούν στην γενικότερη “πλαισίωση” μιας εποχής κατά την οποία ήταν γενικώς αποδεκτές τέτοιες απόψεις. Η δεύτερη περίπτωση εξοργιστικής δράσης του R. Fisher ήταν η συντεταγμένη προσπάθειά του να στηρίξει την καπνοβιομηχανία το 1958, χρησιμοποιώντας στατιστικές αλχημείες για να μηδενίσει το πλήθος μεγάλων και σοβαρών μελετών, όπως του Hill, οι οποίες έδειχναν πέραν πάσης αμφιβολίας την αιτιακή σχέση του καπνίσματος και καρκίνου του πνεύμονος.

Ο Francis Galton (1822 – 1911), ήταν ένα προικισμένος εκκεντρικός επιστήμονας από πλούσια οικογένεια που είχε συγγένεια με τον Δαρβίνο. Του άρεσε να μετράει τα πάντα στα πολυάριθμα ταξίδια του. Σε μια εποχή που αυτό ήταν κοινωνικώς αποδεκτό, ήταν απίστευτα ρατσιστής, με έναν ταξινομικό τρόπο που διαχώριζε τους ανθρώπους της Κοινοπολιτείας με βάση τα μετρήσιμα χαρακτηριστικά τους, ώστε να υπηρετούν καλύτερα του Στέμμα. Η ψευδο – Επιστήμη της Ευγονικής ήταν δικό του δημιούργημα και χρησιμοποιούσε συστηματικά τις “μετρήσεις” του για να αντικειμενικοποιήσει τα χαρακτηριστικά κάθε Φυλής που την καθιστούσαν ανώτερη ή κατώτερη. Η χρήση της Στατιστικής έγινε, λοιπόν, ένα δήθεν “αντικειμενικό” εργαλείο διαχωρισμού των ανθρώπων ως γενετικά ανώτερων ή κατώτερων, υποτιμώντας ή και μηδενίζοντας την επίδραση της κοινωνίας, του περιβάλλοντος ή της εκπαίδευσης και φυσικά, αγνοώντας τα λεγόμενα priors, δηλαδή την πλεονεκτική θέση που ξεκινούν τη ζωή τους τα παιδιά των εύπορων οικογενειών. Οι έννοιες που χρησιμοποίησε όπως η correlation και η regression, χρησιμοποιούνται μέχρι και σήμερα, αλλά ο αρχικός τους σκοπός, ήταν η ad hoc στήριξη των φυλετικών θεωριών του, στις οποίες ταίριαζαν “γάντι”.

Ο τρίτος από τους “πατέρες” της Κλασικής προσέγγισης στην Στατιστική, ήταν ο Karl Pearson (1857 – 1936), o διάδοχος του Galton, ο οποίος διακρινόταν και για τις μαθηματικές του ικανότητες. Το περίφημο chi-squared test ήταν δικό του δημιούργημα και αποτελεί τον πρόδρομο της σύγχρονης χρήσης των p-values στατιστικής σημαντικότητος για την απόρριψη μιας Null Hypothesis. O Pearson ήταν αυτός που διευκρίνισε την διαφορά ανάμεσα στην Συσχέτιση και την Αιτιότητα, αλλά η καριέρα του απέδειξε ότι δεν έδωσε ο ίδιος αξία σε αυτή του την σημαντική διευκρίνιση, αφού ακολούθησε τις πρακτικές του Galton, συμπεραίνοντας για την Ευγονική μόνο από τους αριθμούς. Η προσπάθειά του ήταν η “αντικειμενικοποίηση” των διαφορών ανάμεσα στις Φυλές με βάση τις “μετρήσεις” όπως αυτές που έκανε ο Galton. Ιδιαίτερα “ενοχλητικές” ήταν οι απόψεις του για την γενοκτονία που υπέστησαν οι Ιθαγενείς Ινδιάνοι της Αμερικής από τους Λευκούς. Οι στατιστικές του μέθοδοι και οι ρατσιστικές του ιδέες ήταν ένα και το αυτό, αφού προσπαθούσε να αιτιολογήσει την κατωτερότητα ορισμένων “παρασιτικών” Φυλών με βάση τα ομοιογενή ανθρωπομετρικά τους χαρακτηριστικά. Δεν δίσταζε, όμως, να χρησιμοποιεί “στατιστικά” επιχειρήματα ενάντια στα αποτελέσματα που δεν “βόλευαν” το ρατσιστικό του παραλήρημα.

Ας σημειωθεί ότι ακόμα και σήμερα, προσπαθούμε να οργανώσουμε ομοιογενείς ομάδες ανθρώπων για να στηρίξουμε στατιστικώς σημαντικές διαφορές. Ο Pearson ήταν μια χαρακτηριστική περίπτωση “επιστήμονα” που δεν χρησιμοποιούσε την Επιστημονική Μέθοδο: Πρώτα “αποφάσιζε” ποιο θα είναι το αποτέλεσμα των πειραμάτων του και κατόπιν έψαχνε τα εμπειρικά στοιχεία και ad hoc επεξηγήσεις για να το αιτιολογήσει. Έτσι, διολίσθησε εύκολα στο να θεωρεί τον Galton πιο σημαντικό από τον Darwin, αφού ο τελευταίος πρώτα ασχολούνταν με τη συλλογή στοιχείων και μετά έκανε υποθέσεις. Ο Pearson συνέχισε την παράδοση του Galton και είχε τεράστια επίδραση στην εκπαίδευση πλήθους διαπρεπών ειδικών στην Στατιστική. Ανάμεσά τους και ο Sir Ronald Fisher.

Από όλα τα παραπάνω, είναι προφανής η “εργαλειοποίηση” της Κλασικής Στατιστικής Μεθόδου από τους “πατέρες” της Στατιστικής, Galton, Pearson και Fisher, οι οποίοι δημιούργησαν ad hoc στατιστικά εργαλεία που ταίριαζαν στις πολιτικές ευγονικές επιδιώξεις τους. Ομοιόμορφοι πληθυσμοί, μέσοι όροι ανθρώπων, πληθυσμοί εκτός στατιστικής σημαντικότητας και αντι – επιστημονικές πρακτικές που ευρίσκονται σε άμεση αντίθεση με την Επιστημονική Μέθοδο. Η ψευδαίσθηση “αντικειμενικότητας“, η ισχυρή δήλωση ότι δήθεν “οι Αριθμοί μιλούν από μόνοι τους” και η a la carte χρήση επιχειρημάτων και δεδομένων της πραγματικότητας, αντιτίθενται όχι μόνο στην Επιστήμη αλλά και στην δυνατότητά μας να χρησιμοποιήσουμε κωδικοποιήσεις Τεχνητής Νοημοσύνης. Παρά τις μεθοδολογικές και φιλοσοφικές ενστάσεις έναντι της Συχνοτικής Μεθόδου, υπάρχει πλήθος εφαρμογών όπου χρησιμοποιήθηκε με επιτυχία. Είναι όμως καιρός, κατά τη γνώμη μας, να αντικατασταθεί από την κατά Bayes στατιστική συλλογιστική, όπως αυτή αναπτύχθηκε από τον Ε.Τ. Jaynes στο μνημειώδες έργο του: “Probability Theory: The Logic of Science“.

Δεν υπάρχουν σχόλια :

Δημοσίευση σχολίου