A questo punto penseresti che potremmo dire inequivocabilmente cosa causa cosa. Ma la questione della causalità vs. correlazione , che ha perseguitato la scienza e la filosofia fin dai loro albori, ci perseguita ancora per numerose ragioni.
Gli esseri umani sono evolutivamente predisposti a vedere modelli e psicologicamente inclini a raccogliere informazioni che supportino visioni preesistenti, una caratteristica nota come bias di conferma. Confondiamo la coincidenza con la correlazione e la correlazione con la causalità.
La differenza tra causalità e correlazione è che in una relazione causale un evento è direttamente responsabile di un altro, mentre in una correlazione due eventi esistono simultaneamente, ma la loro relazione può essere dovuta a una terza variabile.
Non è corretto affermare che la correlazione implica causalità. Affinché A causi B, tendiamo a dire che, come minimo:
Presi da soli, tuttavia, questi tre requisiti non possono dimostrare la causa; sono, come dicono i filosofi, necessari ma non sufficienti. In ogni caso, non tutti sono d'accordo con loro.
Parlando di filosofi, David Hume ha sostenuto che la causalità non esiste in alcun senso dimostrabile [fonte:Cook]. Karl Popper e i falsificazionisti sostenevano che non possiamo provare una relazione, ma solo confutarla, il che spiega perché le analisi statistiche non cercano di dimostrare una correlazione; invece, ottengono un doppio negativo e smentiscono che i dati non sono correlati, un processo noto come rifiuto dell'ipotesi nulla [fonte:McLeod].
Tenendo presenti tali considerazioni, gli scienziati devono progettare e controllare attentamente i loro esperimenti per eliminare pregiudizi, ragionamenti circolari, profezie che si autoavverano e variabili confondenti. Devono rispettare i requisiti e i limiti dei metodi utilizzati, attingere da campioni rappresentativi ove possibile e non sopravvalutare i risultati.
Invece di intraprendere il difficile (e forse impossibile) compito di stabilire la causalità, la maggior parte della ricerca scientifica si concentra sulla forza delle correlazioni. Le correlazioni possono essere positive o negative, deboli o forti. Il coefficiente di correlazione statistica, che varia da -1 a 1, mostra la forza e la direzione della correlazione.
Se tracci punti dati su un grafico in cui una variabile occupa l'asse X e un'altra occupa l'asse Y, le variabili sono correlate se hanno una relazione lineare.
Poiché il cervello umano tende a cercare relazioni causali, gli scienziati sono particolarmente attenti nel creare esperimenti altamente controllati, ma commettono comunque errori. Ecco dieci esempi che illustrano quanto sia difficile identificare la causalità.
Le persone sono una seccatura per la ricerca. Reagiscono non solo allo stimolo studiato, ma anche all'esperimento stesso. Oggi i ricercatori cercano di progettare esperimenti per controllare tali fattori, ma non è sempre stato così.
Prendiamo l'Hawthorne Works a Cicero, Illinois. In una serie di esperimenti dal 1924 al 1932, i ricercatori hanno studiato gli effetti sulla produttività dei lavoratori associati all'alterazione dell'ambiente della fabbrica dell'Illinois, tra cui la modifica dei livelli di luce, il riordino del luogo e lo spostamento delle postazioni di lavoro.
Proprio quando pensavano di aver capito qualcosa, hanno notato un problema:gli incrementi di produttività osservati sono diminuiti non appena i ricercatori hanno lasciato il lavoro, indicando che la conoscenza dell’esperimento da parte dei lavoratori – e non i cambiamenti dei ricercatori – aveva alimentato il processo. aumento. I ricercatori chiamano ancora questo fenomeno l'effetto Hawthorne [fonte:Obrenović].
Un concetto correlato, l’effetto John Henry, si verifica quando i membri di un gruppo di controllo cercano di battere il gruppo sperimentale spingendo al massimo i loro sforzi. Non è necessario che sappiano dell'esperimento; è sufficiente che un solo gruppo riceva nuovi strumenti o istruzioni aggiuntive. Come l'uomo leggendario che guida l'acciaio, vogliono dimostrare le loro capacità e guadagnarsi il rispetto [fonti:Saretsky; Vogt].
I personaggi principali del film di Tom Stoppard "Rosencrantz e Guildenstern sono morti" iniziano il film sconcertati e alla fine spaventati quando ciascuno dei 157 lanci consecutivi di una moneta dà testa. Le spiegazioni di Guildenstern di questo fenomeno vanno dai cicli temporali a "una spettacolare rivendicazione del principio secondo cui ogni singola moneta, fatta girare individualmente, ha la stessa probabilità di uscire testa come croce..."
L’evoluzione ha portato gli esseri umani a vedere degli schemi, e la nostra capacità di elaborare correttamente quell’impulso sembra andare in cortocircuito quanto più a lungo passiamo a giocare d’azzardo. Possiamo accettare razionalmente che eventi indipendenti come il lancio della moneta mantengano le stesse probabilità, indipendentemente da quante volte li esegui.
Ma vediamo anche quegli eventi, in modo meno razionale, come sequenze che creano false correlazioni mentali tra eventi casuali. Considerando il passato come un preludio, continuiamo a pensare che la prossima svolta dovrebbe essere croce.
Gli statistici chiamano questo l'errore del giocatore d'azzardo, ovvero l'errore di Monte Carlo, dopo un esempio particolarmente illustrativo accaduto in quella famosa località turistica di Monaco.
Durante l'estate del 1913, gli scommettitori osservarono con crescente stupore la ruota della roulette di un casinò che finiva sul nero 26 volte di seguito. Infiammati dalla certezza che il rosso fosse "scaduto", gli scommettitori continuavano a puntare le loro fiches. Il casinò ha fatto una fortuna [fonti:Lehrer; Oppenheimer e Monin; Vogt].
Nessuna discussione su serie consecutive, pensieri magici o false cause sarebbe completa senza sfogliare le pagine sportive. Le stagioni sportive stellari nascono da una così misteriosa interazione di fattori - abilità naturali, allenamento, fiducia, occasionale fattore X - che immaginiamo modelli nelle prestazioni, anche se gli studi rifiutano ripetutamente i tiri di serie e le superstizioni di "successo" come qualcosa di più che immaginario. /P>
Credere in periodi di successo o di recessione implica che il successo “causi” il successo e il fallimento “causi” il fallimento o, forse più ragionevolmente, che la variazione di qualche fattore comune, come la fiducia, li causi entrambi. Ma uno studio dopo l'altro non riesce a confermarlo [fonte:Gilovich, et al].
Lo stesso vale per le superstizioni, anche se ciò non ha mai impedito al giocatore in pensione dell'NBA e guardia dei Dallas Mavericks Jason Terry di dormire nei pantaloncini da gioco delle squadre avversarie prima di ogni partita, o al centro della NHL e al giocatore in pensione degli Ottawa Senators Bruce Gardiner di inzuppare la sua mazza da hockey nel toilette per interrompere il crollo occasionale [fonte:Exact Sports].
Anche il crollo del secondo anno deriva tipicamente da un primo anno troppo buono. Le oscillazioni delle prestazioni tendono a stabilizzarsi nel lungo periodo, un fenomeno che gli statistici chiamano regressione verso la media [fonte:Barnett, et al]. Nello sport, questa media è aiutata dall'opposizione, che si adatta per contrastare le abilità di successo del nuovo giocatore.
Gli studi randomizzati e controllati rappresentano il gold standard in statistica, ma a volte, ad esempio in epidemiologia, considerazioni etiche e pratiche costringono i ricercatori ad analizzare i casi disponibili.
Sfortunatamente, tali studi osservazionali rischiano distorsioni, variabili nascoste e, peggio di tutto, gruppi di studio che potrebbero non riflettere accuratamente la popolazione. Lo studio di un campione rappresentativo è vitale; consente ai ricercatori di applicare i risultati a persone esterne allo studio, come il resto di noi.
Un esempio emblematico:la terapia ormonale sostitutiva (HRT) per le donne. Oltre a trattare i sintomi associati alla menopausa, un tempo era acclamato per la potenziale riduzione del rischio di malattia coronarica (CHD), grazie a uno studio osservazionale del 1991 molto pubblicizzato [fonte:Stampfer e Colditz].
Ma successivi studi randomizzati controllati, incluso il Women's Health Initiative su larga scala, hanno rivelato una relazione negativa, o statisticamente insignificante, tra HRT e CHD [fonte:Lawlor, et al.].
Perché la differenza? Per prima cosa, le donne che usano la terapia ormonale sostitutiva tendono a provenire da strati socioeconomici più elevati e ricevono una migliore qualità della dieta e dell'esercizio fisico:una relazione esplicativa nascosta di cui lo studio osservazionale non è riuscito a tenere pienamente conto [fonte:Lawlor, et al].
Nel 1978, il giornalista sportivo ed editorialista Leonard Koppett si fece beffe della confusione tra causa e correlazione suggerendo ironicamente che i risultati del Super Bowl potevano predire il mercato azionario. Si è ritorto contro:non solo la gente gli ha creduto, ma ha funzionato, con una frequenza spaventosa.
La proposta, ora comunemente nota come indicatore del Super Bowl, era la seguente:se una delle 16 squadre originali della National Football League – quelle esistenti prima della fusione della NFL con l’American Football League nel 1966 – vincesse il Super Bowl, il mercato azionario aumentare durante il resto dell’anno. Se un'ex squadra dell'AFL vincesse, andrebbe giù [fonte:Bonsal].
Dal 1967 al 1978, il sistema di Koppett è andato 12 su 12; fino al 1997 vantava una percentuale di successo del 95%. Ha inciampato durante l’era delle dot-com (1998-2001) e in particolare nel 2008, quando ha colpito la Grande Recessione, nonostante la vittoria dei New York Giants (NFC). Tuttavia, nel 2022, l'indicatore aveva un tasso di successo del 73% [fonte:Chen].
Alcuni hanno sostenuto che il modello esiste, guidato dalla convinzione; funziona, dicono, perché gli investitori credono che funzioni, o perché credono che altri investitori ci credano.
Questa nozione, sebbene intelligente in un certo senso regressivo, difficilmente spiega i 12 anni di correlazioni riuscite precedenti all'articolo di Koppett. Altri sostengono che un modello più rilevante risiede nella tendenza al rialzo su larga scala del mercato azionario, escludendo alcune fluttuazioni maggiori e minori a breve termine [fonte:Johnson].
I big data - il processo di ricerca di modelli in set di dati così grandi da resistere ai metodi di analisi tradizionali - suscitano grande interesse nella sala del consiglio [fonte:Arthur]. Ma più grande è sempre meglio?
È una regola che viene inculcata nella maggior parte dei ricercatori durante la loro prima lezione di statistica:quando incontri un mare di dati, resisti alla tentazione di partecipare a una battuta di pesca. Con dati sufficienti, pazienza e margine di manovra metodologico, le correlazioni sono quasi inevitabili, anche se non etiche e in gran parte inutili.
Dopotutto, la semplice correlazione tra due variabili non implica causalità; né, in molti casi, indica una grande relazione.
Per prima cosa, i ricercatori non possono utilizzare misure statistiche di correlazione, volenti o nolenti; ciascuno contiene determinati presupposti e limiti che le spedizioni di pesca troppo spesso ignorano, per non parlare delle variabili nascoste, dei problemi di campionamento e dei difetti di interpretazione che possono inficiare uno studio mal progettato.
Ma i big data vengono sempre più utilizzati e apprezzati per il loro inestimabile contributo in aree quali la creazione di programmi di apprendimento personalizzati; dispositivi indossabili che forniscono feed in tempo reale alle cartelle cliniche elettroniche; e servizi di streaming musicale che forniscono consigli mirati [fonte:IntelliPaat]. Basta non aspettarsi troppo dai big data nel reparto causalità.
Qualsiasi questione che abbia a che fare con il denaro è destinata a creare profonde divisioni e ad essere altamente politicizzata, e gli aumenti del salario minimo non fanno eccezione. Le argomentazioni sono varie e complesse, ma essenzialmente una parte sostiene che un salario minimo più elevato danneggia le imprese, il che riduce la disponibilità di posti di lavoro, il che danneggia i poveri.
L’altra parte risponde che ci sono poche prove a sostegno di questa affermazione e che i 76 milioni di americani che lavorano al salario minimo o al di sotto di esso, che alcuni sostengono non sia un salario dignitoso, trarrebbero vantaggio da un tale aumento. Sostengono che il salario minimo federale per i dipendenti coperti e non esentati ($ 7,25 l'ora nel settembre 2023) ha ridotto il potere d'acquisto degli americani di oltre il 20% [fonti:Dipartimento del lavoro degli Stati Uniti; Cooper, et al].
Come avrebbe scherzato il critico letterario George Shaw, "Se tutti gli economisti fossero messi uno alla volta, non raggiungerebbero mai una conclusione", e il dibattito sul salario minimo sembra confermarlo [fonte:Quote Investigator]. Per ogni analista che afferma che gli aumenti del salario minimo portano via posti di lavoro, ce n'è un altro che si oppone a tale correlazione.
Alla fine, entrambe le parti condividono un problema fondamentale:vale a dire, l’abbondanza di prove aneddotiche su cui molti dei loro portavoce fanno affidamento per ottenere supporto. Storie di seconda mano e dati selezionati con cura rendono il tè debole in qualsiasi festa, anche se presentati in graziosi grafici a barre.
Tra app per il fitness, farmaci e interventi chirurgici, la perdita di peso negli Stati Uniti è un'industria da 78 miliardi di dollari all'anno, con milioni di americani che ogni anno si scontrano con la barra della perdita di peso [fonte:Research and Markets]. Non sorprende che gli studi sulla perdita di peso, buoni, cattivi o brutti, ricevano molta attenzione dalla stampa negli Stati Uniti.
Prendiamo l’idea popolare che fare colazione batte l’obesità, una crocchetta glassata di zucchero derivata da due studi principali:uno, uno studio randomizzato e controllato della Vanderbilt University del 1992, ha dimostrato che l’inversione delle normali abitudini della colazione, sia mangiando che non mangiando, è correlata alla perdita di peso; l'altro, uno studio osservazionale del 2002 condotto dal National Weight Control Registry, ha correlato il consumo della colazione con il dimagrimento di successo, il che non equivale a correlarlo con la perdita di peso [fonti:Brown, et al.; Schlundt et al.; Wyatt, et al.].
Sfortunatamente, lo studio NWCR non è riuscito a controllare altri fattori o, in effetti, a stabilire alcuna connessione causale dalla sua correlazione. Ad esempio, una persona che vuole perdere peso potrebbe allenarsi di più, fare colazione o assumere proteine integrali, ma senza un disegno sperimentale in grado di stabilire collegamenti causali, tali comportamenti non sono altro che caratteristiche comunemente concomitanti [fonte :Brown, et al].
Un problema simile affligge i numerosi studi che collegano le cene di famiglia con una diminuzione del rischio di dipendenza dalla droga per gli adolescenti. Sebbene attraenti per la loro strategia semplice e accattivante, questi studi spesso non riescono a controllare i fattori correlati, come forti legami familiari o profondo coinvolgimento dei genitori nella vita di un bambino [fonte:Miller, et al].
Sentiamo spesso dire che gli uomini, soprattutto i giovani, hanno maggiori probabilità di suicidarsi rispetto alle donne. In verità, tali affermazioni rientrano nella generalizzazione empirica (l'atto di fare un'affermazione ampia su un modello comune senza tentare di spiegarlo) e mascherano diversi fattori di confusione noti e potenziali.
Prendiamo, ad esempio, un sondaggio sui comportamenti a rischio dei giovani del 2021 che ha rilevato che le ragazze delle classi 9-12 hanno tentato il suicidio quasi il doppio delle volte rispetto agli studenti maschi (13% contro 7%) [fonte:American Foundation for Suicide Prevention].
Come può allora esistere una correlazione più elevata tra il sesso opposto e il suicidio? La risposta sta nei tentativi di suicidio per metodologia:mentre il metodo di suicidio più comune per entrambi i sessi nel 2020 era con armi da fuoco (57,9% per gli uomini e 33,0% per le donne), le donne avevano quasi la stessa probabilità di morire per avvelenamento o soffocamento [fonte:Istituto Nazionale di Salute Mentale].
Anche se potessimo eliminare tali fattori confondenti, rimarrebbe il fatto che la mascolinità, di per sé, non è una causa. Per spiegare la tendenza occorre invece individuare fattori comuni agli uomini, o quantomeno tendenze suicide.
Lo stesso discorso vale per i tassi relativamente elevati di suicidio segnalati tra gli uomini divorziati. Il divorzio non induce gli uomini a suicidarsi; se non altro, è più indicativo di una relazione causale sottostante con fattori come l'inflessibilità del ruolo maschile, le loro reti sociali, la crescente importanza della cura dei figli e il desiderio degli uomini di controllo nelle relazioni [fonte:Scourfield ed Evans].
Nessun elenco di correlazioni/cause sarebbe completo senza discutere le preoccupazioni dei genitori sulla sicurezza delle vaccinazioni. Prima che la pandemia di COVID-19 colpisse il mondo nel 2020, il problema principale era il timore di alcuni genitori che la vaccinazione contro morbillo, parotite e rosolia fosse causalmente collegata ai disturbi dello spettro autistico. Questa nozione è stata resa popolare da celebrità come Jenny McCarthy.
Nonostante la comunità medica abbia sfatato il documento di Andrew Wakefield del 1998 che ha ispirato la falsità, e nonostante studi successivi non mostrino alcun collegamento causale, alcuni genitori rimangono timorosi di una connessione con l'autismo o di altri pericoli legati al vaccino [fonti:Park; Sifferlin; Szabo].
Poi è arrivato il COVID-19, che fino ad oggi ha ucciso milioni di persone in tutto il mondo. Gli scienziati hanno corso per creare un vaccino efficace e ci sono riusciti; il primo vaccino statunitense contro il COVID-19 era disponibile nel dicembre 2020 con l'autorizzazione all'uso di emergenza della FDA [fonte:FDA]. Ma si è rapidamente intrecciato anche con l'estrema polarizzazione della politica e della disinformazione degli Stati Uniti.
Molti genitori, soprattutto repubblicani, temevano che i vaccini non fossero sicuri perché erano stati sviluppati così rapidamente e perché potevano esserci effetti collaterali a lungo termine ancora sconosciuti. C’erano anche timori errati riguardo al fatto che il vaccino avrebbe influenzato la fertilità futura. Ora questi si sono rivelati falsi [fonte:Kelen e Maragakis].
A gennaio 2022, solo il 28% dei bambini di età compresa tra 5 e 11 anni aveva ricevuto almeno una dose di vaccino, deludendo molti in campo medico [fonti:Hamel, Kates]. Cresce il numero dei bambini vaccinati; entro maggio 2023, il 40% dei bambini di età compresa tra 5 e 11 anni aveva ricevuto almeno una dose completa [fonte:CDC].
Non si tratta di malintesi innocui. Nonostante sia stato sfatato il legame tra autismo e vaccini infantili, molti genitori rimangono diffidenti nei confronti delle vaccinazioni. Nel 2019, si sono verificati 1.282 casi di morbillo in 31 stati, il numero più alto negli Stati Uniti dal 1992. La maggior parte di questi casi riguardava tra i non vaccinati [fonte:CDC].
Vale la pena considerare se tale corrispondenza sia casuale, correlativa o causale. E gli effetti dell'attuale esitazione sulla vaccinazione contro il COVID-19 restano da vedere.