Pensereste ormai che potremmo dire inequivocabilmente cosa causa cosa. Ma la questione della causa, che ha perseguitato la scienza e la filosofia fin dai primi giorni, ci insegue ancora per numerose ragioni. Gli esseri umani sono evolutivamente predisposti a vedere schemi e psicologicamente inclini a raccogliere informazioni che supportano visioni preesistenti, un tratto noto come bias di conferma . Confondiamo la coincidenza con la correlazione e la correlazione con la causalità.
Affinché A causi B, tendiamo a dire che, al minimo, A deve precedere B, i due devono covariare (variare insieme), e nessuna spiegazione in competizione può spiegare meglio la covarianza di A e B. Presa da sola, però, questi tre requisiti non possono essere giustificati; loro sono, come dicono i filosofi, necessario ma non sufficiente. In ogni caso, non tutti sono d'accordo con loro.
Parlando di filosofi, David Hume ha sostenuto che la causalità non esiste in alcun senso dimostrabile. Karl Popper e i falsificatori sostenevano che non possiamo provare una relazione, solo smentirlo, il che spiega perché le analisi statistiche non cercano di dimostrare una correlazione; Invece, tirano una doppia negazione e confutano che i dati non sono correlati, un processo noto come rigettando l'ipotesi nulla .
Con tali considerazioni in mente, gli scienziati devono progettare e controllare attentamente i loro esperimenti per eliminare i pregiudizi, ragionamento circolare, profezie che si autoavverano e variabili nascoste. Devono rispettare i requisiti e i limiti dei metodi utilizzati, prelevare da campioni rappresentativi, ove possibile, e non sopravvalutare i loro risultati.
Pronto a leggere circa 10 casi in cui non è stato così facile?
ContenutiLe persone sono una seccatura per la ricerca. Reagiscono non solo allo stimolo che stai studiando, ma anche all'esperimento stesso. I ricercatori oggi cercano di progettare esperimenti per controllare tali fattori, ma non è sempre stato così.
Prendi le opere di Hawthorne in Cicerone, Ill. In una serie di esperimenti del 1924-1932, i ricercatori hanno studiato gli effetti sulla produttività dei lavoratori associati all'alterazione dell'ambiente della fabbrica dell'Illinois, compreso il cambiamento dei livelli di luce, riordinare il posto e spostare le postazioni di lavoro. Proprio quando pensavano di essere su qualcosa, hanno notato un problema:gli aumenti osservati della produttività sono stati segnalati non appena i ricercatori hanno lasciato i lavori, indicando che la conoscenza dei lavoratori dell'esperimento, non i cambiamenti dei ricercatori, aveva alimentato la spinta. I ricercatori chiamano ancora questo fenomeno il Effetto Hawthorne .
Un concetto correlato, il Effetto John Henry , si verifica quando i membri di un gruppo di controllo cercano di battere il gruppo sperimentale spingendo i loro sforzi in overdrive. Non hanno bisogno di sapere dell'esperimento; devono solo vedere un gruppo ricevere nuovi strumenti o istruzioni aggiuntive. Come l'uomo leggendario che guida l'acciaio, vogliono dimostrare le loro capacità e guadagnare rispetto [fonti:Saretsky; Voga].
I personaggi titolari del film di Tom Stoppard "Rosencrantz e Guildenstern sono morti" iniziano il film sconcertati, confuso e infine spaventato quando ciascuno dei 157 lanci consecutivi di una moneta esce testa. Le spiegazioni di Guildenstern di questo fenomeno vanno dai cicli temporali a "una spettacolare rivendicazione del principio che ogni singola moneta, filato individualmente, è probabile che scenda testa come croce..."
L'evoluzione ha cablato gli umani per vedere gli schemi, e la nostra capacità di elaborare adeguatamente quell'impulso sembra andare in cortocircuito più a lungo trascorriamo il gioco d'azzardo. Possiamo accettare razionalmente che eventi indipendenti come i lanci di monete mantengono le stesse probabilità, non importa quante volte li esegui. Ma vediamo anche quegli eventi, meno razionalmente, come strisce, creare false correlazioni mentali tra eventi randomizzati. Considerando il passato come preludio, continuiamo a pensare che il prossimo lancio dovrebbe essere croce.
Gli statistici lo chiamano fallacia del giocatore d'azzardo , alias the Errore di Montecarlo , dopo un esempio particolarmente illustrativo avvenuto in quella famosa località turistica di Monaco. Nell'estate del 1913, gli scommettitori hanno osservato con crescente stupore come la ruota della roulette di un casinò è atterrata sul nero 26 volte di fila. Infiammato dalla certezza che il rosso fosse "dovuto, " gli scommettitori continuavano a buttare giù le loro fiches. Il casinò ha fatto una zecca [fonti:Lehrer; Oppenheimer e Monin; Vogt].
Nessuna discussione sulle strisce, il pensiero magico o la falsa causalità sarebbero completi senza sfogliare le pagine sportive. Le stagioni sportive stellari nascono da una misteriosa interazione di fattori:abilità naturali, addestramento, fiducia, il fattore X occasionale - che immaginiamo modelli nelle prestazioni, anche se gli studi rifiutano ripetutamente di sparare serie e le superstizioni "di successo" come qualcosa di più che immaginario.
La credenza in strisce o crolli implica che il successo "causa" il successo e il fallimento "causa" il fallimento o, forse più ragionevolmente, quella variazione in qualche fattore comune, come la fiducia, causa entrambi. Ma studio dopo studio non riesce a confermarlo [fonti:Gilovich et al.; Tversky e Gilovich]. Lo stesso vale per le superstizioni, anche se ciò non ha impedito a Kevin Rhomberg dei Cleveland Indians di rifiutarsi di svoltare a destra mentre era in campo, o impedire al centro dei senatori di Ottawa Bruce Gardiner di inzuppare la sua mazza da hockey nella toilette per rompere il crollo occasionale [fonte:Trex].
Il secondo crollo, pure, di solito deriva da un primo anno troppo buono. Le oscillazioni delle prestazioni tendono a uniformarsi nel lungo periodo, un fenomeno che gli statistici chiamano regressione verso la media . Nello sport, questa media è aiutata dall'opposizione, che si adatta per contrastare il set di abilità di successo del nuovo giocatore.
Gli studi randomizzati controllati sono il gold standard nelle statistiche, ma a volte - in epidemiologia, per esempio, considerazioni etiche e pratiche costringono i ricercatori ad analizzare i casi disponibili. Sfortunatamente, tale studi osservazionali bias di rischio, variabili nascoste e, peggio di tutto, un gruppo di studio che potrebbe non riflettere la popolazione nel suo insieme. Lo studio di un campione rappresentativo è vitale; consente ai ricercatori di applicare i risultati a persone al di fuori dello studio, come il resto di noi.
Un esempio calzante:la terapia ormonale sostitutiva (HRT). Oltre a trattare i sintomi associati alla menopausa, una volta era acclamato per ridurre potenzialmente il rischio di malattia coronarica (CHD), grazie a uno studio osservazionale del 1991 molto chiacchierato [fonte:Stampfer e Colditz]. Ma in seguito studi controllati randomizzati, compresa l'iniziativa su vasta scala per la salute delle donne, rivelato una relazione negativa, o statisticamente insignificante, tra HRT e CHD [fonti:Lawlor et al.; New York Times].
Perché la differenza? Per una cosa, le donne che usano la TOS tendono a provenire da strati socioeconomici più elevati e ricevono una migliore qualità della dieta e dell'esercizio fisico - una relazione esplicativa nascosta per la quale lo studio osservazionale non è riuscito a tenere pienamente conto [fonte:Lawlor et al.].
Nel 1978, il giornalista sportivo ed editorialista Leonard Koppett ha deriso la confusione di correlazione causale suggerendo ironicamente che i risultati del Super Bowl potrebbero prevedere il mercato azionario. Si è ritorto contro:non solo la gente gli credeva, ma ha funzionato, con frequenza spaventosa.
La proposta era la seguente:se una delle 16 squadre originali della National Football League - quelle esistenti prima della fusione della NFL del 1966 con l'American Football League - avesse vinto il Super Bowl, il mercato azionario chiuderebbe più in alto l'anno successivo rispetto al precedente 31 dicembre. Se vincesse un'ex squadra AFL, sarebbe andato giù [fonti:Koppett; Koppet; Koppet; Koppet; Zweig].
Dal 1967 al 1978, Il sistema di Koppett è andato 12 per 12; fino al 1997, vantava un tasso di successo del 95%. È inciampato nel 1998 e nel 1999, quando gli alunni dell'AFL hanno vinto i Denver Broncos e il mercato è salito [fonti:Koppett; Koppet; Koppet; Koppet].
Alcuni hanno sostenuto che il modello esiste, guidato dalla fede; Funziona, dicono, perché gli investitori credono di sì, o perché credono che altri investitori ci credano. Questa nozione, sebbene intelligente in un modo regressivo, difficilmente spiega i 12 anni di correlazioni di successo precedenti l'articolo di Koppett. Altri sostengono che un modello più rilevante risiede nella tendenza al rialzo su larga scala del mercato azionario, salvo alcune fluttuazioni maggiori e minori a breve termine, e il fatto che una squadra NFL originale abbia vinto ogni Super Bowl dal 1984 al 1998 [fonte:Norris].
I big data - il processo di ricerca di modelli in set di dati così grandi da resistere ai metodi di analisi tradizionali - registrano un grande clamore nella sala del consiglio in questi giorni [fonte:Arthur]. Ma più grande è sempre meglio?
È una regola che è rimasta impressa nella maggior parte dei ricercatori nella loro prima lezione di statistiche:quando si incontra un mare di dati, resistere alla tentazione di andare avanti spedizione di pesca . Dati sufficienti, pazienza e margine metodologico, le correlazioni sono quasi inevitabili, se immorale e in gran parte inutile.
Dopotutto, la semplice correlazione tra due variabili non implica causalità; né lo fa, in molti casi, indicare gran parte di una relazione. Per una cosa, i ricercatori non possono usare misure statistiche di correlazione volenti o nolenti; ognuno contiene alcuni presupposti e limitazioni che troppo spesso le spedizioni di pesca ignorano, per non parlare delle variabili nascoste, problemi di campionamento e difetti di interpretazione che possono rovinare uno studio mal progettato.
Concesso, i big data hanno i suoi usi. Il controllo dell'inventario prospera sulla scoperta di modelli di acquisto, per quanto misteriose le loro cause profonde. Per fare un esempio un po' inquietante, Target ha utilizzato modelli di acquisto per identificare le clienti incinte e quindi inviare loro coupon mirati [fonti:Duhigg; Collina; Taylor]. Quindi goditi quella carta dei premi - e il 10% di sconto sulle vitamine prenatali - ma non aspettarti troppo dai big data nel dipartimento di causalità.
Qualsiasi questione che abbia a che fare con il denaro è destinata a essere profondamente divisiva e altamente politicizzata, e gli aumenti del salario minimo non fanno eccezione. Gli argomenti sono vari e complessi, ma essenzialmente una parte sostiene che un salario minimo più elevato danneggia le imprese, che riduce la disponibilità di posti di lavoro, che fa male ai poveri. L'altra parte risponde che ci sono poche prove per questa affermazione, e che i 3,6 milioni di americani che lavorano al salario minimo o al di sotto, che alcuni sostengono non sia un salario di sussistenza, trarrebbe vantaggio da tale aumento. Sostengono che, corretto per l'inflazione, il salario minimo federale (7,25 dollari l'ora a dicembre 2013) è sceso in discesa negli ultimi 40 anni [fonti:Bureau of Labor Statistics; Irwin].
Come riferito scherzato da George Bernard Shaw, "Se tutti gli economisti fossero messi in fila, non arriverebbero mai a una conclusione, " e il dibattito sul salario minimo sembra confermarlo [fonte:Ridgers. Per ogni analista che afferma che gli aumenti del salario minimo allontanano i posti di lavoro ce n'è un altro che si oppone a tale correlazione [fonti:Baskaya e Rubinstein; Card e Krueger].
Alla fine, entrambe le parti condividono un problema fondamentale, vale a dire, l'abbondanza di prove aneddotiche su cui molte delle loro teste parlanti fanno affidamento per avere supporto. Storie di seconda mano e dati raccolti con cura rendono il tè debole in qualsiasi festa, anche se presentati in graziosi grafici a barre.
tra libri, farmaci e interventi chirurgici, la perdita di peso negli Stati Uniti è un'industria da 20 miliardi di dollari all'anno, con 108 milioni di americani che si mettono a pancia in su alla barra di perdita di peso ogni anno [fonte:ABC News]. Non sorprendentemente, studi sulla perdita di peso:buono, brutta o brutta -- ottieni molta stampa negli Stati Uniti
Prendi l'idea popolare che fare colazione batte l'obesità, una pepita glassata di zucchero derivata da due studi principali:uno, uno studio controllato randomizzato della Vanderbilt University del 1992, ha dimostrato che invertendo le normali abitudini della colazione, se mangiando o non mangiando, correlato con la perdita di peso; l'altro, uno studio osservazionale del 2002 del National Weight Control Registry, la colazione correlata con i dimagrimenti di successo - che non è la stessa cosa che correlarla con la perdita di peso [fonti:Brown et al.; O'Connor; Schlundt et al.; Wyatt et al.].
Sfortunatamente, lo studio NWCR non è riuscito a controllare altri fattori - o, infatti, stabilire alcun nesso causale dalla sua correlazione. Per esempio, una persona che vuole perdere peso potrebbe allenarsi di più, o fare colazione, o vai a proteine di maiale intero, ma senza un disegno sperimentale capace di comporre nessi causali, tali comportamenti non sono altro che caratteristiche comuni [fonti:Brown et al.; O'Connor].
Un problema simile affligge i numerosi studi che collegano le cene di famiglia a un ridotto rischio di tossicodipendenza per gli adolescenti. Sebbene attraenti per la loro semplicità, strategia accattivante, questi studi spesso non riescono a controllare i fattori correlati, come forti legami familiari o profondo coinvolgimento dei genitori nella vita di un bambino [fonte:Bialik].
Lo sentiamo spesso sbandierare su quegli uomini, soprattutto giovani, hanno maggiori probabilità di suicidarsi rispetto alle donne. In verità, tali dichiarazioni partecipano di generalizzazione empirica - l'atto di fare un'affermazione ampia su un modello comune senza tentare di spiegarlo - e mascherare un numero di fattori di confusione noti e potenziali.
Prendere, Per esempio, il fatto che le donne fanno il triplo dei tentativi di suicidio degli uomini. Come può quindi esistere una correlazione più elevata tra il sesso opposto e il suicidio? La risposta sta nel tasso di successo, influenzate dalle differenze di metodologia:le donne ricorrono alle pillole, mentre gli uomini tendono a preferire le pistole [fonte:O'Connell].
Anche se potessimo eliminare tali fattori di confusione, rimarrebbe il fatto che la mascolinità, di per sé, non è una causa. Per spiegare la tendenza, dobbiamo invece individuare fattori comuni agli uomini, o almeno suicidi. Lo stesso punto si applica ai tassi relativamente alti di suicidio segnalati tra gli uomini divorziati. Il divorzio non induce gli uomini a suicidarsi; se qualcosa, la variabile causale si nasconde tra fattori correlati, come l'isolamento, depressione, un senso di impotenza, stress finanziario o perdita di custodia [fonti:Kposowa; Kposowa; Reuters].
Nessuna lista di correlazione/causa sarebbe completa senza discutere le preoccupazioni dei genitori sulla sicurezza della vaccinazione, radicato nell'idea, reso popolare da celebrità come Jenny McCarthy, quel morbillo, le vaccinazioni contro la parotite e la rosolia (MMR) sono causalmente legate ai disturbi dello spettro autistico. Nonostante la comunità medica abbia smentito il documento di Andrew Wakefield del 1998 che ha ispirato l'idea, e nonostante studi successivi non abbiano mostrato alcun nesso causale, anche con più vaccinazioni, alcuni genitori rimangono timorosi di una connessione con l'autismo o di altri pericoli legati al vaccino [fonti:The Lancet; Parco; Sifferlin; Szabo].
Anche se è vero che nessun vaccino è innocuo al 100%, la credenza in questo nesso causale deriva principalmente dalla preoccupazione dei genitori naturali, carico di confusione, alimentato da prove aneddotiche e influenzato da bias di conferma , o "se non ci avessi creduto non l'avrei visto". Ad alimentare ulteriormente la confusione è il fatto che genitori e medici tendono a riconoscere i sintomi dell'autismo in ritardo, intorno all'età in cui i bambini ricevono molte vaccinazioni. In Attualità, l'esordio dell'autismo è piuttosto complesso e segue più di uno schema. Infatti, gli studi ora mostrano che l'esordio può iniziare già a 6-12 mesi [fonti:CDC; Johnson e Schultz; Mandell et al.; NIH; Ozonoff et al.].
Non è un malinteso innocuo. Nel 2011, La rivista Time ha riferito che il 13% dei genitori ha saltato, ritardare o frazionare le vaccinazioni dei propri figli; in alcune zone rurali, quel numero è salito tra il 20 e il 50 percento. Nel frattempo, 15 anni dopo l'inizio di questo panico, i centri medici hanno riportato focolai di pertosse e morbillo. Se tale corrispondenza è casuale, correlativo o causale vale la pena considerare [fonti:O'Connor; Parco; Parco].
Pubblicato originariamente:23 dicembre 2013
Per quanto io aborrisca un design sperimentale scadente, cieca fiducia nelle statistiche e nei rapporti scientifici sensazionalistici, vale la pena ricordare che le forti correlazioni, pur non essendo da solo sufficienti a provare la causa, spesso indicano aree che vale la pena indagare. Chiaramente, per "correlazioni" non intendo autocorrelazioni, variabili confondenti o altri artefatti di cattiva progettazione o requisiti e vincoli metodologici mal compresi; tuttavia, forse Internet può mettere da parte per un po' lo slogan "correlazione non implica causalità", o almeno diventare un po' più selettivo nella sua applicazione.