Credito:Pixabay/CC0 Dominio pubblico
Immagina che ci sia un autobus che arriva in media ogni 30 minuti e arrivi alla fermata dell'autobus senza sapere quando è partito l'ultimo autobus. Quanto tempo puoi aspettarti di aspettare il prossimo autobus? Intuitivamente, metà di 30 minuti suona bene, ma saresti molto fortunato ad aspettare solo 15 minuti.
Dire, Per esempio, che la metà delle volte gli autobus arrivano con un intervallo di 20 minuti e l'altra metà con un intervallo di 40 minuti. La media complessiva è ora di 30 minuti. Dal tuo punto di vista, però, è doppiamente probabile che ti presenti durante l'intervallo di 40 minuti rispetto all'intervallo di 20 minuti.
Questo è vero in ogni caso, tranne quando gli autobus arrivano a intervalli esatti di 30 minuti. All'aumentare della dispersione intorno alla media, così fa l'importo di cui il tempo di attesa previsto supera l'attesa media. Questo è il paradosso dell'ispezione, che afferma che ogni volta che si "ispeziona" un processo, è probabile che le cose richiedano (o durino) più a lungo della loro media "non ispezionata". Quella che sembra la persistenza della sfortuna non è altro che le leggi della probabilità e le statistiche che svolgono il loro corso naturale.
Una volta resosi conto del paradosso, sembra apparire dappertutto.
Per esempio, diciamo che vuoi fare un sondaggio sulla dimensione media della classe in un college. Supponiamo che il college abbia classi di 10 o 50, e ci sono numeri uguali di ciascuno. Quindi la dimensione media complessiva della classe è 30. Ma selezionando uno studente a caso, è cinque volte più probabile che provenga da una classe di 50 studenti piuttosto che da 10 studenti. Quindi, per ogni studente che risponde "10" alla tua richiesta sulla dimensione della classe, saranno cinque quelli che risponderanno "50". La dimensione media della classe generata dal tuo sondaggio è più vicina a 50, perciò, di 30. Quindi l'atto di ispezionare le dimensioni della classe aumenta notevolmente la media ottenuta rispetto al vero, media non controllata. L'unica circostanza in cui la media ispezionata e non ispezionata coincide è quando ogni dimensione della classe è uguale.
Possiamo esaminare lo stesso paradosso nel contesto del cosiddetto campionamento basato sulla lunghezza. Per esempio, quando si scavano le patate, perchè la forcella passa attraverso quella molto grande? Perché la connessione di rete si interrompe durante il download del file più grande? Non è perché sei nato sfortunato, ma perché questi risultati si verificano per una maggiore estensione dello spazio o del tempo rispetto all'estensione media dello spazio o del tempo.
Una volta che conosci il paradosso dell'ispezione, il mondo e la nostra percezione del nostro posto in esso non sono mai più gli stessi.
Un altro giorno ti metti in fila allo studio medico per essere testato per un virus. Il test è accurato al 99% e risulta positivo. Ora, qual è la possibilità che tu abbia il virus? La risposta intuitiva è 99%. Ma è giusto? Le informazioni che ci vengono fornite si riferiscono alla probabilità di risultare positivi dato che hai il virus. Quello che vogliamo sapere, però, è la probabilità di avere il virus dato che sei positivo. L'intuizione comune fonde queste due probabilità, ma sono molto diversi. Questo è un esempio dell'inverso o dell'errore del procuratore.
L'importanza del risultato del test dipende dalla probabilità di avere il virus prima di eseguire il test. Questa è nota come probabilità a priori. Essenzialmente, abbiamo una competizione tra quanto è raro il virus (il tasso di base) e quanto raramente il test è sbagliato. Diciamo che c'è una possibilità su 100, sulla base dei tassi di prevalenza locali, che hai il virus prima di fare il test. Ora, ricorda che il test è sbagliato una volta su 100. Queste due probabilità sono uguali, quindi la possibilità che tu abbia il virus quando sei positivo al test è 1 su 2, nonostante il test sia accurato al 99%. Ma cosa succede se si mostrano i sintomi del virus prima di essere testati? In questo caso, dovremmo aggiornare la probabilità a priori a qualcosa di più alto del tasso di prevalenza nella popolazione testata. La possibilità che tu abbia il virus quando sei positivo al test aumenta di conseguenza. Possiamo usare il teorema di Bayes per eseguire i calcoli.
In sintesi, l'intuizione spesso ci delude. Ancora, applicando i metodi della probabilità e della statistica, possiamo sfidare l'intuizione. Possiamo persino risolvere quello che a molti potrebbe sembrare il più grande mistero di tutti:perché sembra che ci troviamo così spesso bloccati nella corsia o coda più lenta. Intuitivamente, siamo nati sfortunati. La risposta logica all'enigma della corsia più lenta è che è esattamente dove dovremmo aspettarci di essere!
Quando l'intuizione fallisce, possiamo sempre usare probabilità e statistiche per cercare le risposte reali.