La probabilità è una misura di quanto è probabile che qualcosa accada (o non accada). La probabilità di misurazione si basa solitamente su un rapporto tra la frequenza con cui un evento può verificarsi in relazione a quante possibilità ha accaduto. Pensa a lanciare un dado: il numero uno ha una probabilità su sei di accadere in un dato lancio. Affidabilità, statisticamente parlando, significa solo coerenza. Se misuri qualcosa cinque volte e ottieni stime che sono abbastanza vicine, la tua stima può essere considerata affidabile. L'affidabilità è calcolata sulla base di quante misurazioni e misuratori ci sono.
Calcolo della probabilità
Definire "successo" per l'evento di interesse. Diciamo che siamo interessati a conoscere la probabilità di lanciare un quattro su un dado. Pensa a ogni lancio del dado come a una prova, in cui "riesci" (tira un quattro) o "fallisci" (tira un altro numero). Su ogni dado, c'è una faccia "successo" e cinque facce "fallite". Questo diventerà il tuo numeratore nel calcolo finale.
Determina il numero totale di risultati possibili per l'evento di interesse. Usando l'esempio del lancio di un dado, il numero totale di risultati è sei, perché ci sono sei diversi numeri sul dado. Questo diventerà il tuo denominatore nel calcolo finale.
Dividi il possibile successo sui risultati totali possibili. Nel nostro esempio di dado, la probabilità sarebbe 1/6 (una possibilità di successo per sei risultati totali possibili per ogni lancio del dado).
Calcola la probabilità di più di un evento moltiplicando le probabilità individuali. Nel nostro esempio di dado, la probabilità di rotolare un quattro e tirare un sei su un tiro successivo è il multiplo delle probabilità individuali (1/6) x (1/6) = (1/36).
Calcola la probabilità di più di un evento aggiungendo singole probabilità. Nel nostro esempio di dado, la probabilità di rotolare un quattro o di arrotolare un sei sarebbe (1/6) + (1/6) = (2/6).
Calcolo dell'affidabilità delle misure multiple
Valuta il cambiamento nella media. Se abbiamo un gruppo di cinque persone e pesiamo ogni persona due volte, ci ritroviamo con due stime di peso di gruppo (la media o "media"). Confrontare le due medie per determinare se la differenza tra loro è ragionevolmente coerente o se le misure differiscono sostanzialmente. Questo viene fatto facendo un test statistico - chiamato t-test - per confrontare i due mezzi.
Calcola l'errore tipico atteso, noto anche come deviazione standard. Se misurassimo il peso di una persona 100 volte, ci ritroveremmo con misurazioni molto vicine al peso reale e altre che sono più lontane. Questa diffusione delle misurazioni ha una certa variazione prevista e può essere attribuita a casualità, a volte indicata come deviazione standard. Le misure che si trovano al di fuori della deviazione standard sono considerate dovute a qualcosa di diverso dal caso casuale.
Calcola la correlazione tra due serie di misurazioni. Nel nostro esempio di peso, i due gruppi di misure potrebbero variare dall'assenza di valori in comune (correlazione di zero) a essere esattamente la stessa (correlazione di uno). Valutare quanto siano strettamente correlate due serie di misurazioni è importante per determinare la coerenza delle misurazioni. L'alta correlazione implica un'elevata affidabilità delle misurazioni. Pensa alla variabilità che potrebbe essere introdotta utilizzando scale diverse ogni volta o che persone diverse leggono le scale. Negli esperimenti e nei test statistici, è importante identificare quanta variabilità è dovuta al caso casuale e quanto è dovuto a qualcosa che abbiamo fatto diversamente nella nostra misurazione.