La distorsione è l'errore nelle stime a causa di errori sistematici che portano a risultati costantemente alti o bassi rispetto ai valori effettivi. La distorsione individuale di una stima nota come distorta è la differenza tra i valori stimati e quelli effettivi. Se non è noto che la stima sia distorta, la differenza potrebbe anche essere dovuta a errori casuali o altre imprecisioni. Contrariamente al bias, che agisce sempre in una direzione, questi errori possono essere positivi o negativi.
Per calcolare il bias di un metodo utilizzato per molte stime, trovare gli errori sottraendo ciascuna stima dal valore effettivo o osservato . Aggiungi tutti gli errori e dividi per il numero di stime per ottenere il bias. Se gli errori si sommano a zero, le stime erano imparziali e il metodo fornisce risultati imparziali. Se le stime sono distorte, potrebbe essere possibile trovare l'origine del bias ed eliminarlo per migliorare il metodo.
TL; DR (troppo lungo; non letto)
Calcola la distorsione trovando la differenza tra una stima e il valore effettivo. Per trovare la distorsione di un metodo, eseguire molte stime e sommare gli errori in ciascuna stima rispetto al valore reale. Dividendo per il numero di stime si ottiene la distorsione del metodo. Nelle statistiche, potrebbero esserci molte stime per trovare un singolo valore. La distorsione è la differenza tra la media di queste stime e il valore reale.
Come funziona la distorsione
Quando le stime sono distorte, sono costantemente errate in una direzione a causa di errori nel sistema utilizzato per le stime. Ad esempio, una previsione meteorologica può prevedere costantemente temperature più elevate di quelle effettivamente osservate. La previsione è distorta e da qualche parte nel sistema c'è un errore che dà una stima troppo alta. Se il metodo di previsione è imparziale, può comunque prevedere temperature non corrette, ma a volte le temperature errate saranno più alte e talvolta inferiori alle temperature osservate.
La distorsione statistica funziona allo stesso modo ma di solito si basa su un gran numero di stime, sondaggi o previsioni. Questi risultati possono essere rappresentati graficamente in una curva di distribuzione e il bias è la differenza tra la media della distribuzione e il valore reale. In caso di pregiudizio, ci sarà sempre una differenza anche se alcune stime individuali potrebbero cadere su entrambi i lati del valore reale.
Bias in Surveys
Un esempio di bias è una società di sondaggi che organizza sondaggi durante le elezioni campagne, ma i risultati dei sondaggi sovrastimano costantemente i risultati di un partito politico rispetto ai risultati elettorali effettivi. Il bias può essere calcolato per ogni elezione sottraendo il risultato effettivo dalla previsione del sondaggio. Il bias medio del metodo di polling utilizzato può essere calcolato trovando la media dei singoli errori. Se la distorsione è ampia e coerente, la società di polling può provare a scoprire perché il loro metodo è distorto.
La distorsione può provenire da due fonti principali. O la selezione dei partecipanti per il sondaggio è distorta o la distorsione deriva dall'interpretazione delle informazioni ricevute dai partecipanti. Ad esempio, i sondaggi su Internet sono intrinsecamente distorti perché i partecipanti al sondaggio che compilano i moduli Internet non sono rappresentativi dell'intera popolazione. Questo è un errore di selezione.
Le società di sondaggio sono consapevoli di questo errore di selezione e compensano regolando i numeri. Se i risultati sono ancora distorti, si tratta di una distorsione delle informazioni perché le società non hanno interpretato correttamente le informazioni. In tutti questi casi, un calcolo di polarizzazione mostra fino a che punto i valori stimati sono utili e quando i metodi necessitano di aggiustamenti.