Interquartile è un termine usato nelle statistiche. In particolare, l'intervallo interquartile è una misura della diffusione di una distribuzione. Una distribuzione è una registrazione dei valori di alcune variabili. Ad esempio, se trovassimo i redditi di 100 persone, questa sarebbe la distribuzione del reddito nel nostro campione. Un'altra misura comune di diffusione è la deviazione standard.
Intervallo interquartile
I quartili di una distribuzione sono i tre punti che lo dividono in quattro parti ugualmente numerose. Il primo quartile è il punto in cui 1/4 dei valori è inferiore e 3/4 sono più alti; il secondo quartile, meglio noto come mediana, divide la distribuzione in parti uguali; il terzo quartile è esattamente l'opposto del primo.
L'intervallo interquartile è l'intervallo tra il primo e il terzo quartile. A volte viene scritto come due numeri con un trattino tra di essi, e talvolta come differenza tra questi numeri.
Esempio
Se raccogli dati sul reddito su 12 persone e i risultati sono $ 10.000, $ 12.000, $ 13.000, $ 14.000, $ 15.000, $ 21.000, $ 22.000, $ 25.000, $ 30.000, $ 35.000, $ 40.000 e $ 120.000 allora i quartili dovrebbero dividere i risultati in quattro gruppi di tre. Il primo quartile si trova a metà tra $ 13.000 e $ 14.000 (ovvero $ 13.500) e il terzo quartile è a metà tra $ 30.000 e $ 35.000 (ovvero $ 32.500), quindi l'intervallo interquartile è $ 13.500 - $ 32.500.
Utilizzo
L'intervallo interquartile è una buona misura della diffusione di una distribuzione che è distorta; cioè, uno che ha una lunga coda a destra oa sinistra. Le distribuzioni di reddito hanno spesso una lunga coda a destra, perché ci sono poche persone che fanno una grande quantità di denaro. Se la mediana (piuttosto che la media) è usata per una misura di tendenza centrale, l'intervallo interquartile (piuttosto che la deviazione standard) dovrebbe probabilmente essere usato come misura di diffusione.
Alternative
Le alternative all'intervallo interquartile includono la deviazione assoluta mediana e l'intera gamma. Puoi trovare il primo prendendo la differenza tra ogni valore e la media, prendendo i valori assoluti di quelle differenze e poi trovandone la mediana. Quest'ultimo è semplicemente l'intervallo dal valore più basso al più alto.