L'intervallo interquartile, spesso abbreviato come IQR, rappresenta l'intervallo dal 25 ° percentile al 75 ° percentile, o il 50% medio, di ogni dato set di dati. L'intervallo interquartile può essere utilizzato per determinare quale sarebbe l'intervallo medio di prestazioni in un test: è possibile utilizzarlo per vedere dove cadono i punteggi della maggior parte delle persone in un determinato test o determinare quanti soldi guadagna il dipendente medio in un'azienda ogni mese . L'intervallo interquartile può essere uno strumento di analisi dei dati più efficace rispetto alla media o alla mediana di un set di dati, poiché consente di identificare l'intervallo di dispersione anziché un solo numero.
TL; DR (Too Long ; Non letto)
L'intervallo interquartile (IQR) rappresenta il 50 percento medio di un set di dati. Per calcolarlo, prima ordina i tuoi punti dati dal meno al più grande, quindi determina le posizioni del tuo primo e terzo quartile usando le formule (N + 1) /4 e 3 * (N + 1) /4, rispettivamente, dove N è il numero di punti nel set di dati. Infine, sottrai il primo quartile dal terzo quartile per determinare l'intervallo interquartile per il set di dati.
Punti dati ordine
Il calcolo dell'intervallo interquartile è un compito semplice, ma prima di calcolare dovrai disporre i vari punti del tuo set di dati. Per fare ciò, inizia ordinando i punti dati dal minimo al massimo. Ad esempio, se i tuoi punti dati fossero 10, 19, 8, 4, 9, 12, 15, 11 e 20, li riorganizzeresti in questo modo: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Dopo che i punti dati sono stati ordinati in questo modo, è possibile passare al passaggio successivo.
Determinare la posizione del primo quartile
Successivamente, determinare la posizione del primo quartile utilizzando la seguente formula: (N + 1 ) /4, dove N è il numero di punti nel set di dati. Se il primo quartile è compreso tra due numeri, prendi la media dei due numeri come punteggio del primo quartile. Nell'esempio sopra, poiché ci sono nove punti dati, aggiungere 1 a 9 per ottenere 10, quindi dividere per 4 per ottenere 2,5. Poiché il primo quartile rientra tra il secondo e il terzo valore, dovresti prendere la media di 8 e 9 per ottenere una posizione del primo quartile di 8,5.
Determina la terza posizione del quartile
Dopo aver determinato il tuo primo quartile, determinare la posizione del terzo quartile usando la seguente formula: 3 * (N + 1) /4 dove N è di nuovo il numero di punti nel set di dati. Allo stesso modo, se il terzo quartile cade tra due numeri, prendi semplicemente la media come faresti quando calcoli il punteggio del primo quartile. Nell'esempio sopra, dato che ci sono nove punti dati, dovresti aggiungere da 1 a 9 per ottenere 10, moltiplicare per 3 per ottenere 30 e quindi dividere per 4 per ottenere 7.5. Poiché il primo quartile è compreso tra il settimo e l'ottavo valore, dovresti prendere la media di 15 e 19 per ottenere un punteggio del terzo quartile di 17.
Calcola intervallo interquartile
Dopo aver determinato il tuo primo e terzo quartile, calcola l'intervallo interquartile sottraendo il valore del primo quartile dal valore del terzo quartile. Per finire l'esempio usato nel corso di questo articolo, sottrarre 8,5 da 17 per scoprire che l'intervallo interquartile del set di dati è uguale a 8.5.
Vantaggi e svantaggi di IQR
L'intervallo interquartile ha un vantaggio di essere in grado di identificare ed eliminare i valori anomali su entrambe le estremità di un set di dati. L'IQR è anche una buona misura della variazione nei casi di distribuzione dei dati distorta e questo metodo di calcolo dell'IQR può funzionare per set di dati raggruppati, purché si utilizzi una distribuzione di frequenza cumulativa per organizzare i punti di dati. La formula dell'intervallo interquartile per i dati raggruppati è la stessa dei dati non raggruppati, con IQR uguale al valore del primo quartile sottratto dal valore del terzo quartile. Tuttavia, presenta diversi svantaggi rispetto alla deviazione standard: minore sensibilità a pochi punteggi estremi e stabilità di campionamento non forte come la deviazione standard.