L'intervallo interquartile, spesso abbreviato come IQR, rappresenta l'intervallo tra il 25 ° percentile e il 75 ° percentile, o il 50% medio, di un dato insieme di dati. L'intervallo interquartile può essere utilizzato per determinare quale sarebbe l'intervallo medio di prestazioni in un test: puoi utilizzarlo per vedere dove cadono i punteggi della maggior parte delle persone su un determinato test o determinare quanti soldi l'impiegato medio di un'azienda fa ogni mese . L'intervallo interquartile può essere uno strumento più efficace di analisi dei dati rispetto alla media o mediana di un set di dati, perché consente di identificare l'intervallo di dispersione piuttosto che un solo numero.
TL; DR (Too Long ; Did not Read)
L'intervallo interquartile (IQR) rappresenta il 50% medio di un set di dati. Per calcolarlo, ordina prima i tuoi punti dati dal meno al più grande, poi determina le posizioni del primo e del terzo quartile usando le formule (N + 1) /4 e 3 * (N + 1) /4 rispettivamente, dove N è il numero di punti nel set di dati. Infine, sottrai il primo quartile dal terzo quartile per determinare l'intervallo interquartile per il set di dati.
Ordina punti dati
Il calcolo dell'intervallo interquartile è un compito semplice, ma prima di calcolare dovrai organizzare i vari punti del set di dati. Per fare ciò, inizia ordinando i tuoi punti dati dal meno al più grande. Ad esempio, se i tuoi punti dati erano 10, 19, 8, 4, 9, 12, 15, 11 e 20, dovresti riorganizzarli in questo modo: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Una volta che i tuoi punti dati sono stati ordinati in questo modo, puoi passare al passaggio successivo.
Determina la prima posizione del quartile
Successivamente, determina la posizione del primo quartile usando la seguente formula: (N + 1 ) /4, dove N è il numero di punti nel set di dati. Se il primo quartile si trova tra due numeri, prendi la media dei due numeri come primo punteggio quartile. Nell'esempio sopra, dato che ci sono nove punti dati, devi aggiungere da 1 a 9 per ottenere 10, quindi dividere per 4 per ottenere 2,5. Dal momento che il primo quartile cade tra il secondo e il terzo valore, si otterrebbe la media di 8 e 9 per ottenere una posizione di primo quartile di 8.5.
Video di Sciencing Video Vault Crea la parentesi (quasi) perfetta: Ecco come
Crea la parentesi (quasi) perfetta: ecco come determinare la terza posizione del quartile
Dopo aver determinato il tuo primo quartile, determina la posizione del terzo quartile usando la seguente formula: 3 * ( N + 1) /4 dove N è nuovamente il numero di punti nel set di dati. Allo stesso modo, se il terzo quartile cade tra due numeri, prendi semplicemente la media come faresti quando calcoli il primo punteggio quartile. Nell'esempio sopra, poiché ci sono nove punti dati, devi aggiungere da 1 a 9 per ottenere 10, moltiplicare per 3 per ottenere 30 e quindi dividere per 4 per ottenere 7.5. Poiché il primo quartile cade tra il settimo e l'ottavo valore, prendi la media di 15 e 19 per ottenere un terzo punteggio quartile di 17.
Calcola intervallo interquartile
Dopo aver determinato il tuo primo e terzo quartile, calcolare l'intervallo interquartile sottraendo il valore del primo quartile dal valore del terzo quartile. Per finire l'esempio usato nel corso di questo articolo, sottrai 8,5 da 17 per trovare che l'intervallo interquartile del set di dati è uguale a 8.5.
Vantaggi e svantaggi di IQR
L'intervallo interquartile ha un vantaggio di essere in grado di identificare ed eliminare i valori anomali su entrambe le estremità di un set di dati. Anche IQR è una buona misura di variazione nei casi di distribuzione di dati distorta e questo metodo di calcolo di IQR può funzionare per insiemi di dati raggruppati, purché si utilizzi una distribuzione di frequenza cumulativa per organizzare i punti di dati. La formula dell'intervallo interquartile per i dati raggruppati è la stessa dei dati non raggruppati, con IQR uguale al valore del primo quartile sottratto dal valore del terzo quartile. Tuttavia, presenta diversi svantaggi rispetto alla deviazione standard: minore sensibilità ad alcuni punteggi estremi e stabilità di campionamento che non è forte come la deviazione standard.