Di Karen G Blaettler | Aggiornato il 30 agosto 2022
Padroneggia le statistiche principali che ti consentono di riepilogare e confrontare i set di dati in tutta sicurezza. Questa guida ti guida attraverso le formule, i calcoli e l'interpretazione di media, mediana, moda, intervallo e deviazione standard.
La media è la media aritmetica di un insieme di dati. Riflette la tendenza centrale dei valori.
Media =Σx / n
Insieme di dati:20, 24, 25, 36, 25, 22, 23
Somma:20+24+25+36+25+22+23 =175
Numero di valori (n):7
Media:175 ÷ 7 =25
La mediana è il valore medio quando i dati sono ordinati dal più basso al più alto. È resistente ai valori anomali.
Set ordinato:20, 22, 23, 24, 25, 25, 36
Con 7 valori, la mediana è il 4° valore:24.
Per un numero pari di valori, media i due numeri centrali. Esempio:22, 23, 25, 26 → (23+25)/2 =24.
La modalità è il valore o i valori che appaiono più frequentemente. Un set di dati può essere unimodale, multimodale o non avere modalità.
Nell'esempio, 25 appare due volte mentre tutti gli altri appaiono una volta. Modalità =25.
Altri scenari:
L'intervallo misura la diffusione sottraendo il valore più piccolo dal più grande.
Minimo:20, massimo:36
Intervallo =36 – 20 =16
Un intervallo ampio spesso segnala un valore anomalo; in questo set spicca il 36.
La deviazione standard quantifica quanto i valori si discostano dalla media. Valori più piccoli indicano un clustering più ristretto.
SD =√(Σ(xᵢ – μ)² / (n – 1))
I valori entro ±1 DS della media (20–30) sono tipici. I valori oltre ±2 DS (≈10–40) sono estremi; 36 supera due SD, contrassegnandolo come valore anomalo.
Padroneggiando queste misure, puoi descrivere, confrontare e interpretare i set di dati con autorità e precisione.