Molti programmi universitari richiedono statistiche. Un concetto chiave presentato in una tipica classe statistica è la normale distribuzione dei dati o una curva a campana. Capire come interpretare un insieme di dati che rientra in una distribuzione naturale rende possibile la comprensione degli studi scientifici. Ottenere una buona comprensione della curva a campana, la media, le deviazioni standard e la loro relazione con i percentili per diventare conversanti nel linguaggio della ricerca scientifica.
Distribuzione normale e curva a campana
Quando molti tipi di dati naturali come altezza, quozienti di intelligenza e pressione sanguigna sono tracciati su un istogramma, dove i punteggi sono sull'asse orizzontale e le occorrenze o il numero di punteggi sono sull'asse verticale, i dati cadono in uno schema a campana chiamato una curva a campana. Questo schema, noto come distribuzione normale, si presta all'analisi statistica.
Media e mediana
La media media di tutti i punteggi diminuirà al centro della curva a campana. La media rappresenta il 50 ° percentile, dove la metà di tutti i punteggi sono sopra quella misura, e la metà sono sotto. Nei dati normalmente distribuiti, anche il punteggio mediano cadrà al centro della curva a campana, rappresentando la maggior parte delle occorrenze.
Deviazioni standard e varianza
Quanto lontano dalla media è una misura? In insiemi di dati normalmente distribuiti, una misura può essere descritta come un certo numero di deviazioni standard lontano dalla media. Una deviazione standard è una misura della varianza, o quanto dispersa o distribuita, i dati sono dalla media. Se le misure hanno molta varianza, la curva a campana viene distribuita; se hanno poca varianza, la curva a campana è stretta. Maggiore è la deviazione standard del punteggio, minore è la probabilità che il punteggio si verifichi in natura.
Percentili e regola empirica
Quando si osserva una curva a campana, il 68% delle misure si trova entro una deviazione standard della media. Il 95% della distribuzione si trova entro due deviazioni standard della media. Un enorme 99,7% delle misure rientra in tre deviazioni standard di esso. Queste percentuali, definite regole empiriche, sono il fondamento dell'analisi statistica dei fenomeni naturali. Se un ricercatore medico, ad esempio, scopre che un gruppo che ha assunto un determinato farmaco per controllare il colesterolo ha ora misurazioni del colesterolo di due deviazioni standard dalla media, è improbabile che si verifichi per caso.