Gli esperimenti testano le previsioni. Queste previsioni sono spesso numeriche, il che significa che, mentre gli scienziati raccolgono dati, si aspettano che i numeri si scompongano in un certo modo. I dati del mondo reale raramente corrispondono esattamente alle previsioni degli scienziati, quindi gli scienziati hanno bisogno di un test per dire loro se la differenza tra numeri osservati e attesi è dovuta a casualità, oa causa di qualche fattore imprevisto che costringerà lo scienziato ad aggiustare la teoria sottostante . Un test chi quadrato è uno strumento statistico utilizzato dagli scienziati per questo scopo.
Tipo di dati richiesto
Per utilizzare un test del chi quadrato è necessario disporre di dati categoriali. Un esempio di dati categoriali è il numero di persone che hanno risposto a una domanda "sì" rispetto al numero di persone che hanno risposto alla domanda "no" (due categorie) o il numero di rane in una popolazione che è verde, gialla o grigia ( tre categorie). Non è possibile utilizzare un test del chi quadrato su dati continui, come quelli che potrebbero essere raccolti da un sondaggio per chiedere alle persone quanto sono alti. Da questo sondaggio, otterresti una vasta gamma di altezze. Tuttavia, se divideste le altezze in categorie come "sotto i 6 piedi di altezza" e "6 piedi di altezza e oltre", potreste quindi utilizzare un test del chi quadrato per i dati.
La bontà di Fit Test
Un test di bontà di adattamento è un test comune, e forse il più semplice, eseguito utilizzando la statistica chi-quadrato. In un test di bontà, lo scienziato fa una previsione specifica sui numeri che si aspetta di vedere in ciascuna categoria di dati. Quindi raccoglie dati del mondo reale - chiamati dati osservati - e usa il test del chi-quadro per vedere se i dati osservati corrispondono alle sue aspettative.
Ad esempio, immagina che un biologo stia studiando i modelli di ereditarietà in un specie di rana. Tra i 100 figli di un gruppo di genitori di rane, il modello genetico del biologo la porta ad aspettarsi 25 prole gialla, 50 prole verdi e 25 prole grigi. Ciò che lei effettivamente osserva sono 20 prole gialla, 52 prole verde e 28 prole grigia. La sua previsione è supportata o il suo modello genetico è errato? Può usare un test chi-quadrato per scoprirlo.
Calcolo della statistica chi-quadrato
Iniziare a calcolare la statistica chi-quadrato sottraendo ogni valore atteso dal corrispondente valore osservato e quadrando ciascuna risultato. Il calcolo per l'esempio della progenie della rana sarebbe simile a questo:
giallo = (20 - 25) ^ 2 = 25 verde = (52 - 50) ^ 2 = 4 grigio = (28 - 25) ^ 2 = 9
Ora dividi ogni risultato per il corrispondente valore atteso.
giallo = 25 ÷ 25 = 1 verde = 4 ÷ 50 = 0.08 grigio = 9 ÷ 25 = 0.36
Infine, aggiungi insieme le risposte del passaggio precedente.
chi-square = 1 + 0.08 + 0.36 = 1.44
Interpretazione della statistica chi-quadrato
Il chi -qualità statistica ti dice quanto diversi erano i tuoi valori osservati dai tuoi valori previsti. Maggiore è il numero, maggiore è la differenza. È possibile determinare se il valore del chi-quadrato è troppo alto o troppo basso per supportare la previsione verificando se si trova al di sotto di un determinato valore critico in una tabella di distribuzione chi-quadrato. Questa tabella corrisponde ai valori chi-quadrati con probabilità, chiamati p-values. Nello specifico, la tabella indica la probabilità che le differenze tra i valori osservati e quelli attesi siano semplicemente dovuti a casualità o alla presenza di altri fattori. Per un test di adattamento, se il valore p è 0.05 o inferiore, devi respingere la tua previsione.
Devi determinare i gradi di libertà (df) nei tuoi dati prima di poter cercare il valore critico del chi quadrato in una tabella di distribuzione. I gradi di libertà sono calcolati sottraendo 1 dal numero di categorie nei tuoi dati. Ci sono tre categorie in questo esempio, quindi ci sono 2 gradi di libertà. Un'occhiata a questa tabella di distribuzione chi-square indica che, per 2 gradi di libertà, il valore critico per una probabilità 0.05 è 5.99. Ciò significa che fino a quando il valore calcolato del chi-quadrato è inferiore a 5.99, i valori attesi, e quindi la teoria sottostante, sono validi e supportati. Poiché la statistica del chi-quadrato per i dati sulla progenie della rana era 1,44, il biologo può accettare il suo modello genetico.