La correlazione tra due variabili descrive la probabilità che un cambiamento in una variabile causi una variazione proporzionale nell'altra variabile. Un'alta correlazione tra due variabili suggerisce che condividono una causa comune o un cambiamento in una delle variabili è direttamente responsabile di una modifica nell'altra variabile. Il valore r di Pearson è usato per quantificare la correlazione tra due variabili discrete.
Etichettare la variabile che si ritiene stia causando la modifica all'altra variabile come x (la variabile indipendente) e l'altra variabile y (la variabile dipendente ).
Costruisci una tabella con cinque colonne e tante righe quanti sono i punti dati per x e y. Etichettare le colonne da A a E da sinistra a destra.
Riempi ciascuna riga con i seguenti valori per ciascun punto di dati (x, y) nella prima colonna - il valore di x nella colonna A, il valore di x al quadrato nella colonna B, il valore di y nella colonna C, il valore di y al quadrato nella colonna D e il valore x volte y nella colonna E.
Fai una riga finale nella parte inferiore della tabella e metti la somma di tutti i valori di ogni colonna nella sua cella corrispondente.
Calcola il prodotto delle celle finali nella colonna A e C.
Moltiplica la cella finale nella colonna E dal numero di punti dati.
Sottrai il valore ottenuto nel passaggio 5 dal valore ottenuto nel passaggio 6 e sottolinea la risposta.
Moltiplica la cella finale della colonna B per il numero di punti dati. Sottrai da questo valore il quadrato del valore della cella finale della colonna A.
Moltiplica la cella finale della colonna D per il numero di punti dati e sottrai il quadrato del valore della cella finale della colonna C .
Moltiplica i valori trovati nei passaggi 8 e 9 e poi prendi la radice quadrata del risultato.
Dividi il valore ottenuto nel passaggio 7 (dovrebbe essere sottolineato) dal valore ottenuto nel passaggio 10. Questa è la r di Pearson, nota anche come coefficiente di correlazione. Se r è vicino a 1, c'è una forte correlazione positiva. Se r è vicino a -1, c'è una forte correlazione negativa. Se r è vicino a 0, c'è una correlazione debole.