Trovare la forza dell'associazione tra due variabili è un'abilità importante per gli scienziati di tutti i tipi. Se due variabili sono correlate tra loro, mostra che esiste un collegamento tra di esse. Una correlazione positiva significa che quando una variabile aumenta, anche l'altra lo fa, e una correlazione negativa significa che quando una variabile aumenta, l'altra diminuisce. Le correlazioni non dimostrano la causalità, sebbene sia possibile che ulteriori test dimostrino una relazione causale tra le variabili. Il coefficiente di correlazione R mostra la forza della relazione tra le due variabili e se si tratta di una correlazione positiva o negativa.
TL; DR (Troppo lungo, non letto)
Chiama una variabile xe una variabile y. Calcola il valore di R usando la formula:
R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2- (Σx) 2] [ ,null,null,3],n Σy 2- (Σy) 2]} dove n è la dimensione del tuo campione. Crea una tabella dei tuoi dati Crea un tavolo dei tuoi dati. Questo dovrebbe includere una colonna per il numero del partecipante, una colonna per la prima variabile (etichettata x) e una colonna per la seconda variabile (etichettata y). Ad esempio, se stai cercando di vedere se esiste una correlazione tra altezza e dimensione della scarpa, una colonna dovrebbe identificare ogni persona che misuri, una colonna mostrerebbe l'altezza di ogni persona e un'altra mostrerebbe la misura della scarpa. Crea tre colonne aggiuntive, una per xy, una per x 2 e una per y 2. Calcola i valori per le colonne vuote Usa i tuoi dati per compilare le tre colonne aggiuntive. Ad esempio, immagina che la tua prima persona misura 75 pollici di altezza e ha una dimensione di 12 piedi. La colonna x (altezza) mostrerebbe 75, e la colonna y (dimensione scarpa) mostrerebbe 12. Hai bisogno di trovare xy, x 2 ey y 2. Quindi, usando questo esempio: xy = 75 × 12 = 900 x 2 = 75 2 = 5,625 y 2 = 12 2 = 144 Completa questi calcoli per ogni persona per cui hai dati. Trova la somma di ogni colonna Crea una nuova riga nella parte inferiore di il tuo tavolo per le somme di ogni colonna. Aggiungi insieme tutti i valori x, tutti i valori y, tutti i valori xy, tutti i valori x 2 e tutti i valori y 2, quindi inserisci i risultati nella parte inferiore del colonna corrispondente nella tua nuova riga. Puoi etichettare la tua nuova "somma" di righe o usare un simbolo sigma (Σ). Calcola R utilizzando la formula Trova R dai tuoi dati usando la formula: R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx 2- (Σx) 2] [nΣy 2- (Σy) 2]} Sembra un po 'scoraggiante, quindi puoi dividerlo in due parti, che chiameremo s e t. s = n (Σxy) - (Σx) (Σy) t = √ {[n Σx 2- (Σx) 2] [n Σy 2- (Σy) 2]} In questi equazioni, n è il numero di partecipanti che hai (la tua dimensione del campione). Il resto delle parti dell'equazione sono le somme calcolate nell'ultimo passaggio. Quindi per s, moltiplicare la dimensione del campione per la somma della colonna xy e quindi sottrarre la somma della colonna x moltiplicata per la somma della colonna y da questo. Per t, ci sono quattro passi principali. Innanzitutto, calcola n moltiplicato per la somma della tua colonna x 2, quindi sottrai la somma della tua x colonna al quadrato (moltiplicata per se stessa) da questo valore. In secondo luogo, fare esattamente la stessa cosa ma con la somma della colonna y 2 e la somma della colonna y al quadrato al posto delle parti x (cioè, n × Σy 2 - [Σy × Σy]) . Terzo, moltiplica questi due risultati (per xs e ys) insieme. Quarto, prendi la radice quadrata di questa risposta. Se hai lavorato in parti, puoi calcolare R come semplicemente R = s ÷ t. Otterrete una risposta tra -1 e 1. Una risposta positiva mostra una correlazione positiva, con qualcosa di più di 0,7 generalmente considerato una relazione forte. Una risposta negativa mostra una correlazione negativa, con qualsiasi valore superiore a -0,7 considerato una forte relazione negativa. Allo stesso modo ± 0,5 è considerata una relazione moderata e ± 0,3 è considerata una relazione debole. Qualche cosa vicino a 0 mostra una mancanza di correlazione.