La linea di regressione dei minimi quadrati (LSRL) è una linea che funge da funzione di predizione per un fenomeno che non è ben noto. La definizione statistica matematica di una linea di regressione dei minimi quadrati è la linea che passa attraverso il punto (0,0) e ha una pendenza pari al coefficiente di correlazione dei dati, dopo che i dati sono stati standardizzati. Pertanto, il calcolo della linea di regressione dei minimi quadrati comporta la standardizzazione dei dati e la ricerca del coefficiente di correlazione.
Trova il coefficiente di correlazione
Disporre i dati in modo che sia facile lavorarci. Usa un foglio di calcolo o una matrice per separare i tuoi dati nei valori x e y, mantenendoli collegati (ovvero assicurati che il valore x e il valore y di ogni punto di dati si trovino nella stessa riga o colonna).
Trova i prodotti incrociati dei valori x e dei valori y. Moltiplicare il valore x e il valore y per ogni punto insieme. Sommare questi valori risultanti. Chiama il risultato "sxy."
Somma i valori xe i valori y separatamente. Chiama rispettivamente questi due valori risultanti "sx" e "sy".
Conta il numero di punti dati. Chiama questo valore "n."
Prendi la somma dei quadrati per i tuoi dati. Piazza tutti i tuoi valori. Moltiplicare ogni valore x e ogni valore y da solo. Chiama i nuovi insiemi di dati "x2" e "y2" per i valori xe i valori y. Somma tutti i valori x2 e chiama il risultato "sx2". Somma tutti i valori y2 e chiama il risultato "sy2".
Sottrai sx * sy /n da sxy. Chiama il risultato "num."
Calcola il valore sx2- (sx ^ 2) /n. Chiama il risultato "A."
Calcola il valore sy2- (sy ^ 2) /n. Chiama il risultato "B."
Prendi la radice quadrata di A volte B, che può essere mostrata come (A * B) ^ (1/2). Etichetta il risultato "denom".
Calcola il coefficiente di correlazione, "r". Il valore di "r" è uguale a "num" diviso per "denom", che può essere scritto come num /denom.
Standardizza i dati e scrivi l'LSRL
Trova i mezzi dei valori x e dei valori y. Aggiungi tutti i valori x insieme e dividi il risultato per "n". Chiama questo "mx". Fai lo stesso per i valori y, chiamando il risultato "mio".
Trova le deviazioni standard per i valori x e i valori y. Crea nuovi insiemi di dati per le x e le y sottraendo la media per ciascun set di dati dai dati associati. Ad esempio, ogni punto dati per x, "xdat" diventerà "xdat - mx." Piazza i punti dati risultanti. Aggiungere i risultati per ciascun gruppo (xey) separatamente, dividendo per "n" per ciascun gruppo. Prendi la radice quadrata di questi due risultati finali per ottenere la deviazione standard per ciascun gruppo. Chiama la deviazione standard per i valori x "sdx" e quello per i valori y "sdy."
Standardizza i dati. Sottrai la media per i valori x da ogni valore x. Dividere i risultati per "sdx". I dati rimanenti sono standardizzati. Chiama questi dati "x_". Fai lo stesso per i valori y: sottrai "my" da ogni valore y, dividendo per "sdy" mentre vai avanti. Chiama questi dati "y_".
Scrivi la linea di regressione. Scrivi "y_ ^ = rx_", dove "^" è rappresentativo di "hat" - un valore previsto - e "r" è uguale al coefficiente di correlazione trovato in precedenza.