Uno degli strumenti più basilari per l'ingegneria o l'analisi scientifica è la regressione lineare. Questa tecnica inizia con un set di dati in due variabili. La variabile indipendente è solitamente chiamata "x" e la variabile dipendente è solitamente chiamata "y". L'obiettivo della tecnica è identificare la linea, y = mx + b, che si avvicina al set di dati. Questa linea di tendenza può mostrare, graficamente e numericamente, le relazioni tra le variabili dipendenti e indipendenti. Da questa analisi di regressione viene anche calcolato un valore per la correlazione.
Identifica e separa i valori xey dei tuoi punti dati. Se stai utilizzando un foglio di calcolo, inseriscile in colonne adiacenti. Ci dovrebbe essere lo stesso numero di valori xey. In caso contrario, il calcolo sarà impreciso o la funzione foglio di calcolo restituirà un errore. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
Calcola il valore medio per i valori x e y valori dividendo la somma di tutti i valori per il numero totale di valori nel set. Queste medie saranno chiamate "x_avg" e y_avg. "X_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) /7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) /7 = 5
Crea due nuovi set di dati sottraendo il valore x_avg da ciascun valore x e il valore y_avg da ciascun valore y. x1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6 ...) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5, ... ) y1 = (-3, -2, 4, -4, 3, 2, 0)
Moltiplicare ciascun valore x1 per ciascun valore y1, nell'ordine. x1y1 = (0 * -3, -1 * -2, 5 * 4, ...) x1y1 = (0, 2, 20, -4, -3, -4, 0)
Piazza ogni valore x1 x1 ^ 2 = (0 ^ 2 , 1 ^ 2, -5 ^ 2, ...) x1 ^ 2 = (0, 1, 25, 1, 1, 4, 4)
Calcola le somme dei valori x1y1 e x1 ^ 2 valori. sum_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 sum_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
Dividi "sum_x1y1" di " sum_x1 ^ 2 "per ottenere il coefficiente di regressione sum_x1y1 /sum_x1 ^ 2 = 11/36 = 0.306
TL; DR (Troppo lungo, non letto)
Per coloro che preferiscono lavorare direttamente con l'equazione, i t è m = sum [(x_i - x_avg) (y_i - y_avg)] /sum [(x_i - x_avg) ^ 2].
Molti fogli di calcolo avranno una varietà di funzioni di regressione lineare. In Microsoft Excel, è possibile utilizzare la funzione "Pendenza" per prendere la media delle colonne xey e il foglio di calcolo eseguirà automaticamente tutti i calcoli rimanenti.