Un'equazione di regressione lineare modella la linea generale dei dati per mostrare la relazione tra le variabili x e y. Molti punti dei dati effettivi non saranno sulla linea. I valori anomali sono punti molto lontani dai dati generali e vengono tipicamente ignorati quando si calcola l'equazione di regressione lineare. È possibile trovare l'equazione di regressione lineare disegnando una linea più adatta e quindi calcolando l'equazione per quella linea.
Traccia i punti. Disegna un grafico dei punti nel set specificato.
Disegna una linea che meglio si adatta ai dati. Guarda i dati e decidi se è crescente o decrescente, quindi posiziona una linea più vicina al maggior numero di punti. Ad esempio, dati i punti {(2,3) (5,7) (1,2) (4,8)}, l'equazione di regressione lineare sarà ascendente, o in altre parole, i punti saliranno generalmente da da sinistra a destra sul grafico.
Calcola l'equazione della linea. Scegli due punti sulla linea per calcolare la pendenza e osserva l'intercetta y. Sulla linea più adatta per i punti {(2,3) (5,7) (1,2) (4,8)}, un punto è (0,5,1.25) e un altro è l'intercetta y (0, 0.5). Usa la formula per la pendenza di una linea, m = (y2 - y1) /(x2 - x1), per trovare la pendenza. Collegando i valori in punti, m = (0.5 - 1.25) /(0 - 0.5) = 1.5. Quindi con l'intercetta y e la pendenza, l'equazione di regressione lineare può essere scritta come y = 1.5x + 0.5.