La regressione lineare è un processo in matematica statistica. Fornisce una misura numerica della forza di una relazione tra variabili, una delle quali, si presume che la variabile indipendente abbia un'associazione con l'altra, la variabile dipendente. Si noti che questa relazione non si presume essere uno di causa ed effetto - sebbene possa essere - ma semplicemente uno di correlazione.
Un esempio
Di avere un elenco di corridori su un team di atleti, con i loro registri di allenamento individuali e tempi di esecuzione 5K. Puoi supporre che il numero di miglia che corrono in allenamento, M, influenza la loro prestazione di 5K, T. Con M come variabile indipendente e T come variabile dipendente, puoi tracciare un grafico di T vs. M e usare questo grafico come una stima visiva sul fatto che esista una relazione.
La linea di regressione
Come ogni linea retta, una linea di regressione assume la forma y = ax + b, in cui y è la variabile dipendente , a è la pendenza della linea, x è la variabile indipendente e b è il punto sull'asse y in cui la linea lo attraversa.