Di Ariel Balter, Ph.D. Aggiornato il 30 agosto 2022
DragonImages/iStock/Getty Images
Nell'analisi di regressione, designiamo una variabile come variabile esplicativa (x) e l'altra come variabile di risposta (y). Il modello di regressione produce una funzione y =f(x) che meglio prevede y da x. Per ogni osservazione i, il residuo è la differenza tra la risposta osservata y[i] e il suo valore previsto f(x[i]):
Residuo =y[i] – f(x[i])
Consideriamo cinque individui con le seguenti coppie di altezza (cm) e peso (kg):(152, 54), (165, 65), (175, 100), (170, 80) e (140, 45). Un adattamento quadratico del peso in funzione dell'altezza produce l'equazione:
w =f(h) =1160 – 15,5h + 0,054h²
Utilizzando questo modello, i residui (in chilogrammi) sono [2,38, 7,65, 1,25, 5,60, 3,40]. La somma dei residui è 15,5 kg.
Il modello di regressione più semplice è lineare, rappresentato da y =m x + b. Per costruzione, la somma dei residui per una regressione lineare è zero, perché la linea è adattata per ridurre al minimo la deviazione verticale totale.