Quando si adatta una linea retta a un insieme di dati, si potrebbe essere interessati a determinare quanto bene la linea risultante si adatta ai dati. Un modo per farlo è calcolare l'errore di somma dei quadrati (SSE). Questo valore fornisce una misura di quanto bene la linea di miglior adattamento si avvicini al set di dati. L'SSE è importante per l'analisi dei dati sperimentali ed è determinata solo con pochi brevi passaggi.
Trova una linea di adattamento ottimale per modellare i dati usando la regressione. La linea di miglior adattamento ha la forma y = ax + b, dove a e b sono parametri che è necessario determinare. È possibile trovare questi parametri utilizzando una semplice analisi di regressione lineare. Ad esempio, si supponga che la linea di miglior adattamento abbia la forma y = 0.8x + 7.
Utilizzare l'equazione per determinare il valore di ciascun valore y previsto dalla linea di miglior adattamento. Puoi farlo sostituendo ogni valore x nell'equazione della linea. Ad esempio, se x è uguale a 1, sostituendolo nell'equazione y = 0.8x + 7 fornisce 7.8 per il valore y.
Determina la media dei valori previsti dalla linea di equazione migliore. Puoi farlo sommando tutti i valori y previsti dalle equazioni e dividendo il numero risultante per il numero di valori. Ad esempio, se i valori sono 7.8, 8.6 e 9.4, sommando questi valori si ottiene 25.8 e dividendo questo numero per il numero di valori, 3 in questo caso, fornisce 8.6.
Sottrai ciascun valore individuale da la media e piazza il numero risultante. Nel nostro esempio, se sottraiamo il valore 7.8 dalla media 8.6, il numero risultante è 0.8. La quadratura di questo valore fornisce 0,64.
Somma tutti i valori al quadrato del passaggio 4. Se si applicano le istruzioni nel passaggio 4 a tutti e tre i valori nel nostro esempio, si troveranno valori di 0,64, 0 e 0,64. Sommando questi valori dà 1,28. Questo è l'errore di somma dei quadrati.
Avviso
I numeri dei dati vengono utilizzati solo per determinare l'equazione della linea di miglior adattamento. Utilizzare i valori dalla linea di miglior adattamento quando si calcola l'errore della somma dei quadrati.