Quando scienziati, economisti o statistici fanno previsioni basate sulla teoria e poi raccolgono dati reali, hanno bisogno di un modo per misurare la variazione tra valori previsti e misurati. Di solito si basano sull'errore quadratico medio (MSE), che è la somma delle variazioni dei singoli punti dati al quadrato e divisa per il numero di punti dati meno 2. Quando i dati vengono visualizzati su un grafico, si determina l'MSE per sommando le variazioni nei punti dati dell'asse verticale. Su un grafico x-y, questi sarebbero i valori y.
Perché quadrare le variazioni?
Moltiplicare la variazione tra i valori previsti e quelli osservati ha due effetti desiderabili. Il primo è garantire che tutti i valori siano positivi. Se uno o più valori fossero negativi, la somma di tutti i valori potrebbe essere irrealisticamente piccola e una scarsa rappresentazione della variazione effettiva tra i valori previsti e quelli osservati. Il secondo vantaggio della quadratura è di dare più peso alle differenze maggiori, il che garantisce che un valore elevato per MSE significhi grandi variazioni di dati.
Calcolo del campione Algoritmo di magazzino
Supponiamo di avere un algoritmo che prevede i prezzi di uno stock particolare su base giornaliera. Lunedi prevede che il prezzo delle azioni sarà $ 5,50, martedì a $ 6,00, mercoledì $ 6,00, giovedì $ 7,50 e venerdì $ 8,00. Considerando lunedì come Giorno 1, hai una serie di punti dati che appaiono in questo modo: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) e (5, 8.00). I prezzi effettivi sono i seguenti: lunedì $ 4,75 (1, 4,75); Martedì $ 5,35 (2, 5,35); Mercoledì $ 6,25 (3, 6,25); Giovedi $ 7,25 (4, 7,25); e venerdì: $ 8,50 (5, 8,50).
Le variazioni tra i valori y di questi punti sono rispettivamente 0,75, 0,65, -0,25, 0,25 e -0,50, dove il segno negativo indica un valore previsto inferiore a quello osservato. Per calcolare MSE, devi prima quadrare ogni valore di variazione, che elimina i segni meno e produce 0,5625, 0,4225, 0,0625, 0,0625 e 0,25. Sommando questi valori si ottiene 1,36 e dividendo per il numero di misurazioni meno 2, che è 3, si ottiene l'MSE, che risulta essere 0,45.
MSE e RMSE
Valori più piccoli per MSE indicano un accordo più stretto tra risultati previsti e osservati e un MSE di 0,0 indica un accordo perfetto. È importante ricordare, tuttavia, che i valori di variazione sono al quadrato. Quando è richiesta una misurazione dell'errore che si trova nelle stesse unità dei punti dati, gli statistici rilevano l'errore quadratico medio radice (RMSE). Lo ottengono prendendo la radice quadrata dell'errore quadrato medio. Per l'esempio sopra, RSME sarebbe 0,671 o circa 67 centesimi.