Quando scienziati, economisti o statistici effettuano previsioni basate sulla teoria e quindi raccolgono dati reali, hanno bisogno di un modo per misurare la variazione tra valori previsti e misurati. Solitamente si basano sull'errore quadratico medio (MSE), che è la somma delle variazioni dei singoli punti di dati quadrati e diviso per il numero di punti dati meno 2. Quando i dati vengono visualizzati su un grafico, si determina l'MSE di sommando le variazioni nei punti di dati dell'asse verticale. Su un grafico x-y, sarebbero i valori y.
Perché quadrare le variazioni?
Moltiplicando la variazione tra i valori previsti e osservati ha due effetti desiderabili. Il primo è garantire che tutti i valori siano positivi. Se uno o più valori erano negativi, la somma di tutti i valori potrebbe essere irrealisticamente piccola e una scarsa rappresentazione della variazione effettiva tra valori previsti e osservati. Il secondo vantaggio della quadratura è quello di dare più peso alle differenze più grandi, il che garantisce che un grande valore per MSE significhi grandi variazioni di dati.
Esempio di algoritmo di calcolo Stock
Supponiamo che tu abbia un algoritmo che predice i prezzi di un determinato titolo su base giornaliera. Il lunedì prevede che il prezzo delle azioni sarà di $ 5,50, il martedì sarà di $ 6,00, mercoledì $ 6,00, giovedì $ 7,50 e venerdì $ 8,00. Considerando lunedì come Giorno 1, hai una serie di punti dati che appaiono così: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) e (5, 8.00). I prezzi effettivi sono i seguenti: lunedì $ 4,75 (1, 4,75); Martedì $ 5,35 (2, 5,35); Mercoledì $ 6,25 (3, 6,25); Giovedì $ 7,25 (4, 7,25); e venerdì: $ 8,50 (5, 8,50).
Le variazioni tra i valori y di questi punti sono rispettivamente 0,75, 0,65, -0,25, 0,25 e -0,50, dove il segno negativo indica un valore previsto inferiore a quello osservato. Per calcolare l'MSE, per prima cosa si quadrano i valori di variazione, eliminando i segni meno e le rese 0,5625, 0,4225, 0,0625, 0,0625 e 0,25. Sommando questi valori si ottiene 1,36 e dividendo per il numero di misurazioni meno 2, che è 3, produce l'MSE, che risulta essere 0,45.
MSE e RMSE
I valori più piccoli per MSE indicano un accordo più stretto tra i risultati previsti e quelli osservati e un MSE di 0,0 indica un accordo perfetto. È importante ricordare, tuttavia, che i valori di variazione sono al quadrato. Quando è richiesta una misurazione dell'errore che si trova nella stessa unità dei punti dati, gli statistici eseguono l'errore quadratico medio (RMSE). Otterranno ciò prendendo la radice quadrata dell'errore quadratico medio. Per l'esempio sopra, l'RSME sarebbe 0,671 o circa 67 centesimi.