Un grafico a dispersione è uno strumento diagnostico importante nell'arsenale di un statistica, ottenuto mediante la rappresentazione grafica di due variabili l'una contro l'altra. Permette allo statistico di guardare le variabili e formare un'ipotesi di lavoro sulla loro relazione. Per questo motivo, viene solitamente disegnato prima che venga eseguita un'analisi di regressione. Lo statistico verifica successivamente l'ipotesi utilizzando un'analisi di regressione e determina il segno e l'entità precisa della relazione. Inoltre, un grafico a dispersione aiuta a identificare i valori anomali - valori che sono anormalmente distanti dalla maggior parte dei dati nel campione. Eliminare i valori anomali aiuta a migliorare il modello di regressione.
Verifica la relazione negativa tra le due variabili nel grafico a dispersione. Se i valori bassi della prima variabile corrispondono ai valori alti della seconda variabile, esiste una correlazione negativa. In questo caso, una linea tracciata attraverso i punti dati ha una pendenza negativa.
Esaminare il grafico a dispersione per la relazione positiva tra le variabili. Se i valori bassi della prima variabile nel grafico a dispersione corrispondono a valori bassi del secondo, e i valori alti del primo corrispondono in modo simile ai valori alti del secondo, le variabili hanno una correlazione positiva. In questo caso, una linea tracciata attraverso i punti dati ha una pendenza positiva.
Ispeziona il grafico a dispersione per nessuna relazione tra le variabili. Se i punti di dati nel grafico a dispersione sono distribuiti casualmente senza alcuna relazione apparente tra i due, non hanno né correlazione, né piccola correlazione statisticamente insignificante. In questo caso, una linea tracciata attraverso i punti dati è orizzontale con pendenza uguale a zero.
Adatta una linea attraverso i punti dati ed esamina la sua forma per misurare la natura della relazione tra le due variabili. Una linea retta viene interpretata come una relazione lineare, una forma curva suggerisce una relazione quadratica e una linea che si trova relativamente piatta prima che improvvisamente lo scatto su o giù viene interpretato come una relazione esponenziale.
Esaminare il grafico a dispersione per valori anomali , valori che si trovano anormalmente lontani dal cluster di punti dati. I valori anomali distorcono la relazione tra le variabili. Eliminali, ma solo se la loro assenza non influenza l'analisi della relazione tra le due variabili.