Le tabelle di frequenza possono essere utili per descrivere il numero di occorrenze di un particolare tipo di dato all'interno di un set di dati. Le tabelle di frequenza, chiamate anche distribuzioni di frequenza, sono uno degli strumenti più basilari per la visualizzazione di statistiche descrittive. Le tabelle di frequenza sono ampiamente utilizzate come riferimento a colpo d'occhio nella distribuzione dei dati; sono facili da interpretare e possono visualizzare grandi set di dati in modo abbastanza conciso. Le tabelle di frequenza possono aiutare a identificare tendenze evidenti all'interno di un set di dati e possono essere utilizzate per confrontare i dati tra insiemi di dati dello stesso tipo. Le tabelle di frequenza non sono appropriate per ogni applicazione, tuttavia. Possono oscurare valori estremi (più di X o meno di Y) e non si prestano all'analisi dell'incoide e della curtosi dei dati.
Visualizzazione rapida dei dati
Le tabelle di frequenza possono rivelare rapidamente valori anomali e anche tendenze significative all'interno di un set di dati con non molto più di un'ispezione superficiale. Ad esempio, un insegnante potrebbe visualizzare i voti degli studenti per un periodo intermedio su una tabella di frequenza al fine di dare una rapida occhiata a come la sua classe sta facendo complessivamente. Il numero nella colonna della frequenza rappresenterebbe il numero di studenti che ricevono quel grado; per una classe di 25 studenti, la distribuzione in frequenza dei voti delle lettere ricevuti potrebbe essere simile a questa: Grado Frequenza A .............. 7 B ........... ..13 C .............. 3 D .............. 2
Visualizzazione dell'abbondanza relativa
Le tabelle di frequenza possono aiutare i ricercatori a esaminare l'abbondanza relativa di ciascun particolare target nel loro campione. L'abbondanza relativa rappresenta quanto del set di dati è composto dai dati di destinazione. L'abbondanza relativa viene spesso rappresentata come un istogramma di frequenza, ma può essere facilmente visualizzata in una tabella di frequenza. Considera la stessa distribuzione di frequenza dei gradi intermedi. L'abbondanza relativa è semplicemente la percentuale di studenti che hanno ottenuto un punteggio particolare e può essere utile per concettualizzare i dati senza pensarci troppo. Ad esempio, con la colonna aggiunta che visualizza la percentuale di occorrenza di ogni grado, puoi facilmente vedere che più della metà della classe ha ottenuto un punteggio B, senza dover esaminare i dati in modo molto dettagliato.
Frequenza di frequenza relativa Abbondanza (frequenza%) A .............. 7 .............. 28% B ............ .13 ............ 52% C .............. 3 ............. 12% D .. ............ 2 .............. 8%
I set di dati complessi possono aver bisogno di essere suddivisi in intervalli
One lo svantaggio è che è difficile comprendere complessi set di dati che vengono visualizzati su una tabella di frequenza. I set di dati di grandi dimensioni possono essere suddivisi in classi di intervallo per una facile visualizzazione utilizzando una tabella di frequenza. Ad esempio, se chiedessi alle prossime 100 persone di vedere quale fosse la loro età, probabilmente otterresti una vasta gamma di risposte che vanno da tre a novantatre. Anziché includere righe per ogni fascia nella tabella delle frequenze, è possibile classificare i dati in intervalli, ad esempio 0 - 10 anni, 11 - 20 anni, 21 - 30 anni e così via. Questo può anche essere definito come una distribuzione di frequenza raggruppata.
Le tabelle di frequenza possono oscurare l'inclinazione e la curtosi
A meno che non siano visualizzate su un istogramma, l'asimmetria e la curtosi dei dati potrebbero non essere facilmente evidenti in una frequenza tavolo. L'asimmetria ti indica in quale direzione si orientano i tuoi dati. Se i gradi venivano visualizzati sull'asse X di un grafico che mostra la frequenza dei voti di medio termine per i nostri 25 studenti sopra, la distribuzione si inclina verso le A e B's. Kurtosis ti parla del picco centrale dei tuoi dati - se si tratterebbe di una linea di distribuzione normale, che è una bella curva a campana liscia, o essere alta e nitida. Se analizzi i voti di medio termine nel nostro esempio, troverai un picco alto in B con un netto calo nella distribuzione dei voti inferiori.