La dimensione del campione rappresenta il numero di osservazioni effettuate per condurre un'analisi statistica. Le dimensioni del campione possono essere composte da persone, animali, lotti di cibo, macchine, batterie o qualunque popolazione venga valutata.
Campionamento casuale
Il campionamento casuale è un metodo mediante il quale vengono raccolti campioni casuali da popolazione al fine di valutare le informazioni sulla popolazione senza essere di parte. Ad esempio, se vuoi sapere che tipo di persone vivono in una determinata città, devi intervistare /misurare persone diverse a caso. Tuttavia, se hai appena usato tutti quelli della biblioteca, non avresti una stima imparziale /imparziale di ciò che è la popolazione generale che occupa la città, solo le persone che frequentano la biblioteca.
Precisione
Man mano che le dimensioni del campione aumentano, le stime diventano più accurate. Ad esempio, se selezionassimo casualmente 10 umani maschi adulti, potremmo trovare un'altezza media di 6 piedi per 3 pollici, forse perché c'è un giocatore di basket che gonfia la nostra stima. Se, tuttavia, misurassimo due milioni di uomini maschi adulti, avremmo un migliore predittore dell'altezza media dei maschi perché gli estremi si bilanciano e la media verrebbe ad oscurare qualsiasi deviazione dalla media.
Intervalli di confidenza
Quando uno statistico fa una previsione su un risultato, spesso costruisce un intervallo attorno alla sua stima. Ad esempio, se misurassimo il peso di 100 donne, potremmo dire che siamo sicuri al 90% che il vero peso medio delle donne sia nell'intervallo tra 103 e 129 sterline. (Questo, ovviamente, dipende anche da altri fattori come la variabilità delle misure). Man mano che le dimensioni del campione aumentano, diventiamo più fiduciosi sulla nostra stima e i nostri intervalli diventano più piccoli. Ad esempio, con un milione di donne, potremmo dire che siamo sicuri al 98% che il vero peso medio delle donne sia tra 115 e 117 sterline. In altre parole, all'aumentare della dimensione del campione, aumenta la nostra fiducia nelle nostre misurazioni e diminuisce la dimensione dei nostri intervalli di confidenza.
Errore standard
La variazione è una misura della diffusione dei dati attorno alla media . La deviazione standard è la radice quadrata della variazione e aiuta ad approssimare quale percentuale della popolazione cade tra un intervallo di valori relativo alla media. All'aumentare della dimensione del campione, l'errore standard, che dipende dalla deviazione standard e dalla dimensione del campione, diminuisce. Di conseguenza, le stime aumentano di precisione e la ricerca basata su queste stime è considerata più affidabile (con meno rischi di errore).
Difficoltà nell'uso di dimensioni di campione maggiori
Le dimensioni dei campioni più grandi ovviamente producono meglio, più stime accurate sulle popolazioni, ma ci sono diversi problemi con i ricercatori che utilizzano campioni di dimensioni maggiori. Prima di tutto, potrebbe essere difficile trovare un campione casuale di persone disposte a provare un nuovo farmaco. Quando lo fai, diventa più costoso fornire il farmaco a più persone e monitorare più persone nel tempo. Inoltre, è necessario uno sforzo maggiore per ottenere e mantenere una dimensione del campione più ampia. Anche se le dimensioni dei campioni più grandi producono statistiche più accurate, il costo e lo sforzo aggiuntivi non sono sempre necessari in quanto campioni di dimensioni più piccole possono anche produrre risultati significativi.