Determinare la veridicità di un parametro o di un'ipotesi che si applica a una grande popolazione può essere impraticabile o impossibile per una serie di ragioni, quindi è comune determinarlo per un gruppo più piccolo, chiamato campione. Una dimensione del campione troppo piccola riduce la potenza dello studio e aumenta il margine di errore, che può rendere lo studio privo di significato. I ricercatori potrebbero essere costretti a limitare le dimensioni del campionamento per motivi economici e di altro tipo. Per garantire risultati significativi, di solito regolano la dimensione del campione in base al livello di confidenza e al margine di errore richiesti, nonché alla deviazione attesa tra i singoli risultati.
La dimensione ridotta del campione riduce la potenza statistica
Il potere di uno studio è la sua capacità di rilevare un effetto quando ce n'è uno da rilevare. Questo dipende dalla dimensione dell'effetto perché i grandi effetti sono più facili da notare e aumentano la potenza dello studio.
Il potere dello studio è anche un indicatore della sua capacità di evitare errori di tipo II. Un errore di tipo II si verifica quando i risultati confermano l'ipotesi su cui si basava lo studio quando, in realtà, è valida un'ipotesi alternativa. Una dimensione del campione troppo piccola aumenta la probabilità che un errore di Tipo II distorga i risultati, il che diminuisce la potenza dello studio.
Calcolo delle dimensioni del campione
Per determinare una dimensione del campione che fornirà i risultati più significativi, i ricercatori prima determinano il margine di errore preferito (ME) o la quantità massima che vogliono che i risultati si discostino dalla media statistica. Di solito è espresso in percentuale, come in più o meno 5 percento. I ricercatori hanno anche bisogno di un livello di confidenza, che determinano prima di iniziare lo studio. Questo numero corrisponde a un punteggio Z, che può essere ottenuto dalle tabelle. Livelli di confidenza comuni sono il 90%, il 95% e il 99%, corrispondenti rispettivamente ai punteggi Z di 1,645, 1,96 e 2,576. I ricercatori esprimono lo standard previsto di deviazione (SD) nei risultati. Per un nuovo studio, è comune scegliere 0.5.
Dopo aver determinato il margine di errore, il punteggio Z e lo standard di deviazione, i ricercatori possono calcolare la dimensione ideale del campione utilizzando la seguente formula:
(Z-score) 2 x SD x (1-SD) /ME 2 = Dimensione del campione Effetti delle piccole dimensioni del campione Nella formula, il campione la dimensione è direttamente proporzionale al punteggio Z e inversamente proporzionale al margine di errore. Di conseguenza, la riduzione della dimensione del campione riduce il livello di confidenza dello studio, che è correlato al punteggio Z. La riduzione della dimensione del campione aumenta anche il margine di errore. In breve, quando i ricercatori sono vincolati a una piccola dimensione del campione per ragioni economiche o logistiche, potrebbero dover accontentarsi di risultati meno conclusivi. Che questo sia o meno un problema importante dipende in ultima analisi dalle dimensioni dell'effetto che stanno studiando. Ad esempio, una piccola dimensione del campione darebbe risultati più significativi in un sondaggio di persone che vivono nei pressi di un aeroporto che sono influenzate negativamente dal traffico aereo rispetto a un sondaggio dei loro livelli di istruzione.