La giusta dimensione del campione è una considerazione importante per coloro che conducono sondaggi. Se la dimensione del campione è troppo piccola, i dati del campione ottenuti non saranno un riflesso accurato dei dati rappresentativi della popolazione. Se la dimensione del campione è troppo grande, il sondaggio sarà troppo costoso e richiede molto tempo per essere completato. Ad esempio, se il tuo obiettivo del sondaggio fosse quello di trovare l'età media delle donne negli Stati Uniti, sarebbe impraticabile chiedere a tutte le donne della sua età.
La determinazione della dimensione del campione richiede che tu definisca il livello di confidenza vuoi e il livello di errore che tollererai e che conosci o hai una stima della deviazione standard del parametro della popolazione che stai cercando di determinare.
Definisci il livello di errore che tollererai. Scegli un valore che fornirà un risultato inferiore al 5% del parametro della popolazione che stai tentando di stimare. Considerare che maggiore è il livello di errore tollerato, meno significativi sono i risultati del sondaggio.
Considerare una situazione in cui è necessario trovare l'età media delle donne (il parametro della popolazione) negli Stati Uniti. Innanzitutto fai una stima dell'età media delle donne. Per quella stima usa uno studio precedente e poi moltiplica quel numero per 0,05 per trovare l'errore.
Se uno studio non è disponibile, stimare approssimativamente l'età media delle donne. Per quella stima, ottieni dati con 10 sondaggi diversi che hanno una dimensione del campione di 31 donne ciascuno. Per ogni sondaggio, calcolare l'età media per le 31 donne. Quindi calcola la media dei mezzi per tutti i sondaggi. Utilizzare questo numero come stima dell'età media delle donne. Quindi moltiplica quel numero per 0,05 per ottenere l'errore. Se la media dei mezzi ottenuti per i tuoi sondaggi era 40, moltiplichi 0.05 (5%) volte 40 per ottenere 2. Quindi, seleziona l'errore che tollererai entro due anni.
Scrivi questo numero in basso; lo userai per calcolare la dimensione del campione. Se si utilizza l'errore 2 per il calcolo del campione, il sondaggio produrrà un risultato accurato entro due anni dall'età media attuale delle donne nella popolazione. Ricorda che minore è l'errore, maggiore sarà la dimensione del campione.
Definisci il livello di confidenza che desideri utilizzare. Scegli un livello di confidenza del 90, 95 o 99 percento. Utilizzare un livello di confidenza più elevato se si desidera aumentare la probabilità che i risultati del sondaggio campione rientrino nella tolleranza di errore calcolata nel passaggio precedente. Ricorda che più alto è il livello di confidenza scelto, maggiore sarà la dimensione del campione.
Determina il valore critico per l'intervallo di confidenza dato. Per un livello di confidenza del 90 percento, utilizzare un valore critico di 1,645. Per un intervallo di confidenza del 90%, utilizzare un valore critico di 1,960 e, per un livello di confidenza del 99%, utilizzare un valore critico di 2,575. Scrivi questo numero in basso; lo utilizzerai per calcolare la dimensione del campione.
Successivamente, scopri la deviazione standard per il parametro della popolazione che stai tentando di stimare con il tuo sondaggio. Utilizzare la deviazione standard del parametro della popolazione indicato nel problema o stimare la deviazione standard. Se non viene indicato, utilizzare la deviazione standard di uno studio simile. Se nessuno dei due è disponibile, stimare approssimativamente una deviazione standard in modo tale che sia circa il 34% della popolazione.
Per l'esempio riportato nella Fase 1, supponiamo che 20 anni sia una deviazione standard. Per un'età media di 40 anni, questo significa che il 68% delle donne nella popolazione ha un'età compresa tra i 20 ei 60 anni.
Calcola la dimensione del campione. Innanzitutto moltiplicare il valore critico per la deviazione standard. Quindi dividi questo risultato per l'errore del passaggio 1. Ora piazza questo risultato. Questo risultato è la dimensione del campione.
Per un problema che utilizza un intervallo di confidenza del 90 percento (un valore critico di 1,645), specifica un errore entro due anni e fornisce una deviazione standard della popolazione di 20 anni, prima moltiplicare 1,645 per 20 per ottenere 32,9. Dividi 32,9 per 2 per ottenere 16,45. Quadrato 16.45 per ottenere 270.6. Arrotondare al numero intero più alto successivo per ottenere una dimensione campione di 271.
Stabilire le condizioni per i risultati del sondaggio. Per l'esempio nella Fase 1, con una dimensione del campione di 271, puoi essere sicuro al 90% che la media del campione di 271 donne sarà entro due anni dalla media effettiva della popolazione totale delle donne. Pertanto, se il sondaggio ha avuto un'età media di 43 anni, è possibile accertare che esiste una probabilità del 90% che l'età media della popolazione femminile negli Stati Uniti sia compresa tra 42 e 44.