Le statistiche si basano sul trarre conclusioni di fronte all'incertezza. Ogni volta che prendi un campione, non puoi essere completamente sicuro che il tuo campione rifletta veramente la popolazione da cui è tratto. Gli statistici affrontano questa incertezza prendendo in considerazione i fattori che potrebbero influenzare la stima, quantificandone l'incertezza ed eseguendo test statistici per trarre conclusioni da questi dati incerti.
Gli statistici utilizzano intervalli di confidenza per specificare un intervallo di valori che è " popolazione media sulla base di un campione ed esprimere il loro livello di certezza in questo attraverso livelli di confidenza. Sebbene il calcolo dei livelli di confidenza non sia spesso utile, il calcolo degli intervalli di confidenza per un determinato livello di confidenza è un'abilità molto utile.
TL; DR (troppo lungo; non letto)
Calcola un intervallo di confidenza per un dato livello di confidenza moltiplicando l'errore standard per il punteggio Z Ripeti lo stesso processo ma con il punteggio t Trova un livello di confidenza per un set di dati prendendo metà della dimensione dell'intervallo di confidenza, moltiplicandolo per la radice quadrata della dimensione del campione e poi dividendolo per la deviazione standard del campione. Cerca il risultato Z Quando vedi un statistica citata, a volte c'è un intervallo dato dopo di esso, con l'abbreviazione "CI" (per "intervallo di confidenza") o semplicemente un simbolo più-meno seguito da una cifra. Ad esempio, "il peso medio di un maschio adulto è di 180 libbre (CI: da 178,14 a 181,86)" o "il peso medio di un maschio adulto è di 180 ± 1,86 libbre". Entrambi forniscono le stesse informazioni: in base al campione usato, il peso medio di un uomo probabilmente rientra in un certo intervallo. L'intervallo stesso viene chiamato intervallo di confidenza. Se vuoi essere il più sicuro possibile che l'intervallo contenga il valore vero, puoi ampliare l'intervallo. Ciò aumenterebbe il tuo "livello di confidenza" nella stima, ma l'intervallo coprirebbe più potenziali pesi. La maggior parte delle statistiche (compresa quella sopra citata) sono fornite come intervalli di confidenza al 95 percento, il che significa che esiste una probabilità del 95 percento che il valore medio reale sia compreso nell'intervallo. È inoltre possibile utilizzare un livello di confidenza del 99 percento o un livello di confidenza del 90 percento, a seconda delle esigenze. Quando si utilizza un livello di confidenza nelle statistiche, di solito è necessario per calcolare un intervallo di confidenza. Questo è un po 'più facile da fare se si dispone di un campione di grandi dimensioni, ad esempio oltre 30 persone, poiché è possibile utilizzare il punteggio Z Prendi i tuoi dati grezzi e calcola la media del campione (aggiungi semplicemente i singoli risultati e dividi per il numero di risultati). Calcola la deviazione standard sottraendo la media da ogni singolo risultato per trovare la differenza e quindi quadrare questa differenza. Sommare tutte queste differenze e quindi dividere il risultato per la dimensione del campione meno 1. Prendi la radice quadrata di questo risultato per trovare la deviazione standard del campione (Vedi risorse). Determina l'intervallo di confidenza trovando prima il errore standard: SE Dove s SE Per trovare l'intervallo di confidenza da questo, cerca il livello di confidenza per cui vuoi calcolare l'intervallo in un Z Media ± Z Qui, ± 1,86 libbre è l'intervallo di confidenza del 95 percento. Se invece hai questo bit di informazione, insieme alla dimensione del campione e alla deviazione standard, puoi calcolare il livello di confidenza usando la seguente formula: Z La dimensione del l'intervallo di confidenza è solo il doppio del valore ±, quindi nell'esempio sopra, sappiamo 0,5 volte che è 1,86. Questo dà: Z Questo ci dà un valore per Z Per piccoli campioni, esiste un processo simile per calcolo dell'intervallo di confidenza. Innanzitutto, sottrarre 1 dalla dimensione del campione per trovare i "gradi di libertà". Nei simboli: df Per un campione n Trova il tuo valore alfa sottraendo la versione decimale del livello di confidenza ( ovvero il livello di confidenza percentuale diviso per 100) da 1 e dividendo il risultato per 2 o in simboli: α α Cerca il valore alfa e i gradi di libertà in una (una coda) t Come nel passaggio precedente, calcolare l'intervallo di confidenza moltiplicando questo numero per l'errore standard, che viene determinato utilizzando la deviazione standard del campione e la dimensione del campione allo stesso modo. L'unica differenza è che al posto del punteggio Z
per il livello di confidenza scelto. Sottrarre questo risultato dalla media del campione per ottenere il limite inferiore e aggiungerlo alla media del campione per trovare il limite superiore. (Vedi risorse)
al posto del punteggio Z
per campioni più piccoli ( n
<30 ).
o t
risultante in una tabella per trovare il livello.
La differenza tra livello di confidenza e intervallo di confidenza
Calcolo degli intervalli di confidenza o dei livelli per campioni di grandi dimensioni
per la stima anziché i punteggi t
più complicati.
\u003d s
/√ n
è la deviazione standard del campione e n
è la dimensione del campione. Ad esempio, se hai prelevato un campione di 1.000 uomini per calcolare il peso medio di un uomo e hai ottenuto una deviazione standard del campione di 30, ciò darebbe:
\u003d 30 /√1000 \u003d 30 /31.62 \u003d 0.95
-score tabella e moltiplica questo valore per il punteggio Z
. Per un livello di confidenza del 95 percento, il punteggio Z
è 1,96. Utilizzando l'esempio, ciò significa:
× SE
\u003d 180 libbre ± 1,96 × 0,95 \u003d 180 ± 1,86 libbre
\u003d 0,5 × dimensione dell'intervallo di confidenza × √ n
/ s
\u003d 1,86 × √1000 /30 \u003d 1,96
, che puoi cercare in una tabella Z
-score per trovare il livello di confidenza corrispondente.
Calcolo degli intervalli di confidenza per piccoli campioni
\u003d n
−1
\u003d 10, questo dà df
\u003d 9.
\u003d (1 - livello di confidenza decimale) /2
Quindi, per un livello di confidenza del 95 percento (0,95):
\u003d (1 - 0,95) /2 \u003d 0,05 /2 \u003d 0,025
tabella di distribuzione e prendi nota del risultato. In alternativa, ometti la divisione per 2 sopra e usa un valore t
a due code. In questo esempio, il risultato è 2.262.
, si utilizza il punteggio t
.