Formula della dimensione del campione

Formula per determinare la dimensione del campione della popolazione

La formula della dimensione del campione aiuta a calcolare o determinare la dimensione minima del campione richiesta per conoscere la proporzione adeguata o corretta della popolazione insieme al livello di confidenza e al margine di errore.

Il termine "campione" si riferisce alla porzione di popolazione che ci consente di trarre inferenze sulla popolazione ed è quindi importante che la dimensione del campione sia sufficientemente adeguata da poter fare inferenze significative. In altre parole, è la dimensione minima necessaria per stimare la proporzione reale della popolazione con il margine di errore e il livello di confidenza richiesti. In quanto tale, la determinazione della dimensione appropriata del campione è uno dei problemi ricorrenti nell'analisi statistica. La sua equazione può essere derivata utilizzando la dimensione della popolazione, il valore critico della distribuzione normale, la proporzione del campione e il margine di errore.

dove,

  • N = dimensione della popolazione,
  • Z = valore critico della distribuzione normale al livello di confidenza richiesto,
  • p = proporzione del campione,
  • e = margine di errore

Come calcolare la dimensione del campione? (Passo dopo passo)

  • Passaggio 1: in primo luogo, determina la dimensione della popolazione che è il numero totale di entità distinte nella tua popolazione ed è indicata da N. [Nota: nel caso in cui la dimensione della popolazione è molto grande ma il numero esatto non è noto, quindi usa 100.000 perché la dimensione del campione non cambia molto per le popolazioni più grandi di quella.]
  • Passaggio 2: Successivamente, determinare il valore critico della distribuzione normale al livello di confidenza richiesto. Ad esempio, il valore critico con un livello di confidenza del 95% è 1,96.
  • Passaggio 3: Successivamente, determinare la proporzione del campione che può essere utilizzata dai risultati del sondaggio precedente o essere raccolta eseguendo un piccolo sondaggio pilota. [Nota: in caso di dubbi si può sempre utilizzare 0,5 come approccio conservativo e fornirà la dimensione del campione più ampia possibile.]
  • Passaggio 4: Successivamente, determinare il margine di errore che è l'intervallo in cui ci si aspetta che si trovi la vera popolazione . [Nota: minore è il margine di errore, maggiore è la precisione e quindi la risposta esatta.]
  • Passaggio 5: Infine, l'equazione della dimensione del campione può essere derivata utilizzando la dimensione della popolazione (passaggio 1), il valore critico della distribuzione normale al livello di confidenza richiesto (passaggio 2), la proporzione del campione (passaggio 3) e il margine di errore (passaggio 4) come mostrato di seguito.

Esempi

Puoi scaricare questo modello Excel per la formula delle dimensioni di esempio qui - Modello Excel per la formula delle dimensioni del campione

Esempio 1

Prendiamo l'esempio di un rivenditore che è interessato a sapere quanti dei loro clienti hanno acquistato un articolo da loro dopo aver visualizzato il loro sito Web in un determinato giorno. Dato che il loro sito web ha in media 10.000 visualizzazioni al giorno, determina la dimensione del campione dei clienti che devono monitorare con un livello di confidenza del 95% con un margine di errore del 5% se:

  • Non sono sicuri dell'attuale tasso di conversione.
  • Sanno da precedenti sondaggi che il tasso di conversione è del 5%.

Dato,

  • Dimensione della popolazione, N = 10.000
  • Valore critico al livello di confidenza del 95%, Z = 1,96
  •  Margine di errore, e = 5% o 0,05

1 - Poiché l'attuale tasso di conversione è sconosciuto, assumiamo p = 0,5

Pertanto, la dimensione del campione può essere calcolata utilizzando la formula come,

= (10.000 * (1,96 2) * 0,5 * (1-0,5) / (0,05 2) / (10000 - 1 + ((1,96 2) * 0,5 * (1-0,5) / (0,05 2))))

Pertanto, 370 clienti saranno adeguati per derivare inferenze significative.

2 - L'attuale tasso di conversione è p = 5% o 0,05

Pertanto, la dimensione del campione può essere calcolata utilizzando la formula sopra come,

= (10.000 * (1,96 2) * 0,05 * (1-0,05) / (0,05 2) / (10000 - 1 + ((1,96 2) * 0,05 * (1-0,05) / (0,05 2))))

Pertanto, una dimensione di 72 clienti sarà adeguata per derivare un'inferenza significativa in questo caso.

Esempio n. 2

Prendiamo l'esempio precedente e in questo caso supponiamo che la dimensione della popolazione, ovvero la visualizzazione giornaliera del sito Web, sia compresa tra 100.000 e 120.000, ma il valore esatto non è noto. Il resto dei valori è lo stesso insieme a un tasso di conversione del 5%. Calcola la dimensione del campione sia per 100.000 che per 120.000.

Dato,

  • Proporzione del campione, p = 0,05
  • Valore critico al livello di confidenza del 95%, Z = 1,96
  •  Margine di errore, e = 0,05

Pertanto, la dimensione del campione per N = 100.000 può essere calcolata come,

= (100000 * (1,96 2) * 0,05 * (1-0,05) / (0,05 2) / (100000 - 1 + ((1,96 2) * 0,05 * (1-0,05) / (0,05 2))))

Pertanto, la dimensione del campione per N = 120.000 può essere calcolata come,

= (120000 * (1,96 2) * 0,05 * (1-0,05) / (0,05 2) / (120000 - 1 + ((1,96 2) * 0,05 * (1-0,05) / (0,05 2))))

Pertanto, è dimostrato che quando la dimensione della popolazione aumenta fino a diventare molto grande, diventa irrilevante nel calcolo della dimensione del campione.

Rilevanza e usi

Il calcolo della dimensione del campione è importante per comprendere il concetto di dimensione del campione appropriata perché viene utilizzato per la validità dei risultati della ricerca. Nel caso in cui sia troppo piccolo, non produrrà risultati validi, mentre un campione troppo grande potrebbe essere uno spreco di denaro e tempo. Statisticamente, la dimensione significativa del campione viene utilizzata prevalentemente per indagini di ricerca di mercato, indagini sanitarie e indagini sull'istruzione.