Test del chi quadrato in Excel

Test chi quadrato con Excel

Il test chi-quadrato in Excel è il test non parametrico più comunemente utilizzato per confrontare due o più variabili per dati selezionati in modo casuale. È un tipo di test che viene utilizzato per scoprire la relazione tra due o più variabili, questo viene utilizzato nelle statistiche che è anche noto come valore P chi-quadrato, in Excel non abbiamo una funzione incorporata ma possiamo usare formule per eseguire il test chi quadrato in Excel utilizzando la formula matematica per il test chi quadrato.

Tipi

  1. Test chi quadrato per la bontà dell'adattamento
  2. Test chi quadrato per l'indipendenza di due variabili.

# 1 - Test del chi quadrato per la bontà dell'adattamento

Viene utilizzato per percepire la vicinanza di un campione adatto a una popolazione. Il simbolo del test del chi quadrato è (2). È la somma di tutto il ( Conteggio osservato - Conteggio previsto) 2 / Conteggio previsto.

  • dove k-1 gradi di libertà o DF.
  • Dove Oi è la frequenza osservata, k è le categorie e Ei è la frequenza attesa.

Nota: - La bontà di adattamento di un modello statistico si riferisce alla comprensione del modo in cui i dati del campione si adattano a una serie di osservazioni.

Utilizza

  • L'affidabilità creditizia dei mutuatari in base alla loro fascia di età e ai prestiti personali
  • Il rapporto tra le prestazioni dei venditori e la formazione ricevuta
  • Ritorno su un singolo titolo e su azioni di un settore come quello farmaceutico o bancario
  • Categoria di spettatori e impatto di una campagna TV.

# 2 - Test del chi quadrato per l'indipendenza di due variabili

Viene utilizzato per verificare se le variabili sono autonome l'una dall'altra oppure no. Con (r-1) (c-1) gradi di libertà

Dove Oi è la frequenza osservata, r è il numero di righe, c è il numero di colonne ed Ei è la frequenza attesa

Nota: - Due variabili casuali sono chiamate indipendenti se la distribuzione di probabilità di una variabile non è influenzata dall'altra.

Utilizza

Il test di indipendenza è adatto per le seguenti situazioni:

  • C'è una variabile categoriale.
  • Esistono due variabili categoriali e sarà necessario determinare la relazione tra di loro.
  • Esistono tabulazioni incrociate e occorre trovare la relazione tra due variabili categoriali.
  • Esistono variabili non quantificabili (ad esempio, risposte a domande come, dipendenti di diverse fasce d'età scelgono diversi tipi di piani sanitari?)

Come eseguire il test chi-quadrato in Excel? (con esempio)

Puoi scaricare questo modello Excel per il test del chi quadrato qui - Modello Excel per il test del chi quadrato

Il gestore di un ristorante vuole trovare il rapporto tra la soddisfazione del cliente e gli stipendi delle persone in attesa dei tavoli. In questo, imposteremo l'ipotesi di testare il Chi-quadrato

  • Prende un campione casuale di 100 clienti chiedendo se il servizio è stato eccellente, buono o scadente.
  • Quindi classifica gli stipendi delle persone in attesa come basso, medio e alto.
  • Supponiamo che il livello di significatività sia 0,05. Qui, H0 e H1 denotano l'indipendenza e la dipendenza della qualità del servizio dagli stipendi delle persone in attesa ai tavoli.
  • H 0 - la qualità del servizio non dipende dagli stipendi delle persone in attesa dei tavoli.
  • H 1 - la qualità del servizio dipende dagli stipendi delle persone in attesa dei tavoli
  • I suoi risultati sono mostrati nella tabella seguente:

In questo, abbiamo 9 punti dati, abbiamo 3 gruppi ciascuno dei quali ha ricevuto un messaggio diverso sullo stipendio e il risultato è fornito di seguito.

Ora conteremo la somma di tutte le righe e le colonne. Lo faremo con l'aiuto della formula, ovvero SOMMA. Per sommare l'eccellente nella colonna del totale abbiamo scritto = SUM (B4: D4) e poi premere invio.

Questo ci darà 26 . Eseguiremo lo stesso con tutte le righe e le colonne.

Per calcolare il grado di libertà (DF) usiamo (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Ci sono 3 categorie di servizio e 3 categorie di stipendio
  • Abbiamo 27 intervistati con uno stipendio medio (riga inferiore, centrale)
  • Abbiamo 51 intervistati con un buon servizio (ultima colonna, al centro)

Ora dobbiamo calcolare le frequenze attese: -

Le frequenze attese possono essere calcolate utilizzando una formula: -

  • Per calcolare l' eccellente useremo moltiplicando il totale di Basso per il totale di Eccellente diviso per N.

Supponiamo di dover calcolare per la prima riga e la prima colonna (= B7 * E4 / B9 ) . Questo darà il numero previsto di clienti che hanno votato un servizio eccellente per gli stipendi delle persone in attesa più bassi, ovvero 8,32 .

  • E 11 = (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

Allo stesso modo per tutti, dobbiamo fare lo stesso e la formula viene applicata nel diagramma sottostante.

Otteniamo la tabella della frequenza prevista come indicato di seguito: -

Nota: - Supponiamo che il livello di significatività sia 0,05. Qui, H0 e H1 denotano l'indipendenza e la dipendenza della qualità del servizio dagli stipendi delle persone in attesa ai tavoli.

Dopo aver calcolato la frequenza prevista, calcoleremo i punti dati del chi quadrato utilizzando una formula

Punti chi-quadrato = (osservato-atteso) ^ 2 / atteso

Per calcolare il primo punto scriviamo = (B4-B14) ^ 2 / B14. 

Copieremo e incolleremo la formula in altre celle per riempire automaticamente il valore.

Dopodiché, calcoleremo il valore chi (valore calcolato) sommando tutti i valori indicati sopra la tabella

Abbiamo ottenuto il valore Chi come 18,65823 .

Per calcolare il valore critico per questo, utilizziamo una tabella del valore critico chi-quadrato di cui possiamo usare la formula fornita di seguito.

Questa formula contiene 2 parametri CHISQ.INV.RT (probabilità, grado di libertà).

La probabilità è 0,05, è un valore significativo che ci aiuterà a determinare se accettare o meno l' ipotesi nulla (H 0 ) .

Il valore critico del chi quadrato è 9,487729037.

Ora troveremo il valore del chi quadrato o (valore P) = CHITEST (intervallo_effettivo, intervallo_atteso)

Intervallo da = CHITEST (B4: D6, B14: D16) .

Come abbiamo visto, il valore del test chi o valore P è = 0.00091723.

Come abbiamo visto, abbiamo calcolato tutti i valori. I valori del chi-quadrato (valore calcolato) sono significativi solo quando il suo valore è uguale o superiore al valore critico 9.48, ovvero il valore critico (valore tabulato) deve essere maggiore di 18.65 per accettare l' ipotesi nulla (H 0 ) .

Ma qui Valore calcolato > Valore tabulato

X2 (calcolato)> X2 (tabulato)

18,65> 9,48

In questo caso, rifiuteremo l' ipotesi nulla (H 0 ) e l' alternativa (H 1 ) sarà accettata.

  • Possiamo anche usare il valore P per prevedere lo stesso, ad esempio se il valore P <= α (valore significativo 0,05), l'ipotesi nulla sarà rifiutata
  • Se il valore P> α , non rifiutare l'  ipotesi nulla .

Qui P-value (0.0009172) < α (0.05), rifiuta H 0 , accetta H 1

Dall'esempio sopra, concludiamo che la qualità del servizio dipende dai salari delle persone in attesa.

Cose da ricordare

  • Considera il quadrato di una variabile normale standard.
  • Valuta se le frequenze osservate in diverse categorie variano in modo significativo dalle frequenze previste in base a uno specifico insieme di ipotesi.
  • Determina quanto bene una distribuzione presunta si adatta ai dati.
  • Utilizza tabelle di contingenza (nelle ricerche di mercato, queste tabelle sono chiamate tabelle incrociate).
  • Supporta misurazioni a livello nominale.