Formula anomala

La formula dei valori anomali fornisce uno strumento grafico per calcolare i dati che si trovano al di fuori del dato insieme di distribuzione che può essere il lato interno o esterno a seconda delle variabili.

Qual è la formula Outlier?

Un valore anomalo è il punto dati del dato campione o data osservazione o in una distribuzione che deve trovarsi al di fuori del modello generale. Una regola di uso comune che dice che un punto dati sarà considerato un valore anomalo se ha più di 1,5 IQR al di sotto del primo quartile o al di sopra del terzo quartile.

Detto in modo diverso, valori anomali bassi devono essere inferiori a Q1-1,5 IQR e valori anomali alti devono essere Q3 + 1,5 IQR

È necessario calcolare la mediana, i quartili inclusi IQR, Q1 e Q3.

La formula dei valori anomali è rappresentata come segue,

La formula per Q1 = ¼ (n + 1) esimo termine La formula per Q3 = ¾ (n + 1) esimo termine La formula per Q2 = Q3 - Q1

Calcolo graduale dei valori anomali

I passaggi seguenti devono essere seguiti per calcolare il valore anomalo.

  • Passaggio 1: prima calcola i quartili, ovvero Q1, Q2 e interquartile
  • Passaggio 2: ora calcola il valore Q2 * 1.5
  • Passaggio 3: ora sottrarre il valore Q1 dal valore calcolato nel passaggio 2
  • Passaggio 4: qui aggiungere Q3 con il valore calcolato nel passaggio 2
  • Passaggio 5: creare l'intervallo dei valori calcolati nei passaggi 3 e 4
  • Passaggio 6: disporre i dati in ordine crescente
  • Passaggio 7: verificare se sono presenti valori inferiori o superiori all'intervallo creato nel passaggio 5

Esempio

Considera un set di dati dei seguenti numeri: 10, 2, 4, 7, 8, 5, 11, 3, 12. Devi calcolare tutti i valori anomali.

Soluzione:

Innanzitutto, dobbiamo disporre i dati in ordine crescente per trovare la mediana che sarà Q2 per noi.

2, 3, 4, 5, 7, 8, 10, 11, 12

Ora poiché il numero di osservazioni è dispari che è 9, la mediana si trova su una 5a posizione che è 7 e lo stesso sarà Q2 per questo esempio.

Pertanto, il calcolo di Q1 è il seguente:

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 sarà - 

Q1 = 2,5 termine

Ciò significa che Q1 è la media della 2a e 3a posizione delle osservazioni che qui è 3 e 4 e una media della stessa è (3 + 4) / 2 = 3.5

Pertanto, il calcolo di Q3 è il seguente:

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 sarà - 

Q3 = 7,5 termine

Ciò significa che Q3 è la media della 7a e 8a posizione delle osservazioni che qui è 10 e 11 e una media della stessa è (10 + 11) / 2 = 10,5

Ora, valori anomali bassi devono essere inferiori a Q1-1,5 IQR e valori anomali alti devono essere Q3 + 1,5 IQR

Quindi, i valori sono 3,5 - (1,5 * 7) = -7 e l'intervallo superiore è 10,5 + (1,5 * 7) = 110,25.

Poiché non sono presenti osservazioni superiori o inferiori a 110,25 e -7, non abbiamo valori anomali in questo campione.

Esempio di formula anomala in Excel (con modello Excel)

Puoi scaricare questo modello Excel per formula anomala qui - Modello Excel per formula anomala

Le classi di coaching creativo stanno valutando la possibilità di premiare gli studenti che si trovano nel 25% dei migliori, tuttavia vogliono evitare qualsiasi outlier. I dati si riferiscono ai 25 studenti. Utilizzare l'equazione dei valori anomali per determinare se esiste un valore anomalo?

Soluzione:

Di seguito vengono forniti i dati per calcolare i valori anomali

Il numero di osservazioni qui è 25 e il nostro primo passo sarebbe convertire i dati grezzi sopra in ordine crescente.

La mediana sarà -

Il valore mediano = ½ (n + 1)

= ½ = ½ (26)

= 13 ° mandato

La Q2 o mediana è 68,00

Che è il 50% della popolazione.

Q1 sarà -

Q1 = ¼ (n + 1) esimo termine

= ¼ (25 + 1)

= ¼ (26)

= 6,5 ° termine che è equivalente al 7 ° termine

Il Q1 è 56.00 che è il 25% inferiore

Q3 sarà -

Infine, Q3 = ¾ (n + 1) esimo termine

= ¾ (26)

= 19,50 durata

Qui è necessario prendere la media che è del 19 ° e 20 ° termine che sono 77 e 77 e la media dello stesso è (77 + 77) / 2 = 77,00

 Il terzo trimestre è 77 che è il 25% superiore

Gamma bassa

Ora, valori anomali bassi devono essere inferiori a Q1-1,5 IQR e valori anomali alti devono essere Q3 + 1,5 IQR

Alta gamma -

Quindi, i valori sono 56 - (1,5 * 68) = -46 e l'intervallo superiore è 77 + (1,5 * 68) = 179.

Non ci sono valori anomali.

Rilevanza e usi

La formula dei valori anomali è molto importante da sapere in quanto potrebbero esserci dati che verrebbero distorti da tale valore. Prendi un esempio delle osservazioni 2, 4, 6, 101 e ora se qualcuno prende una media di questi valori sarà 28,25 ma il 75% delle osservazioni è inferiore a 7 e quindi sarebbe una decisione errata riguardo alle osservazioni di questo campione.

Si può notare qui che 101 sembra chiaramente delineare e se questo viene rimosso, la media sarebbe 4, il che dice sui valori o sulle osservazioni che si trovano nell'intervallo di 4. Quindi è molto importante condurre questo calcolo per evitare qualsiasi uso improprio delle informazioni principali dei dati. Questi sono ampiamente utilizzati dagli statistici di tutto il mondo ogni volta che conducono ricerche.