Coefficiente di correlazione di Pearson

Definizione del coefficiente di correlazione di Pearson

Il coefficiente di correlazione di Pearson, noto anche come test statistico di Pearson R, misura la forza tra le diverse variabili e le loro relazioni. Ogni volta che viene condotto un test statistico tra le due variabili, è sempre una buona idea che la persona che esegue l'analisi calcoli il valore del coefficiente di correlazione per sapere quanto sia forte la relazione tra le due variabili.

Il coefficiente di correlazione di Pearson restituisce un valore compreso tra -1 e 1. L'interpretazione del coefficiente di correlazione è la seguente:

  • Se il coefficiente di correlazione è -1, indica una forte relazione negativa. Implica una perfetta relazione negativa tra le variabili.
  • Se il coefficiente di correlazione è 0, non indica alcuna relazione.
  • Se il coefficiente di correlazione è 1, indica una forte relazione positiva. Implica una perfetta relazione positiva tra le variabili.

Un valore assoluto più alto del coefficiente di correlazione indica una relazione più forte tra le variabili. Pertanto, un coefficiente di correlazione di 0,78 indica una correlazione positiva più forte rispetto a un valore di, diciamo 0,36. Allo stesso modo, un coefficiente di correlazione di -0,87 indica una correlazione negativa più forte rispetto a un coefficiente di correlazione di diciamo -0,40.

In altre parole, se il valore è nell'intervallo positivo, allora mostra che la relazione tra le variabili è correlata positivamente, ed entrambi i valori diminuiscono o aumentano insieme. D'altra parte, se il valore è nell'intervallo negativo, allora mostra che la relazione tra le variabili è correlata negativamente, ed entrambi i valori andranno nella direzione opposta.

Formula del coefficiente di correlazione di Pearson

La formula del coefficiente di correlazione di Pearson è la seguente,

Dove,

  • r = coefficiente di Pearson
  • n = numero delle coppie del calcio
  • ∑xy = somma dei prodotti degli stock abbinati
  • ∑x = somma degli x punteggi
  • ∑y = somma dei punteggi y
  • ∑x2 = somma dei quadrati x punteggi
  • ∑y2 = somma dei punteggi y al quadrato

Spiegazione

Passaggio 1: scopri il numero di coppie di variabili, che è indicato da n. Supponiamo che x sia composto da 3 variabili - 6, 8, 10. Supponiamo che y sia composto da 3 variabili corrispondenti 12, 10, 20.

Passaggio 2: elenca le variabili in due colonne.

Passaggio 3: trova il prodotto di x e y nella terza colonna.

Passaggio 4: trova la somma dei valori di tutte le variabili x e di tutte le variabili y. Scrivi i risultati in fondo alla prima e alla seconda colonna. Scrivi la somma di x * y nella terza colonna.

Passaggio 5: trova x2 e y2 nella quarta e quinta colonna e la loro somma in fondo alle colonne.

Passaggio 6: inserire i valori trovati sopra nella formula e risolverlo.

r = 3 * 352-24 * 42 / √ (3 * 200-242) * (3 * 644-422)

= 0,7559

Esempio di coefficiente di correlazione di Pearson R

Puoi scaricare questo modello Excel del coefficiente di correlazione Pearson qui - Modello Excel del coefficiente di correlazione Pearson

Esempio 1

In questo esempio con l'ausilio dei seguenti dettagli nella tabella delle 6 persone di diversa età e diverso peso riportato di seguito per il calcolo del valore del Pearson R

Soluzione:

Per il calcolo del coefficiente di correlazione di Pearson, calcoleremo prima i seguenti valori,

Qui il numero totale di persone è 6 quindi, n = 6

Ora il calcolo del Pearson R è il seguente,

  • r = (n (∑xy) - (∑x) (∑y)) / (√ [n ∑x2- (∑x) 2] [n ∑y2– (∑y) 2)
  • r = (6 * (13937) - (202) (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (6 * (13937) - (202) * (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (83622- 82618) / (√ [43680-40804] * [170190-167281)
  • r = 1004 / (√ [2876] * [2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892,452938
  • r = 0,35

Pertanto il valore del coefficiente di correlazione di Pearson è 0,35

Esempio n. 2

Ci sono 2 azioni - A e B. I prezzi delle azioni in determinati giorni sono i seguenti:

Scopri il coefficiente di correlazione di Pearson dai dati sopra.

Soluzione:

Innanzitutto, calcoleremo i seguenti valori.

Il calcolo del coefficiente di Pearson è il seguente,

  • r =  (5 * 1935-266 * 37) / ((5 * 14298- (266) ^ 2) * (5 * 283- (37) ^ 2)) ^ 0,5
  • = -0,9088

Pertanto il coefficiente di correlazione di Pearson tra i due titoli è -0,9088.

Vantaggi

  • Aiuta a sapere quanto sia forte la relazione tra le due variabili. Non solo la presenza o l'assenza della correlazione tra le due variabili viene indicata utilizzando il coefficiente di correlazione di Pearson, ma determina anche l'esatta misura in cui tali variabili sono correlate.
  • Utilizzando questo metodo, si può accertare la direzione della correlazione, ovvero se la correlazione tra due variabili è negativa o positiva.

Svantaggi

  • Il coefficiente di correlazione di Pearson R non è sufficiente per dire la differenza tra le variabili dipendenti e le variabili indipendenti poiché il coefficiente di correlazione tra le variabili è simmetrico. Ad esempio, se una persona sta cercando di conoscere la correlazione tra lo stress elevato e la pressione sanguigna, allora si potrebbe trovare il valore alto della correlazione che mostra che lo stress elevato causa la pressione sanguigna. Ora, se la variabile viene cambiata, anche il risultato, in quel caso, sarà lo stesso, il che mostra che lo stress è causato dalla pressione sanguigna che non ha senso. Pertanto, il ricercatore dovrebbe essere a conoscenza dei dati che sta utilizzando per condurre l'analisi.
  • Utilizzando questo metodo non è possibile ottenere le informazioni sulla pendenza della linea in quanto indica solo se esiste o meno una relazione tra le due variabili.
  • È probabile che il coefficiente di correlazione di Pearson possa essere interpretato in modo errato soprattutto in caso di dati omogenei.
  • Se confrontato con gli altri metodi di calcolo, questo metodo richiede molto tempo per arrivare ai risultati.

Punti importanti

  • I valori possono variare dal valore +1 al valore -1, dove +1 indica la perfetta relazione positiva tra le variabili considerate, -1 indica la perfetta relazione negativa tra le variabili considerate, e un valore 0 indica che nessuna relazione esiste tra le variabili considerate.
  • È indipendente dall'unità di misura delle variabili. Ad esempio, se l'unità di misura di una variabile è in anni mentre l'unità di misura della seconda variabile è in chilogrammi, anche allora il valore di questo coefficiente non cambia.
  • Il coefficiente di correlazione tra le variabili è simmetrico, il che significa che il valore del coefficiente di correlazione tra Y e X o X e Y rimarrà lo stesso.

Conclusione

Il coefficiente di correlazione di Pearson è il tipo di coefficiente di correlazione che rappresenta la relazione tra le due variabili misurate sullo stesso intervallo o sulla stessa scala di rapporti. Misura la forza della relazione tra le due variabili continue.

Non solo afferma la presenza o l'assenza della correlazione tra le due variabili, ma determina anche la misura esatta in cui tali variabili sono correlate. È indipendente dall'unità di misura delle variabili dove i valori del coefficiente di correlazione possono variare dal valore +1 al valore -1. Tuttavia, non è sufficiente dire la differenza tra le variabili dipendenti e le variabili indipendenti.