Regressione dei minimi quadrati

Definizione del metodo di regressione dei minimi quadrati

Un metodo di regressione dei minimi quadrati è una forma di analisi di regressione che stabilisce la relazione tra la variabile dipendente e indipendente insieme a una linea lineare. Questa linea è indicata come la "linea di migliore adattamento".

L'analisi di regressione è un metodo statistico con l'aiuto del quale è possibile stimare o prevedere i valori sconosciuti di una variabile dai valori noti di un'altra variabile. La variabile utilizzata per prevedere l'interesse variabile è chiamata variabile indipendente o esplicativa e la variabile che viene prevista è chiamata variabile dipendente o spiegata.

Consideriamo due variabili x e y. Questi sono tracciati su un grafico con valori di x sull'asse x valori di y sull'asse y. Questi valori sono rappresentati dai punti nel grafico sottostante. Una linea retta viene tracciata attraverso i punti, definita la linea di migliore adattamento.

L'obiettivo della regressione ai minimi quadrati è garantire che la linea tracciata attraverso l'insieme di valori fornito stabilisca la relazione più stretta tra i valori.

Formula di regressione dei minimi quadrati

La linea di regressione con il metodo dei minimi quadrati viene calcolata utilizzando la seguente formula:

ŷ = a + bx

Dove,

  • ŷ = variabile dipendente
  • x = variabile indipendente
  • a = intercetta y
  • b = pendenza della linea

La pendenza della linea b viene calcolata utilizzando la seguente formula:

O

Intercetta Y, "a" viene calcolato utilizzando la seguente formula:

Linea di adattamento migliore nella regressione dei minimi quadrati

La linea di adattamento migliore è una linea retta tracciata attraverso una dispersione di punti dati che rappresenta al meglio la relazione tra di loro.

Consideriamo il grafico seguente in cui un insieme di dati è tracciato lungo gli assi xey. Questi punti dati sono rappresentati utilizzando i punti blu. Tre linee vengono tracciate attraverso questi punti: una verde, una rossa e una blu. La linea verde passa per un singolo punto e la linea rossa passa per tre punti dati. Tuttavia, la linea blu passa attraverso quattro punti dati e la distanza tra i punti residui e la linea blu è minima rispetto alle altre due linee.

Nel grafico sopra, la linea blu rappresenta la linea di migliore adattamento in quanto si trova più vicina a tutti i valori e la distanza tra i punti al di fuori della linea rispetto alla linea è minima (cioè la distanza tra i residui e la linea di migliore adattamento - indicato anche come le somme dei quadrati dei residui). Nelle altre due linee, quella arancione e quella verde, la distanza tra i residui e le linee è maggiore rispetto alla linea blu.

Il metodo dei minimi quadrati fornisce la relazione più stretta tra le variabili dipendenti e indipendenti riducendo al minimo la distanza tra i residui e la linea di adattamento migliore, ovvero la somma dei quadrati dei residui è minima con questo approccio. Da qui il termine "minimi quadrati".

Esempi di linea di regressione dei minimi quadrati

Applichiamo queste formule nella domanda seguente:

Puoi scaricare questo modello Excel di regressione dei minimi quadrati qui - Modello Excel di regressione dei minimi quadrati

Esempio 1

I dettagli relativi all'esperienza dei tecnici in un'azienda (in diversi anni) e la loro valutazione delle prestazioni sono forniti nella tabella seguente. Utilizzando questi valori, stimare la valutazione delle prestazioni di un tecnico con 20 anni di esperienza.

Soluzione -

Per calcolare prima i minimi quadrati calcoleremo l'intercetta Y (a) e la pendenza di una linea (b) come segue:

La pendenza della linea (b)

  • b = 6727 - [(80 * 648) / 8] / 1018 - [(80) 2/8]
  • = 247/218
  • = 1,13

Intercetta Y (a)

  • a = 648 - (1,13) (80) / 8
  • = 69,7

La linea di regressione viene calcolata come segue:

Sostituendo 20 al valore di x nella formula,

  • ŷ = a + bx
  • ŷ = 69,7 + (1,13) (20)
  • ŷ = 92,3

La valutazione delle prestazioni per un tecnico con 20 anni di esperienza è stimata in 92,3.

Esempio n. 2

Equazione di regressione dei minimi quadrati con Excel

L'equazione di regressione dei minimi quadrati può essere calcolata utilizzando Excel con i seguenti passaggi:

  • Inserisci la tabella dei dati in Excel.

  • Inserisci un grafico a dispersione utilizzando i punti dati.

  • Inserisci una linea di tendenza all'interno del grafico a dispersione.

  • Sotto le opzioni della linea di tendenza: seleziona la linea di tendenza lineare e seleziona Visualizza equazione sul grafico.

  • L'equazione di regressione dei minimi quadrati per il dato insieme di dati Excel viene visualizzata sul grafico.

Pertanto, viene calcolata l'equazione di regressione dei minimi quadrati per il dato insieme di dati Excel. Utilizzando l'equazione, è possibile effettuare previsioni e analisi delle tendenze. Gli strumenti di Excel forniscono anche calcoli di regressione dettagliati.

Vantaggi

  • Il metodo dei minimi quadrati dell'analisi di regressione è più adatto per i modelli di previsione e l'analisi delle tendenze. È utilizzato al meglio nei settori dell'economia, della finanza e dei mercati azionari in cui il valore di qualsiasi variabile futura è previsto con l'aiuto delle variabili esistenti e della relazione tra le stesse.
  • Il metodo dei minimi quadrati fornisce la relazione più stretta tra le variabili. La differenza tra le somme dei quadrati dei residui e la linea di migliore adattamento è minima con questo metodo.
  • Il meccanismo di calcolo è semplice e facile da applicare.

Svantaggi

  • Il metodo dei minimi quadrati si basa sullo stabilire la relazione più stretta tra un dato insieme di variabili. Il meccanismo di calcolo è sensibile ai dati e in caso di valori anomali (dati eccezionali) i risultati possono tendere ad influenzare maggiormente.
  • Questo tipo di calcolo è più adatto per i modelli lineari. Per le equazioni non lineari, vengono applicati meccanismi di calcolo più esaustivi.

Conclusione

Il metodo dei minimi quadrati è uno dei metodi più comunemente utilizzati per i modelli di previsione e l'analisi delle tendenze. Se calcolato in modo appropriato, offre i migliori risultati.