Multicollinearità

Cos'è la multicollinearità?

La multicollinearità è un fenomeno statistico in cui due o più variabili in un modello di regressione dipendono dalle altre variabili in modo tale che una possa essere prevista linearmente dall'altra con un alto grado di accuratezza. È generalmente utilizzato negli studi osservazionali e meno popolare negli studi sperimentali.

Tipi di multicollinearità

Esistono quattro tipi di multicollinearità

  • # 1 - Multicollinearità perfetta - Esiste quando le variabili indipendenti nell'equazione predicono la relazione lineare perfetta.
  • # 2 - Multicollinearità elevata - Si riferisce alla relazione lineare tra due o più variabili indipendenti tra loro non perfettamente correlate.
  • # 3 - Multicollinearità strutturale - Ciò è causato dal ricercatore stesso inserendo diverse variabili indipendenti nell'equazione.
  • # 4 - Multicollineaarità basata sui dati - È causata da esperimenti mal progettati dal ricercatore.

Cause di multicollinearità

Variabili indipendenti, la modifica dei parametri delle variabili fa sì che una piccola modifica nelle variabili abbia un impatto significativo sul risultato e le raccolte dati si riferiscono al campione della popolazione selezionata presa.

Esempi di multicollinearità

Esempio 1

Supponiamo che ABC Ltd, un KPO, sia stato assunto da una società farmaceutica per fornire servizi di ricerca e analisi statistiche sulle malattie in India. Per questo ABC srl ha selezionato età, peso, professione, altezza e salute come parametri prima facie.

  • Nell'esempio sopra, c'è una situazione di multicollinearità poiché le variabili indipendenti selezionate per lo studio sono direttamente correlate ai risultati. quindi sarebbe consigliabile che il ricercatore aggiustasse le variabili prima di iniziare qualsiasi progetto poiché i risultati saranno influenzati direttamente a causa delle variabili selezionate qui.

Esempio n. 2

Supponiamo che ABC Ltd sia stata incaricata da Tata Motors di comprendere che il volume delle vendite dei motori tata sarà elevato in quale categoria del mercato.

  • Nell'esempio sopra, verranno innanzitutto finalizzate variabili indipendenti in base alle quali la ricerca deve essere completata. può essere reddito mensile, età. marchio, la classe inferiore. Significa solo che verranno selezionati i dati che si adatteranno a tutte queste schede per capire quante persone possono acquistare questa macchina (tata nano) senza nemmeno guardare altre auto.

Esempio n. 3

Supponiamo che ABC Ltd sia stata assunta per inviare una segnalazione per sapere quante persone sotto i 50 anni sono inclini ad attacchi di cuore. per questo i parametri sono età, sesso, anamnesi

  • Nell'esempio sopra, c'è una multicollinearità che è sorta perché la variabile indipendente "età" deve essere ottimizzata all'età inferiore ai 50 anni per invitare le domande dal pubblico in modo che le persone che hanno più di 50 anni di età vengano automaticamente filtrate.

Vantaggi

Di seguito sono riportati alcuni dei vantaggi

  • Relazione lineare tra le variabili indipendenti nell'equazione.
  • Molto utile nei modelli statistici e nei rapporti di ricerca preparati dalle aziende basate sulla ricerca.
  • Impatto diretto sul risultato desiderato.

Svantaggi

Di seguito sono riportati alcuni degli svantaggi

  • In alcune delle situazioni, questo problema verrebbe risolto raccogliendo più dati sulle variabili.
  • Uso scorretto di variabili fittizie, ad esempio il ricercatore può dimenticare di utilizzare le variabili fittizie ogni volta che è necessario.
  • Inserimento di 2 variabili uguali o identiche nell'equazione come kg e lbs in pesi.
  • Inserimento di una variabile nell'equazione che è una combinazione di 2.
  • Complicato per eseguire calcoli poiché è la tecnica statistica e richiede calcolatori statistici per eseguire l'esecuzione.

Conclusione

La multicollinearità è uno degli strumenti statistici più preferiti spesso utilizzati nell'analisi di regressione e nell'analisi statistica per database di grandi dimensioni e l'output desiderato. Tutte le principali società hanno un dipartimento statistico separato nella loro azienda per eseguire analisi di regressione statistica su prodotti o persone al fine di fornire una visione strategica del mercato al management e anche aiutarli a redigere le loro strategie a lungo termine tenendo presente questa considerazione. La presentazione grafica dell'analisi fornisce al lettore un'immagine chiara della relazione diretta, dell'accuratezza e delle prestazioni.

  • Se l'obiettivo del ricercatore è comprendere le variabili indipendenti nell'equazione, la multicollinearità sarà per lui un grosso problema.
  • Il ricercatore deve apportare le modifiche richieste nelle variabili allo stadio 0 stesso, altrimenti potrebbe avere un impatto enorme sui risultati.
  • La multicollinearità può essere ottenuta esaminando la matrice di correlazione.
  • Le misure correttive svolgono un ruolo significativo nella risoluzione dei problemi di multicollinearità.