Večkolinearnost (opredelitev, vrste) | Top 3 primeri z obrazložitvijo

Kaj je večkolinearnost?

Multikolinearnost je statistični pojav, pri katerem sta dve ali več spremenljivk v regresijskem modelu odvisni od drugih spremenljivk tako, da je mogoče eno linearno napovedati od druge z visoko stopnjo natančnosti. Običajno se uporablja v opazovalnih študijah in manj priljubljen v eksperimentalnih študijah.

Vrste multikolinearnosti

Obstajajo štiri vrste večkolinearnosti

# 1 - Popolna večkolinearnost - Obstaja, ko neodvisne spremenljivke v enačbi napovedujejo popolno linearno razmerje.
# 2 - Visoka večkolinearnost - Nanaša se na linearno razmerje med dvema ali več neodvisnimi spremenljivkami, ki med seboj niso v popolni korelaciji.
# 3 - Strukturna multikolinearnost - Razlog za to je raziskovalec sam z vstavljanjem različnih neodvisnih spremenljivk v enačbo.
# 4 - Na osnovi podatkov zasnovana večkolinearnost - povzročajo jo eksperimenti, ki jih raziskovalec slabo načrtuje.

Vzroki večkolinearnosti

Neodvisne spremenljivke, sprememba parametrov spremenljivk pomeni, da majhna sprememba spremenljivk bistveno vpliva na rezultat in zbiranje podatkov se nanaša na vzorec izbrane populacije, ki jo jemljemo.

Primeri večkolinearnosti

Primer # 1

Predpostavimo, da je farmacevtsko podjetje najelo ABC Ltd KPO za opravljanje raziskovalnih storitev in statistično analizo bolezni v Indiji. Za to je ABC ltd kot primarne parametre izbral starost, težo, poklic, višino in zdravje.

V zgornjem primeru obstaja večkolinearnost, saj so neodvisne spremenljivke, izbrane za študijo, neposredno povezane z rezultati. zato bi bilo priporočljivo, da raziskovalec najprej prilagodi spremenljivke, preden začne s katerim koli projektom, saj bodo na izbrane spremenljivke tukaj neposredno vplivali rezultati.

2. primer

Predpostavimo, da je družba Tata Motors imenovala ABC Ltd, da bi razumela, v kakšni kategoriji bo trg prodaje tata motorjev velik.

V zgornjem primeru bodo najprej dokončane neodvisne spremenljivke, na podlagi katerih je treba zaključiti raziskavo. lahko je mesečni dohodek, starost. blagovne znamke, nižji razred. Pomeni le, da bodo izbrani podatki, ki bodo ustrezali vsem tem zavihkom, da bi ugotovili, koliko ljudi lahko kupi ta avto (tata nano), ne da bi si sploh ogledali kateri koli drug avto.

3. primer

Predpostavimo, da je bil ABC Ltd najet, da predloži poročilo, da ve, koliko ljudi, mlajših od 50 let, je nagnjenih k srčnim napadom. za to so parametri starost, spol, anamneza

V zgornjem primeru obstaja multikolinearnost, ki je nastala, ker je treba neodvisno spremenljivko "starost" prilagoditi na starost, mlajšo od 50 let za povabilo javnosti, da se osebe, starejše od 50 let, samodejno filtrirajo.

Prednosti

Spodaj je nekaj Prednosti

Linearna povezava med neodvisnimi spremenljivkami v enačbi.
Zelo uporabno v statističnih modelih in raziskovalnih poročilih, ki jih pripravljajo podjetja, ki temeljijo na raziskavah.
Neposreden vpliv na želeni rezultat.

Slabosti

Spodaj je nekaj slabosti

V nekaterih primerih bi to težavo rešili z zbiranjem več podatkov o spremenljivkah.
Nepravilna uporaba navideznih spremenljivk, tj. Raziskovalec lahko pozabi uporabiti navidezne spremenljivke, kadar je to potrebno.
V enačbo vstavimo 2 enaki ali enaki spremenljivki, na primer kg in lbs v uteži.
V enačbo vstavimo spremenljivko, ki je kombinacija 2.
Zapleten za izvajanje izračunov, saj je statistična tehnika in za izvedbo zahteva statistične kalkulatorje.

Zaključek

Multikolinearnost je eno najbolj priljubljenih statističnih orodij, ki se pogosto uporablja pri regresijski analizi in statistični analizi za velike zbirke podatkov in želene rezultate. Vsa večja podjetja imajo v svojem podjetju ločen statistični oddelek, ki izvaja statistično regresijsko analizo izdelkov ali ljudi, da bi vodstvu zagotovil strateški pogled na trg in jim pomagal tudi pri oblikovanju njihovih dolgoročnih strategij. Grafična predstavitev analize daje bralcu jasno sliko neposrednega odnosa, natančnosti in uspešnosti.

Če je cilj raziskovalca razumeti neodvisne spremenljivke v enačbi, mu bo večkolinearnost velik problem.
Raziskovalec mora spremeniti spremenljivke na stopnji 0 sam, sicer lahko močno vpliva na rezultate.
Večkolinearnost lahko dosežemo s preučevanjem korelacijske matrice.
Sanacijski ukrepi imajo pomembno vlogo pri reševanju težav z multikolinearnostjo.