Primeri korelacije v statistiki
Primer pozitivne korelacije vključuje kalorije, porabljene z vadbo, kjer se bo s povečanjem ravni vadbe povečala tudi raven porabljenih kalorij, primer negativne korelacije pa razmerje med cenami jekla in cenami delnic jeklarskih podjetij, s tem pa se bo povišanje cen delnic jekla zmanjšalo.
V statistiki se korelacija uporablja predvsem za analizo moči razmerja med obravnavanimi spremenljivkami in nadalje meri tudi, ali obstaja povezava, tj. Linearna med danimi nizi podatkov in kako dobro bi lahko bili povezani. Tak pogost ukrep, ki se na področju statistike uporablja za korelacijo, je Pearsonov koeficient korelacije. Naslednji primer korelacije ponuja oris najpogostejših korelacij.
Primer # 1
Vivek in Rupal sta brata in sestra, Rupal pa je starejši od Viveka za 3 leta. Njihov oče Sanjeev je statistik in zanimal se je za raziskovanje linearnega razmerja med višino in težo. Zato je od njihovega rojstva v različnih starostih zapisoval njihovo višino in težo in prišel do spodnjih podatkov:
Poskuša ugotoviti, ali obstaja kakšna povezava med starostjo, višino in težo in ali obstaja kakšna razlika med njimi?
Rešitev:
> Najprej bomo narisali razpršeni grafikon in dobili bomo spodnji rezultat za starost, višino in težo Rupala in Viveka.
Ko se starost povečuje, se višina povečuje in tudi teža povečuje, zato se zdi, da obstaja pozitivno razmerje, z drugimi besedami, obstaja pozitivna povezava med višino in starostjo. Nadalje je ugotovil, da teža niha in ni stabilna, lahko bi se le nekoliko povečala ali zmanjšala, vendar je opazil, da obstaja pozitivna povezava med višino in težo, ko se višina teže tudi povečuje.
Tako je opazil, da obstajata tukaj dve pomembni povezavi, s starostjo - višina narašča in s povečevanjem višine se povečuje tudi teža, zato vsi trije nosijo pozitivno korelacijo.
2. primer
Janez je navdušen nad poletnimi počitnicami. Njegovi starši pa so zaskrbljeni, saj najstnik sedi doma in se igra na mobilnih igrah ter ves čas vklaplja klimatsko napravo. Opazili so različne temperature in enote, ki so jih porabili v zadnjem letu, našli so zanimive podatke in želeli so predvideti prihodnji mesečni račun in pričakujejo, da bo temperatura blizu 40 * C, vendar želijo vedeti, ali obstaja kakšna povezava med računom za temperaturo in elektriko?
Rešitev:
Analizirajmo tudi to s pomočjo grafikona.
Narisali smo račune za elektriko in temperaturo ter ugotovili različne točke. Zdi se, da obstaja povezava med računom za temperaturo in elektriko, kadar je temperatura hladna, račun za elektriko je pod nadzorom, kar je smiselno, saj bi družina porabila manj klimatizacije in ko in ko se temperatura zviša, raba zraka povečanje gejzirja, kar bi jih prizadelo za višje stroške, kar je razvidno iz zgornjega grafa, kjer se račun za elektriko močno dvigne.
Iz tega lahko sklepamo, da ni linearnega razmerja, vendar obstaja pozitivna povezava. Zato lahko družina znova pričakuje znesek za maj v razponu od 6400 do 7000.
3. primer
Tom je začel nov gostinski posel, kjer najprej analizira stroške izdelave sendviča in kakšno ceno naj jih proda. Spodaj je zbral informacije po pogovoru z različnimi kuharji, ki trenutno prodajajo sendvič.
Tom je bil prepričan, da obstaja pozitivna linearna povezava med številom sendvičev in skupnimi stroški njihove izdelave. Analizirajte, če je ta trditev resnična?
Rešitev:
Po načrtovanju točk med številom pripravljenih sendvičev in stroški njihove izdelave je med njimi zagotovo pozitiven odnos.
In iz zgornje tabele je razvidno, da obstaja pozitivno linearno razmerje med in če se izvede korelacija, bo prišlo do +1. Ko bo naredil več sendviča, se bodo stroški povečali in zdi se, da velja, kolikor več sendviča naredijo, toliko več zelenjave bo treba, kot tudi kruh. Zato ima to pozitivno popolno linearno razmerje, ki temelji na danih podatkih.
Primer # 4
Rakesh že dolgo vlaga v delnice ABC. Zanima ga, ali so zaloge ABC dobra meja za trg. Ker je vlagal tudi v sklad ETF, ki sledi tržnemu indeksu. Spodaj je zbral podatke za zadnjih 12 mesečnih donosov delnic ABC in Index.
S pomočjo korelacije ugotovite, kakšen odnos ima delnica ABC s trgom in ali varuje portfelj?
Rešitev:
Z uporabo spodnje formule korelacijskega koeficienta za obravnavo sprememb cen delnic ABC kot x in sprememb tržnega indeksa kot y dobimo korelacijo kot -0,90
To je očitno blizu popolne negativne korelacije ali z drugimi besedami negativne povezave.
Torej, ko trg narašča, cena delnic ABC pade, ko pa trg pade, cena delnic ABC naraste, zato je to dobra zaščita za portfelj.
Zaključek
Sklepamo lahko, da bi lahko obstajali korelacije med dvema spremenljivkama, ne pa nujno linearno razmerje. Obstaja lahko eksponentna korelacija ali log korelacija, torej če dobimo rezultat, ki navaja, da obstaja pozitivna ali negativna korelacija, potem je treba to presoditi tako, da spremenljivke narišemo na graf in ugotovimo, ali obstaja resnično kakšno razmerje ali obstaja spodbudo korelacija.