KURZUS: Statisztika II.

MODUL: III. modul: Korreláció- és regresszió-számítás

9. lecke: Többváltozós korreláció- és regresszió-számítás

Követelmények

Ön akkor sajátította el megfelelően a tananyagot, ha

  • ha tudja, milyen esetekben használjuk a többváltozós regressziót,
  • mi befolyásolhatja a regressziós paraméterek értékét,
  • mi a parciális rugalmassági együttható,
  • mit jelent a páronkénti és a parciális korrelációs együttható,
  • az adatokból ki tudja számolni a többváltozós regresszió együtthatóit, a rugalmassági együtthatót, a páronkénti-, a parciális- és a többszörös korrelációs együtthatót, a többszörös determinációs együtthatót
Tananyag
9.1. Többváltozós regresszióanalízis

A társadalmi-gazdasági élet jelenségei összetettebbek, bonyolultabbak annál, mint amit két tényező összefüggése kifejez. Egy-egy jelenség változása általában több tényező változásával van összefüggésben. Az eredményváltozóra ható tényezők körének kibővítésével többszörös vagy többváltozós sztochasztikus kapcsolathoz jutunk.

A többváltozós regresszióanalízis segítségével több ismérv eredményváltozóra gyakorolt hatását vizsgáljuk. A kapcsolat az ismérvek száma szerint 3, 4 stb. változós, a függvény típusa szerint pedig lineáris és nem lineáris lehet.

A többváltozós lineáris regressziós modell az alábbi:

Y= β 0 + β 1 x 1 + β 2 x 2 ++ β m x m +ε

Példaként csak 3 változós lineáris kapcsolattal foglalkozunk, de az itt elmondottak akármennyi változóra általánosíthatóak. Három változó esetén a függvényünk az alábbi:

Y'=f(x1;x2)

Azaz a regressziós függvényünk az alábbi lesz:

y = β 0 + β 1 * x 1 + β 2 * x 2

Az egyes paraméterek meghatározásához hasonlóan a kétváltozós regresszióhoz, itt is a legkisebb négyzetek módszerét alkalmazzuk.

Háromváltozós függvény minimumát kell keresni. Ebből meghatározhatóak a regressziós együtthatók.

A statisztikai elemzések során azonban főleg mintával találkozunk és elemzünk, így a minta segítségével becsüljük meg a regressziós függvényt. Ha az Y eredményváltozó értéke valószínűségi változó, de a magyarázóváltozók értékei ismertek, akkor standard lineáris regressziónak nevezzük.

A legkisebb négyzetek módszerét használjuk a becslésre, és a feladat többváltozós szélsőérték számítással oldható meg. Így β becslőfüggvénye az alábbi:

β =(XT*X)-1*XT*y, feltéve, hogy XT*X inverze létezik.

Konkrét minta esetén a normálegyenletek az alábbiak:

  • Σyi=n*b0+b1* Σx1i+b2* Σx2i
  • Σx1i*yi=b0* Σx1i+b1* Σx1i2+b2* Σx1i*x2i
  • Σx2i*yi= b0* Σx2i+b1* Σx1i*x2i+b2* Σx2i2

Vezessünk be új változókat:

  • x1i helyett x 1i x 1 = d 1i
  • x2i helyett x 2i x 2 = d 2i
  • yi helyett y i y = d y

A zérussal egyenlő összegek elhagyása után a normálegyenlet maradványaiból a paraméterek könnyen meghatározhatóak.

A 2. és 3. normálegyenletre:

  • Σd1i*dy=b1* Σd1i2+b2* Σd1i*d2i
  • Σd2i*dy= b1* Σd1i*d2i+b2* Σd2i2

Ebből b1 és b2 könnyen meghatározható, a középiskolában tanult kétismeretes egyenletek megoldása szerint.

Az első egyenletből pedig meghatározható a b0.

b 0 = y b 1 * x 1 b 2 * x 2

A regressziós függvény paramétereinek értelmezése

A becslőfüggvényünk:

y == β 0 + β 1 x 1 + β 2 x 2 .

  • β 1 :Ha x1 értékét egy egységgel növeljük, miközben x2 értékeit változatlanul hagyjuk, akkor az eredményváltozó becsült értéke éppen b1 egységgel változik.
  • β 2 : Az x2 egységnyi növelésével, ha x1 értékét változatlanul hagyjuk, akkor b2 az eredményváltozás becsült értékében bekövetkező hatás.

A regressziós együttható tehát kifejezi, hogy egy adott tényezőváltozó egységnyi növekedése mekkora növekedést vagy csökkenést okoz az eredményváltozó becsült értékében, miközben a másik tényezőváltozók értéke változatlan. A regressziós együtthatók tehát 1-1 tényezőváltozó részleges hatását mutatják, ezért ezeket parciális regressziós együtthatóknaknevezzük.

A paraméterek értelmezésekor fontos hogy a multikollineritást figyelembe vegyük. Multikollineritásnak nevezzük a tényezőváltozók közötti lineáris kapcsolatot. Ez a kapcsolat zavarhatja az eredmények értelmezését.

A parciális regressziós együtthatóhoz hasonlóan a parciális rugalmassági együttható is értelmezhető. Ez a mutató arra ad választ, hogy egy adott tényezőváltozó relatív változása milyen relatív változást eredményez az y eredményváltozóban a másik változók változatlan színvonala mellett. Képlete:

E (y, x j ) = dy d x j * x j y

Regressziós függvényünkre alkalmazva:

E (y, x j ) = b j * x j b 0 + b 1 x 1 + b 2 x 2

Mint látható, a parciális rugalmassági együttható nagysága attól függ, hogy azt a tényezőváltozók milyen színvonala mellett számítjuk ki.

Bemutató feladat

10 elemű minta alapján vizsgáljuk meg a szállítási időtartam (y), a szállítási távolság (x1), és a szállítási tömeg (x2) közötti összefüggést:

sorszámszáll. Időt. (y)száll. Táv. (x1)száll. tömeg. (x2)dyd1d2d12d22d1*d2d1*dyd2*dydy2
11044-17-11-212142218734289
21345-14-11-112111115414196
3822-19-13-4169165224776361
420105-7-5-1251535749
52719504-1161-4000
635207851251540864
722166-510100-5025
840207135125156513169
9452591810310093018054324
1050301023154225166034592529
összesen270150600008285018612482982006
Átlag27156         

A 2. és 3. normálegyenletre:

  • Σd1i*dy=b1* Σd1i2+b2* Σd1i*d2i
  • Σd2i*dy= b1* Σd1i*d2i+b2* Σd2i2
  • 1248=828b1+186b2
  • 298=186b1+50b2

Megoldás a regressziós együtthatókra:

b1=1,025
b2=2,148

b 0 = y b 1 * x 1 b 2 * x 2

b0=27-1,025*15-2,148*6=-1,263

A háromváltozós regresszió becslése:

y'=-1,263+1,025x1+2,148x2

A parciális rugalmassági együttható: az x1 szerinti átlagos rugalmassága:

E (y, x j ) = b j * x j b 0 + b 1 x 1 + b 2 x 2 = 1,025*15 1,259+1,025*15+2,148*6 =0,569

Ez azt jelenti, hogy átlagos szállítási távolság és átlagos szállítandó tömeg esetében 1%-os szállításút növekedés 0,569%-os menetidő növekedést okoz.

az x2 szerinti átlagos rugalmassága:

E (y, x j ) = b j * x j b 0 + b 1 x 1 + b 2 x 2 = 2,148*15 1,259+1,025*15+2,148*6 6=0,477

Ez azt jelenti, hogy átlagos szállítási távolság és átlagos szállítandó tömeg esetében 1%-os szállítási tömegnövekedés 0,477%-os menetidő növekedést okoz.

9.2. Többváltozós korrelációszámítás

Célja a többváltozós korreláció szorosságának mérése. Kettőnél több változó esetén vizsgálható:

  • páronként,
  • továbbá páronként, de a többi változó hatásának kiszűrésével,
  • végül pedig az eredményváltozó és az összes tényezőváltozó közötti szorosság is mérhető.

Páronkénti korrelációs együttható:

Két-két változó közötti szorosságot mérjük. A kiszámított korrelációs együtthatókat az R-korrelációs mátrixba rendezzük.

R=[ r yy .. r y1 .... r ym r 1y .. r 11 .... r 1m . . r my .. r m1 ... r mm ]

Ez egy szimmetrikus mátrix. A mátrix fődiagonálisában szereplő korrelációs együtthatók értéke 1.

R=[ 1.. r y1 ... r y2 ....... r ym .....1..... r 12 ......... r 1m ............1............ r 2m . . .............................1 ]

Y és x1 között: r y1 = Σ d 1 * d y Σ d 1 2 *Σ d y 2

Y és x2 között: r y2 = Σ d 2 * d y Σ d 2 2 *Σ d y 2

x1 és x2 között: r 12 = Σ d 1 * d 2 Σ d 1 2 *Σ d 2 2

Bemutató feladat

r y1 = Σ d 1 * d y Σ d 1 2 *Σ d y 2 = 1248 828*2006 =0,9684

r y2 = Σ d 2 * d y Σ d 2 2 *Σ d y 2 = 298 50*2006 =0,9409

r 12 = Σ d 1 * d 2 Σ d 1 2 *Σ d 2 2 = 186 828*50 =0,9141

R=[ 1...0,9684...0,9409 ..........1.......0,9141 .........................1 ]

Szoros, pozitív irányú kapcsolat van a menetidő és a távolság, illetve a menetidő és a rakomány súlya között. A távolság és a rakomány súlya között is erős a sztochasztikus kapcsolat.

Parciális korrelációs együttható:

Megmutatja, hogy milyen szoros a kapcsolat valamelyik kiválasztott tényező és a függő változó között, ha a többi tényezőváltozó hatását mind a vizsgált tényezőváltozóból, mind az eredményváltozóból kiszűrjük.

Y és x1 között, ha x2 hatását kiszűrjük: r y12 = r y1 r y2 * r 12 (1 r y2 2 )*(1 r 12 2 )

Y és x2 között, ha x1 hatását kiszűrjük: r y21 = r y2 r y1 * r 12 (1 r y1 2 )*(1 r 12 2 )

x1 és x2 között, ha y hatását kiszűrjük: r 12y = r 12 r y1 * r y2 (1 r y1 2 )*(1 r y2 2 )

Bemutató feladat

r y12 = r y1 r y2 * r 12 ( 1 r y2 2 )*( 1 r 12 2 ) = 0,96840,9409*0,9141 ( 1 0,9409 2 )*( 1 0,9141 2 ) =0,7888

r y21 = r y2 r y1 * r 12 (1 r y1 2 )*(1 r 12 2 ) = 0,94090,9684*0,9141 (1 0,9684 2 )*(1 0,9141 2 ) =0,5508

r 12y = r 12 r y1 * r y2 (1 r y1 2 )*(1 r y2 2 ) = 0,91410,9684*0,9409 (1 0,9684 2 )*(1 0,9409 2 ) =0,0343

Látható, hogy lazább a kapcsolat, ha kiszűrjük a másik tényező hatását, a páronkénti kapcsolatot tehát a harmadik változó hatása mindegyik esetben felerősítette.

Többszörös korrelációs együttható

Egy speciális korrelációs együttható, amely az y eredményváltozó és a magyarázóváltozók alapján becsült regressziós értékek kapcsolatának szorosságát méri.

R y1,2,..m = Σ d y *Σ d y' Σ d y 2 *Σ d y' 2

A páronkénti korrelációs együtthatókból is kiszámolható, 3 változós esetben az alábbi:

R y1,2,..m = r y1 2 + r y2 2 2* r y1 * r y2 * r 12 1 r 12 2

A többszörös korrelációs együttható négyzete a többszörös determinációs együttható, amely megmutatja, hogy az eredményváltozó teljes szórásnégyzetéből mekkora a regressziónak tulajdonítható, tehát a magyarázóváltozókkal magyarázható hányad.

Bemutató feladat

R y1,2,..m = r y1 2 + r y2 2 2* r y1 * r y2 * r 12 1 r 12 2 = = 0,9784 2 + 0,9409 2 2*0,9684*0,9409*0,9141 1 0,9141 2 = =0,978

R2=0,95682=95,6%

Önellenőrző feladatok

Jelölje be a helyes állítást!

1/a
A többváltozós regressziós során több ismérv eredményváltozókra gyakorolt hatását vizsgáljuk.
A többváltozós regressziós során több ismérv eredményváltozóra gyakorolt hatását vizsgáljuk.
1/b
A regressziós paraméterek meghatározása a kétváltozós regressziónál megismert képletekkel történik.
A legkisebb négyzetek módszerét használjuk a becslésre, és a feladat többváltozós szélsőérték számítással oldható meg.
1/c
A többváltozós regresszió-számítás során súlyos gond lehet, hogy a magyarázóváltozók között multikollineritást figyelhetünk meg.
A többváltozós regresszió-számítás során a magyarázóváltozók között általában nincs kapcsolat
A többváltozós regresszió-számítás során a magyarázóváltozók között multikollineritást nem kell figyelembe venni.
1/d
A parciális rugalmassági együttható arra ad választ, hogy egy adott tényezőváltozó relatív változása milyen relatív változást eredményez az y eredményváltozóban a másik változók változatlan színvonala mellett
A parciális rugalmassági együttható arra ad választ, hogy egy adott tényezőváltozó relatív változása milyen relatív változást eredményez az y eredményváltozóban a másik változók változása mellett
1/e
A páronkénti korreláció együttható a regressziós függvény illeszkedésének szorosságát fejezi ki.
A páronkénti korreláció együttható két-két változó közötti szorosságot fejez ki.
A páronkénti korreláció együttható megmutatja, hogy milyen szoros a kapcsolat valamelyik kiválasztott tényező és a függő változó között.
1/f
Parciális korrelációs együttható megmutatja, hogy milyen szoros a kapcsolat valamelyik kiválasztott tényező és a függő változó között, ha a többi tényezőváltozó hatását a vizsgált tényezőváltozóból, kiszűrjük.
Parciális korrelációs együttható megmutatja, hogy milyen szoros a kapcsolat valamelyik kiválasztott tényező és a függő változó között, ha a többi tényezőváltozó hatását mind a vizsgált tényezőváltozóból, mind az eredményváltozóból kiszűrjük.
Parciális korrelációs együttható megmutatja, hogy milyen szoros a kapcsolat valamelyik kiválasztott tényező és a függő változó között, ha a többi tényezőváltozó hatását az eredményváltozóból kiszűrjük.

2. Az egy főre jutó GDP, az egy főre jutó nemzetgazdasági beruházás (x1) és az egy főre jutó külföldi befektetések (x2) alakulását (mindegyik mutató: ezer Ft) vizsgálták Magyarország megyéiben és Budapesten. A regresszió számításból az alábbi információk állnak rendelkezésre:

Σy=17418 Σx1=3671 Σx2=3189
Σd1i*dy=653221,7 Σd1i2=310058,9 Σd1i*d2i=399305,6
Σd2i*dy=888869,9 Σd2i2=582563,0 Σdy2=1693809,6
2/a. Határozza meg a többváltozós regressziós függvény paramétereit! Írja be a mezőkbe a megfelelő értékeket 3 tizedesjegy pontossággal!

A β 0 paraméter értéke:
A β 1 paraméter értéke:
A β 2 paraméter értéke:

2/b Írja be a megfelelő értékeket a hiányzó helyekre!

A mennyiben az egy főre jutó nemzetgazdasági beruházás 1 ezer Ft-tal nagyobb, az egy főre jutó GDP átlagosan ezer Ft-tal magasabb, azonos egy főre jutó külföldi tőkebefektetés mellett.

A mennyiben az egy főre jutó külföldi tőkebefektetés 1 ezer Ft-tal nagyobb, az egy főre jutó GDP átlagosan ezer Ft-tal magasabb, azonos az egy főre jutó nemzetgazdasági beruházás mellett.

Nemzetgazdasági beruházás és külföldi tőkebefektetés nélkül a becsült egy főre jutó GDP ezer Ft.

2/c. Határozza meg a parciális rugalmassági együtthatókat! Írja be a mezőkbe a megfelelő értékeket 3 tizedesjegy pontossággal!

E(y; x1):
E(y; x2):

2/d. Írja be a megfelelő értékeket a hiányzó helyekre!

Az egy főre jutó külföldi tőkebefektetés átlagos értékének 1%-os növekedése átlagosan %-os egy főre jutó GDP növekedést eredményez, azonos egy főre jutó nemzetgazdasági beruházás mellett.

Az egy főre jutó nemzetgazdasági beruházás átlagos értékének 1%-os növekedése átlagosan %-os egy főre jutó GDP növekedést eredményez, azonos egy főre jutó külföldi tőkebefektetés mellett.

2/e Határozza meg a páronkénti korrelációs együtthatókat! Írja be a mezőkbe a megfelelő értékeket 3 tizedesjegy pontossággal!

ry1=
ry2=
r12=

2/f. Írja be a megfelelő értékeket a hiányzó helyekre!

Az egy főre jutó nemzetgazdasági beruházás és az egy főre jutó külföldi tőkebefektetés között szoros pozitív irányú kapcsolat van, a korrelációs együttható .

Az egy főre jutó nemzetgazdasági beruházás és az egy főre jutó GDP között szoros pozitív irányú kapcsolat van, a korrelációs együttható .

Az egy főre jutó külföldi tőkebefektetés és az egy főre jutó GDP között szoros pozitív irányú kapcsolat van, a korrelációs együttható .

2/g. Határozza meg a parciális korrelációs együtthatókat! Írja be a mezőkbe a megfelelő értékeket 3 tizedesjegy pontossággal!

ry1.2=
ry2.1=
r12.y=

2/h. Írja be a megfelelő értékeket a hiányzó helyekre!

Az egy főre jutó nemzetgazdasági beruházás és az egy főre jutó külföldi tőkebefektetés nagysága között laza pozitív irányú kapcsolat van, az egy főre jutó GDP hatását kiszűrve a korrelációs együttható .

Az egy főre jutó nemzetgazdasági beruházás és az egy főre jutó GDP nagysága között laza pozitív irányú korreláció van, az egy főre jutó külföldi tőkebefektetés hatását kiszűrve a korrelációs együttható .

Az egy főre jutó külföldi tőkebefektetés és az egy főre jutó GDP nagysága között laza pozitív irányú kapcsolat van, az egy főre jutó nemzetgazdasági beruházás hatását kiszűrve a korrelációs együttható .

2/i. Határozza meg a többszörös korrelációs és determinációs együtthatókat! Írja be a mezőkbe a megfelelő értékeket 3 tizedesjegy pontossággal!

Többszörös korrelációs együttható:
Többszörös determinációs együttható:

2/j Írja be a megfelelő értéket a hiányzó helyre!

Az egy főre jutó nemzetgazdasági beruházás és az egy főre jutó külföldi tőkebefektetés együttesen %-ban magyarázza az egy főre jutó GDP szóródását.