KURZUS: Közlekedésstatisztika

MODUL: V. modul: Ismérvek közötti kapcsolatok

13. lecke: A sztochasztikus kapcsolatok

Követelmények

Ön akkor sajátította el megfelelően a tananyagot, ha

  • Felismeri a sztochasztikus kapcsolatokat leíró helyes definíciót.
  • A fogalmakhoz párosítani tudja azok jelentését (asszociáció, vegyes kapcsolat, korreláció)
  • Felsorolásból ki tudja választani, mikor használható a Yule-féle együttható.
  • Felsorolásból ki tudja választani, mikor használható a Csuprov-féle együttható. (Ez a modulzáróban jön elő)
  • Felsorolásból ki tudja választani, mikor használható és milyen formában fejezhető ki a H-mutató. (Ez a modulzáróban jön elő)
  • Felsorolásból ki tudja választani az asszociáció jelentését.
  • Önállóan meg tudja határozni a Yule-féle együttható értékét.
  • A kiszámított adat alapján felsorolásból ki tudja választani két ismérv közötti kapcsolat szorosságát.
  • Megadott adatok alapján ki tudja tölteni a kontingencia-táblázatot.
  • Felsorolásból ki tudja választani a belső szórás fogalmát.
  • Felsorolásból ki tudja választani a H-mutató jelentését.
  • Felsorolásból ki tudja választani a H-mutató lehetséges értékeit.
  • Ki tudja számolni a belső szórást, a külső szórást, a H-mutató és a H2-mutató értékét.
  • Felsorolásból ki tudja választani a H-mutató és a H2-mutató adott értékének jelentését.
  • Felsorolásból ki tudja választani, minek a jellemzésére alkalmas a korrelációs együttható,
  • Listából ki tudja választani a korrelációs együttható lehetséges értékeit,
  • Adott ismérvekről el tudja dönteni, milyen korrelációs együtthatóval jellemezhetők,
  • Ki tudja választani a korrelációszámításra alkalmas feladatokat, ehhez nem találtam kérdést
  • Adott adatsor alapján ki tudja számítani a korrelációs együtthatót.
  • Ki tudja számolni és értelmezni az előjelkorrelációs együtthatót. Ehhez nem találtam kérdést
  • Ki tudja számolni a rangkorrelációs együtthatót.
Tananyag

Ha egy sokaságot statisztikai módszerekkel vizsgálunk, akkor többféle szempont (ismérv) alapján is csoportosíthatjuk (pl. a hallgatókat: nem, magasság, tanulmányi átlag, stb.). A különféle csoportosításokkal kapcsolatban feltehető a kérdés, hogy mutatnak-e ezek hasonlóságot, azonosságot, vagy teljesen más jellegűek. Ha a vizsgált sokaság különböző ismérvek alapján feltáruló szerkezete hasonlóságot, azonosságot mutat, akkor ismérvek közötti kapcsolatról beszélünk. Ez a kapcsolat lehet:

  • sztochasztikus jellegű: statisztikai valószínűségen alapuló,
  • teljes meghatározottságú: pl. a születési év és az életkor között.

Sztochasztikus (valószínűségi) kapcsolatnak nevezzük az olyan összefüggést, amikor az egyik jelenség egy másik jelenségre hatással van, de nem határozza meg egyértelműen annak alakulását, mert arra más tényezők is hatnak.

Két minőségi ismérv (pl. iskolai végzettség és beosztás), vagy két területi ismérv (születési hely és lakhely), vagy egy minőségi és egy területi ismérv (választott szak és a gyakorlati hely) közötti kapcsolat elemzésére szolgál. Az említett esetekben nem számadatokkal megfogalmazható ismérvek alapján történt a csoportosítás.

13.1 Asszociáció

Az asszociáció (ismérvek közötti kapcsolat) kimutatása érdekében a sokaság elemeit úgynevezett kontingencia táblába rendezzük. Két ismérv esetén a tábla a következő:

Ismérvek12 Σ
1f11f12f1.
2f21f22f2.
Σf.1f.2n
Bemutató példa

Egy vállaltnál 50 diplomás dolgozik, és közülük 15 a nő. A középfokú végzettségűek létszáma  150, és ebből 60 a nő. Rendezzük az adatokat táblázatba:

IsmérvekDiplomásKözépfokú végzettségűÖsszesen
Férfi3590125
156075
Összesen50150200

Kettőnél több ismérvváltozat esetén értelemszerűen több sor vagy oszlop lesz a kontingencia táblázatban.

Az asszociációs mutatók a következők lehetnek:

  • Yule-féle
  • Csuprov-féle
  • Cramer-féle.
13.1.1.Yule-féle asszociációs együttható

Csak alternatív (azaz két ismérv) ismérvek esetén használható. Alapgondolata a függetlenséghez kapcsolódik. Két egymástól független esemény együttes bekövetkezésének valószínűsége egyenlő a két esemény bekövetkezési valószínűségének szorzatával:

f 1 n f 1 n = f 11 n

Mivel alternatívak az ismérvek, ezért a függetlenség az alábbi:

f 11 f 21 = f 12 f 22

ha f11*f22-f21*f12=0, akkor nincs kapcsolat.

Minden nullától való eltérés esetén kiszámítható a kapcsolat szorossága.

a= f 11 f 22 f 21 f 12 f 11 f 22 + f 21 f 12 vagy a= g 11 g 22 g 21 g 12 g 11 g 22 + g 21 g 12

1a1

A '0' a kapcsolat hiányát, azaz a függetlenséget jelenti. Az 1 pedig a teljes meghatározottságot. Ha | a |>0,7 , akkor a kapcsolat szorossága már erősnek mondható.

Bemutató feladat

A hallgatókat a szakterület és a karriercéllal való rendelkezés alapján csoportosítottuk:

szakKarrier cél
VannincsÖsszesen
mérnök3268100
közgazdász2278100
Összesen54146200

1. Vizsgálja meg, hogy van e kapcsolat a hallgató szakterülete és a karrier céllal való rendelkezés között?
2. Mit jelent a kiszámított mutató?

a= 32782268 3278+2268 =0,25

A vizsgált hallgatói körben a szakterület és a karrier céllal rendelkezés között gyenge kapcsolat van.

13.1.2. Csuprov-féle asszociációs együttható

Ha az ismérvváltozatok száma kettőnél több, akkor használjuk. Ez is a függetlenségvizsgálathoz kapcsolódik.

T= χ 2 n (s1)(t1)

T: Csuprov-féle együttható,
s: az egyik ismérv változatainak száma
t: a másik ismérv változatainak száma
n: a sokaság elemszáma

χ 2 = i=1 s j=1 t ( f ij f ij * ) 2 f ij *       f ij * = f i. f .j n

fij: tapasztalati gyakoriság
fij*: elméleti gyakoriság

ha s<t  0T s1 t1 4

Ha s=t, akkor T=1, azaz az ismérvek között összefüggés nagyon intenzív. Általában úgy válasszuk meg az ismérvek jelölését, hogy s<t legyen.

Bemutató feladat

A hallgatókat a szakterület és az oktatással való elégedettség rendelkezés alapján csoportosítottuk:

elégedettségSzakÖsszesen
MérnökKözgazdász főisk.Közgazdász egyetemjogász
Nem tudja69839953304
Nem elégedett125626599
elégedett19913542187
Összesen100230160100590

Elméleti előfordulások számítása: f ij * = f i. f .j n

f 11 * = 100*304 590 =51,5     f 12 * = 230*304 590 =118,5     f 31 * = 100*187 590 =31,7 stb.

elégedettségSzakÖsszesen
MérnökKözgazdász főisk.Közgazdász egyetemjogász
Nem tudja51,5118,582,551,5304
Nem elégedett16,838,626,816,899
elégedett31,772,950,731,7187
Összesen100230160100590

χ 2 = i=1 s j=1 t ( f ij f ij * ) 2 f ij * = (6951,5) 2 51,5 =5,95

A χ 2 összetevői:

elégedettségSzakÖsszesen
MérnökKözgazdász főisk.Közgazdász egyetemjogász
Nem tudja5,9510,643,300,0419,93
Nem elégedett1,377,8400,028,2917,52
elégedett5,094,494,863,3517,79
Összesen12,4122,978,1811,6855,24

T= χ 2 n (s1)(t1) = 55,24 590* (31)*(41) =0,1955

Ki kell számolni a T-intervallumát:

T= 31 41 4 =0,9036

azaz, 0T0,9036

A szakterület és az oktatással való elégedettség között gyenge a kapcsolat (T=0,1955).

13.1.3. Cramer-féle asszociációs együttható

Az asszociációs összefüggések térbeli vagy időbeli összehasonlításakor gondot okozhat, hogy ugyanazon ismérv változatainak száma nem azonos a két helyen vagy a két időpontban (az előző bemutató példában, ha a jogászok nem minden kérdésre válaszolnak). Ilyen esetben a Csuprov-féle asszociációs együttható nem használható az elemzés során, helyette a Cramer-féle asszociációs együtthatót használjuk.

C= χ 2 n*(s1)

0C1

13.2. Vegyes kapcsolat

Ha egy vizsgált sokaságot egy mennyiségi ismérv és egy minőségi ismérv alapján is felosztunk, és arra keressük a választ, hogy a két felosztás között, azaz a két ismérv között van-e összefüggés, akkor egy vegyes kapcsolatot elemzünk. A kapcsolat meglétét, vagy annak hiányát a H-mutató segítségével határozhatjuk meg.

Az összetett sokaságot felosztjuk részsokaságokra, és megvizsgáljuk:

1.a teljes szórást σ T (az egyedi adatok és a főátlag eltérése).
2.a külső szórást σ K (a részátlag és a főátlag eltérése).
3.a belső szórást σ B (az egyedi értékek és a saját részátlaguk eltérése).

σ T 2 = σ K 2 + σ B 2

Ez az összefüggés lehetővé teszi, hogy egy vegyes kapcsolat jellemzésére alkalmas mutatót képezzünk:

H= σ K σ T = 1- σ B 2 σ T 2

0H1

A kapcsolat jellemzésére a mutató négyzetét is használhatjuk (H2), amelyet százalékos formában adunk meg. A mutató arra ad választ, hogy hány százalékban magyarázza a csoportosító ismérv (minőségi vagy területi) a sokaság mennyiségi ismérv szerinti szóródását.

H 2 = σ K 2 σ T 2

Bemutató feladat

A hallgatók szakok szerinti csoportosításban az alábbi eredményt érték el egy vizsgán. A maximálisan elérhető pontszám 100 pont volt.

SzakHallgatók száma (fő)Az elért eredményük átlagpontszámaAz eredmények szórás
Közgazdász20635,6
Jogász30605,9
Mérnök25506,4

Számítsa ki az adatok alapján a belső-, a külső és a teljes szórást, majd értelmezze azokat!

A vizsga átlagpontszáma: x = f i x i f i = 20*63+30*60+25*50 20+30+25 =57,47

A belső szórásnégyzet: σ B 2 = n j * σ j 2 n = 20* 5,6 2 +30* 5,9 2 +25* 6,4 2 20+30+25 =35,94

A belső szórás: σ B = σ B 2 = 35,94 =5,995 .

A külső szórásnégyzet: σ K 2 = Σ n j * ( x j ¯ x ¯ ) 2 n = 20* (6357,47) 2 +30* (6057,47) 2 +25* (5057,47) 2 20+30+25 =29,32

A külső szórás: σ K = σ K 2 = 29,32 =5,415 ,

A teljes szórásnégyzet: σ T 2 = σ B 2 + σ K 2 =35,94+29,32=65,26

A teljes szórás: σ= σ 2 = 65,26 =8,078 ,

H= σ K σ T = 5,415 8,078 =0,6703     H 2 =0,4493=44,93%

A szak és a vizsgán elért pontszám között közepes erősségű a kapcsolat. A szakterülethez való tartozás 44,93%-ban befolyásolja az elért pontszámok szóródását.

13.3. Korreláció

Mennyiségi ismérvek közötti sztochasztikus kapcsolat számszerű jellemzésével és elemzésével a korrelációszámítás foglalkozik.

Feladata:

  • Megállapítani, hogy a két ismérv között valóban fennáll e a kapcsolat, és ha van kapcsolat, akkor az milyen jellegű.
  • A két ismérv között lévő kapcsolat szorosságának a megállapítása.

Két mennyiségi ismérv esetén (x;y), a változók közötti kapcsolat erősségét a korrelációs együttható (r) fejezi ki. Értéke -1és +1 között lehet. Ha r negatív, akkor a két változó ellentétes irányban változik.

0,9 felett igen szoros
0,7-0,9 szoros
0,6-07 közepes
0,5-0,6 gyenge
0,4 alatt laza

13.3.1. Előjel korreláció

Az összetartozó értékpárok átlagtól való eltérései előjele alapján méri a kapcsolat szorosságát.

r e = pq p+q

  • ahol p jelenti azoknak az értékpároknak a számát, amelyeknek az átlagtól való eltéréseik előjele megegyezik.
  • ahol q jelenti azoknak az értékpároknak a számát, amelyeknek az átlagtól való eltéréseik előjele eltérő.

Előnye, hogy kevés számítással, gyorsan tájékozódhatunk két mennyiségi ismérv közötti kapcsolat meglétéről és annak mértékéről.

Hátránya azonban, hogy csak "durva" mérőszám, ezért pontosabb elemzéshez nem használható.

Bemutató feladat

Vizsgáljuk meg, hogy van e összefüggés az egy főre eső GDP (euro) és az 1000 lakosra jutó személygépkocsik számának alakulása között néhány európai ország adatai alapján.

S.szám.1 főre jutó GDP Az Eu országaibanÁtlagtól való eltérés előjele1000 lakosra jutó személygk. számaÁtlagtól való eltérés előjele
1.22380+412+
2.20880+403+
3.25930+310-
4.7290-170-
5.2970-200-
6.23030+485+
7.20460+521+
8.7450-205-
9.13970-335-
10.36080+449+
átlag18044349

p=9, q=1, tehát szoros a kapcsolat

13.3.2. Rangkorreláció

Ha lehetőségünk van minőségi ismérvek kvantitatív jellemzésére oly módon, hogy az ismérvváltozatokat rangsoroljuk, akkor a rangsor már alkalmas a két minőségi ismérv sztochasztikus kapcsolatának elemzésére.

Ezt a korrelációs együtthatót rangsorkorrelációs vagy Spearman-féle korrelációs együtthatónak nevezzük.

r r =1 6 D i 2 n( n 2 1)     D i 2 = ( x i y i ) 2

ahol
Di=xi-yi
n: pedig az elemek száma

Bemutató feladat

Arra keressük a választ, hogy a tehenek fejéskori és etetéskori viselkedése között (nyugtalanság) van-e valamilyen összefüggés.

SorszámFejés alatti nyugtalanságEtetéskori nyugtalanságDD2
15411
268-24
310739
49900
512-11
62111
735-24
87611
9810-24
104311
Össz.26

r r =1 6 D i 2 n( n 2 1)

r r =1 6*26 10( 10 2 1) =0,84 , a tehenek fejéskori és etetéskori viselkedése között szoros az összefüggés.

Önellenőrző feladatok
1. Válassza ki a 3 helyes választ úgy, hogy egy igaz állítást kapjunk!
Sztochasztikus kapcsolatnak nevezzük az olyan összefüggés, amikor
két jelenség egymásra hatással van,
egyik jelenség egy másik jelenségre hatással van,
de az egyik jelenség nem határozza meg egyértelműen a másik jelenség alakulását,
és az egyik jelenség egyértelműen meghatározza a másik jelenség alakulását,
mert a másik jelenségre egyéb tényezők nem hatnak.
mert a másik jelenségre egyéb tényezők is hatással vannak.
2. Jelölje meg a helyes választ!
A Yule-féle assziciációs együttható több ismérv esetén is használható.
A Yule-féle assziciációs együttható alternatív ismérvek esetén használható.
3. A rangkorrelációs együttható segítségével
mennyiségi ismérvek közötti kapcsolatot jellemezhetünk.
minőségi ismérvek közötti kapcsolatot jellemezhetünk.
területi ismérvek közötti kapcsolatot jellemezhetünk.
4. Az előjelkorreláció...
az értékek átlagtól való eltérését mutatja
az értékek átlagtól való eltérésének előjele alapján számolható.

5. Egy városban terjesztett időszaki lapok megoszlása 2005-ben

Terjesztés módjaNapilapokHetilapokÖsszesen
Árusítás9875173
Előfizetés8627113
Összesen184102286
5/a. Állapítsa meg a Yule-féle asszociációs együttható értékét! A számítást 3 tizedesjegy pontossággal végezze!

Yule-féle asszociációs együttható:

6. Egy vállalkozás 4 különböző (A, B, C, D) telephelyének azonos termékeiből 300 darabot vizsgáltak meg és ezeket osztályokba sorolták. A vizsgálat eredménye a következő:

Minőségtelephelyekösszesen
ABCD
I. osztályú125443224225
II. osztályú75194475
Összesen132495168300

Döntse el, hogy melyik mutatót lehet kiszámítani, és állapítsa meg, van-e kapcsolat a termék gyártási helye és minősége között!

A feladat megoldása érdekében először az alábbi tábla alapján írja be a megfelelő adatot a megadott mezőbe!

Számított adatok (függetlenség feltételezése melletti elméleti adatok)

Minőségtelephelyekösszesen
ABCD
I. osztályúa
II. osztályú
Összesen
6/a. Milyen szám kerül a táblázatban az "a"-val jelölt cellába?
7
25
99
104

A kapcsolatot jellemző mutatóhoz szükséges adatok:

MinőségTelephelyekösszesen
ABCD
I. osztályúa
II. osztályú
Összesen94,3
6/b. Milyen adat kerül a táblában az "a"-val jelölt cellába?
0,23
6,8
6,7
7,3
6/c. Számítsa ki a kapcsolatot jellemző Csuprov-féle asszociációs együttható értékét! (2 tizedesjegy pontossággal)
0,12
0,22
0,43
0,45

7. Egy város vendéglátóhelyeit csoportosítottuk aszerint, hogy milyen szolgáltatást nyújtanak. Az üzletek éves forgalmi adatai millió Ft-ban a következők:

ÉtteremVendéglőKávézó
1.20,811,415,2
2.3,87,47,0
3.19,40,214,4
4.12,21,61,2
5.1,49,67,6
6.4,63,80,4
7.15,28,611,6
8.9,010,-
9.4,0--
10.11,8--
Átlag10,2206,5758,200
szórás6,46683,90575,4856
7/a. Számítsa ki az előző feladatból a következőket! Az átlagot 3 tizedesjeggyel, a szórásokat pedig 4 tizedesjegy pontossággal!

Vendéglátó ipari egységek átlagos forgalma millió Ft.
A sokaság szórás millió Ft
A belső szórás millió Ft
A külső szórás millió Ft.

7/b. Állapítsa meg a kapcsolat szorosságát kifejező mutató értékét! (3 tizedesjegy pontossággal).

A H mutató

7/c. Állapítsa meg a befolyásolás mértékét kifejező mutató értékét! (2 tizedesjegy pontossággal).

A H2 mutató %

8. Az ősziárpa-termesztéssel kapcsolatos kísérletek során megvizsgálták a felhasznált vetőmag mennyisége és a termésmennyiség közötti összefüggést.

Vetőmag mennyisége (kg/ha)Termés mennyisége (t/ha)
2404,75
1804,40
2804,80
2104,60
2204,65
1904,45
3104,80
2554,80
2954,82
2304,70
Egészítse ki a mondatokat a megfelelő eredménnyel! A számításokat a vetőmag felhasználásnál egészszámmal, a korrelációnál 1 tizedesjegy pontossággal adja meg!

Az átlagos vetőmag felhasználás kg/ha.
Az átlagtermés t/ha
A korrelációs együttható értéke:

9. Tíz ország egy főre jutó GDP-je és az ezer lakosra jutó személygépkocsik száma az alábbi.

1 főre jutó GDP alapján a rangsor100 lakosra jutó személygépkocsik száma alapján a rangsor
1.2
2.3
3.5
4.1
5.4
6.9
7.6
8.8
9.10
10.7
Állapítsa meg a korrelációs együttható értékét! A számítást 4 tizedesjegy pontossággal végezze!

A korrelációs együttható: