KURZUS: Statisztika I.

MODUL: IV. modul: Ismérvek közötti kapcsolatok

8. lecke: Asszociáció

Követelmények

Ön akkor sajátította el megfelelően a tananyagot, ha

  • felismeri a sztochasztikus kapcsolatokat leíró helyes definíciót;
  • a fogalmakhoz párosítani tudja azok jelentését (asszociáció, vegyes kapcsolat, korreláció);
  • felsorolásból ki tudja választani, mikor használható a Yule-féle együttható;
  • felsorolásból ki tudja választani, mikor használható a Csuprov-féle együttható (ez a modulzáróban jön elő);
  • felsorolásból ki tudja választani, mikor használható és milyen formában fejezhető ki a H-mutató (ez a modulzáróban jön elő);
  • felsorolásból ki tudja választani az asszociáció jelentését;
  • önállóan meg tudja határozni a Yule-féle együttható értékét;
  • a kiszámított adat alapján felsorolásból ki tudja választani két ismérv közötti kapcsolat szorosságát;
  • megadott adatok alapján ki tudja tölteni a kontingenciatáblázatot.
Tananyag

Ha egy sokaságot statisztikai módszerekkel vizsgálunk, akkor többféle szempont (ismérv) alapján is csoportosíthatjuk (pl. a hallgatókat: nem, magasság, tanulmányi átlag stb.). A különféle csoportosításokkal kapcsolatban feltehető a kérdés, hogy mutatnak-e ezek hasonlóságot, azonosságot, vagy teljesen más jellegűek. Ha a vizsgált sokaság különböző ismérvek alapján feltáruló szerkezete hasonlóságot, azonosságot mutat, akkor ismérvek közötti kapcsolatról beszélünk. Ez a kapcsolat lehet:

  • sztochasztikus jellegű: statisztikai valószínűségen alapuló,
  • teljes meghatározottságú: pl. a születési év és az életkor között.

Sztochasztikus (valószínűségi) kapcsolatnak nevezzük az olyan összefüggést, amikor az egyik jelenség egy másik jelenségre hatással van, de nem határozza meg egyértelműen annak alakulását, mert arra más tényezők is hatnak.

Két minőségi ismérv (pl. iskolai végzettség és beosztás), vagy két területi ismérv (születési hely és lakhely), vagy egy minőségi és egy területi ismérv (választott szak és a gyakorlati hely) közötti kapcsolat elemzésére szolgál. Az említett esetekben nem számadatokkal megfogalmazható ismérvek alapján történt a csoportosítás.

Az asszociáció (ismérvek közötti kapcsolat) kimutatása érdekében a sokaság elemeit úgynevezett kontingenciatáblába rendezzük. Két ismérv esetén a tábla a következő:

Ismérvek12 Σ
1f11f12f1.
2f21f22f2.
Σ f.1f.2n
Bemutató példa

Egy vállaltnál 50 diplomás dolgozik, és közülük 15 a nő. A középfokú végzettségűek létszáma 150, és ebből 60 a nő. Rendezzük az adatokat táblázatba:

IsmérvekDiplomásKözépfokú végzettségűÖsszesen
Férfi3590125
156075
Összesen50150200

Kettőnél több ismérvváltozat esetén értelemszerűen több sor vagy oszlop lesz a kontingencia táblázatban.

Az asszociációs mutatók a következők lehetnek:

  • Yule-féle
  • Csuprov-féle
  • Cramer-féle.
8.1.Yule-féle asszociációs együttható

Csak alternatív (azaz két ismérv) ismérvek esetén használható. Alapgondolata a függetlenséghez kapcsolódik. Két egymástól független esemény együttes bekövetkezésének valószínűsége egyenlő a két esemény bekövetkezési valószínűségének szorzatával:

f 1 n f 1 n = f 11 n

Mivel alternatívak az ismérvek, ezért a függetlenség az alábbi:

f 11 f 21 = f 12 f 22

ha f11*f22-f21*f12=0, akkor nincs kapcsolat.

Minden nullától való eltérés esetén kiszámítható a kapcsolat szorossága.

a= f 11 f 22 f 21 f 12 f 11 f 22 + f 21 f 12 vagy a= g 11 g 22 g 21 g 12 g 11 g 22 + g 21 g 12

1a1

A '0' a kapcsolat hiányát, azaz a függetlenséget jelenti. Az 1 pedig a teljes meghatározottságot. Ha | a |>0,7 , akkor a kapcsolat szorossága már erősnek mondható.

Bemutató feladat

A hallgatókat a szakterület és a karriercéllal való rendelkezés alapján csoportosítottuk:

SzakKarrier cél
VannincsÖsszesen
mérnök3268100
közgazdász2278100
Összesen54146200
1.Vizsgálja meg, hogy van e kapcsolat a hallgató szakterülete és a karrier céllal való rendelkezés között?
2.Mit jelent a kiszámított mutató?

a= 32782268 3278+2268 =0,25

A vizsgált hallgatói körben a szakterület és a karrier céllal rendelkezés között gyenge kapcsolat van.

8.2. Csuprov-féle asszociációs együttható

Ha az ismérvváltozatok száma kettőnél több, akkor használjuk. Ez is a függetlenségvizsgálathoz kapcsolódik.

T= χ 2 n (s1)(t1)

T: Csuprov-féle együttható,
s: az egyik ismérv változatainak száma
t: a másik ismérv változatainak száma
n: a sokaság elemszáma

χ 2 = i=1 s j=1 t ( f ij f ij * ) 2 f ij *       f ij * = f i. f .j n

fij: tapasztalati gyakoriság
fij*: elméleti gyakoriság

ha s<t  0T s1 t1 4

Ha s=t, akkor T=1, azaz az ismérvek között összefüggés nagyon intenzív. Általában úgy válasszuk meg az ismérvek jelölését, hogy s<t legyen.

Bemutató feladat

A hallgatókat a szakterület és az oktatással való elégedettség rendelkezés alapján csoportosítottuk:

ElégedettségSzak
MérnökKözgazdász főisk.Közgazdász egyetemjogászÖsszesen
Nem tudja69839953304
Nem elégedett125626599
elégedett19913542187
Összesen100230160100590

Elméleti előfordulások számítása: f ij * = f i. f .j n

f 11 * = 100*304 590 =51,5     f 12 * = 230*304 590 =118,5     f 31 * = 100*187 590 =31,7 stb.

ElégedettségSzak
MérnökKözgazdász főisk.Közgazdász egyetemjogászÖsszesen
Nem tudja51,5118,582,551,5304
Nem elégedett16,838,626,816,899
elégedett31,772,950,731,7187
Összesen100230160100590

χ 2 = i=1 s j=1 t ( f ij f ij * ) 2 f ij * = (6951,5) 2 51,5 =5,95

A χ 2 - összetevői:

ElégedettségSzak
MérnökKözgazdász főisk.Közgazdász egyetemjogászÖsszesen
Nem tudja5,9510,643,300,0419,93
Nem elégedett1,377,8400,028,2917,52
elégedett5,094,494,863,3517,79
Összesen12,4122,978,1811,6855,24

T= χ 2 n (s1)(t1) = 55,24 590* (31)*(41) =0,1955

Ki kell számolni a T-intervallumát:

T= 31 41 4 =0,9036

azaz, 0T0,9036

A szakterület és az oktatással való elégedettség között gyenge a kapcsolat (T=0,1955).

8.3. Cramer-féle asszociációs együttható

Az asszociációs összefüggések térbeli vagy időbeli összehasonlításakor gondot okozhat, hogy ugyanazon ismérv változatainak száma nem azonos a két helyen vagy a két időpontban (az előző bemutató példában, ha a jogászok nem minden kérdésre válaszolnak). Ilyen esetben a Csuprov-féle asszociációs együttható nem használható az elemzés során, helyette a Cramer-féle asszociációs együtthatót használjuk.

C= χ 2 n*(s1)

0C1

Önellenőrző feladatok
1. Válassza ki a 3 helyes választ úgy, hogy egy igaz állítást kapjunk!
Sztochasztikus kapcsolatnak nevezzük az olyan összefüggés, amikor
két jelenség egymásra hatással van,
egyik jelenség egy másik jelenségre hatással van,
de az egyik jelenség nem határozza meg egyértelműen a másik jelenség alakulását,
és az egyik jelenség egyértelműen meghatározza a másik jelenség alakulását,
mert a másik jelenségre egyéb tényezők nem hatnak.
mert a másik jelenségre egyéb tényezők is hatással vannak.
2. Jelölje meg a helyes választ!
A Yule-féle assziciációs együttható több ismérv esetén is használható.
A Yule-féle assziciációs együttható alternatív ismérvek esetén használható.

Fejezze be a mondatot!

3. Az asszociáció...
mennyiségi ismérvek közötti kapcsolatot jelent.
minőségi ismérvek közötti kapcsolatot jelent.
mennyiségi és minőségi ismérvek közötti kapcsolatot jelent.
Egy városban terjesztett időszaki lapok megoszlása 2005-ben
Terjesztés módjaNapilapokHetilapokÖsszesen
Árusítás9875173
Előfizetés8627113
Összesen184102286
4/a. Állapítsa meg a Yule-féle asszociációs együttható értékét! A számítást 3 tizedesjegy pontossággal végezze!

Yule-féle asszociációs együttható:

4/b. Válassza ki a helyes megfogalmazást!
A két ismérv között szoros a kapcsolat.
A két ismérv között közepes erősségű a kapcsolat.
A két ismérv között gyenge a kapcsolat erőssége.

5. Egy vállalkozás 4 különböző (A, B, C, D) telephelyének azonos termékeiből 300 darabot vizsgáltak meg és ezeket osztályokba sorolták. A vizsgálat eredménye a következő:

Minőségtelephelyekösszesen
ABCD
I. osztályú125443224225
II. osztályú75194475
Összesen132495168300

Döntse el, hogy melyik mutatót lehet kiszámítani, és állapítsa meg, van-e kapcsolat a termék gyártási helye és minősége között!

A feladat megoldása érdekében először az alábbi tábla alapján írja be a megfelelő adatot a megadott mezőbe!

Számított adatok (függetlenség feltételezése melletti elméleti adatok)

Minőségtelephelyekösszesen
ABCD
I. osztályúa
II. osztályú
Összesen
5/a. Milyen szám kerül a táblázatban az "a"-val jelölt cellába?
7
25
99
104

A kapcsolatot jellemző mutatóhoz szükséges adatok:

MinőségTelephelyekösszesen
ABCD
I. osztályúa
II. osztályú
Összesen94,3
5/b. Milyen adat kerül a táblában az "a"-val jelölt cellába?
0,23
6,8
6,7
7,3
5/c. Számítsa ki a kapcsolatot jellemző Csuprov-féle asszociációs együttható értékét!
0,12
0,22
0,43
0,45
5/d. Válassza ki a helyes megfogalmazást!
Az ismérvek között szoros a kapcsolat.
Az ismérvek között közepes erősségű a kapcsolat.
Az ismérvek között gyenge a kapcsolat erőssége.