MODUL: III. modul: Kérdőív, mintavétel, adatgyűjtés, statisztikai elemzések
12. lecke: Egy- és többváltozós elemzések
| Cél |
Ha sikeresen elsajátítja a lecke tartalmát, akkor képes lesz arra, hogy a statisztika kőkemény világában stabil lábakon álljon. Azáltal, hogy felismeri a különböző változók metrikus vagy nem metrikus jellegét már magabiztosan kiválaszthatja a változók közötti kapcsolat mérésére megfelelő statisztikai módszereket a hozzájuk tartozó statisztikákkal és kapcsolati mutatókkal együtt. |
Követelmények |
A leckét elsajátította, ha képes: |
- adott mutatóról eldönteni, hogy milyen adatok esetén használható;
- eldönteni, hogy különböző metrikus, illetve nem metrikus változók esetén milyen statisztikai módszerek alkalmazhatók;
- adott mutatóról eldönteni, hogy az melyik típusba (helyzet-, szóródási- vagy alakmutató) sorolható;
- összekapcsolni a mutatószámokat a jellemzőikkel;
- eldönteni, hogy adott mutatók adott skálák esetén alkalmazhatók-e;
- eldönteni a statisztikai módszerekkel kapcsolatos állítások helyességét;
- adott táblázatból ki tudja keresni a leíró statisztikai adatokat;
|
Fogalmak |
- átlag,
- csúcsosság,
- egyváltozós elemzés,
- ferdeség,
- független változó,
- függő változó,
- kereszttábla,
- khi-négyzet próba,
- korreláció,
- medián,
- módusz,
- regresszióelemzés,
- szórás,
- terjedelem,
- variancia,
- varianciaelemzés.
|
Időszükséglet |
120 perc |
Tevékenység |
Olvassa el a 11.1., 11.2. fejezetet (TK. 249.-254. oldalig), és válaszoljon az alábbi kérdésekre! |
1. | Milyen módszereket alkalmazhatunk a függő és független változók különböző kombinációi alapján? | 2. | Mi az egyváltozós elemzés lényege, célja? | 3. | Melyek a helyzetmutatók? | 4. | Mit mutat meg az átlag? Mikor alkalmazható? | 5. | Mi a medián? Mikor alkalmazható? | 6. | Mi a módusz? Mikor alkalmazható? | 7. | Melyek a szóródási mutatószámok? | 8. | Mi a terjedelem? | 9. | Mi a szórás? | 10. | Mi a variancia? | 11. | Melyek az alakmutató számok? | 12. | Mi a csúcsosság? Mit mutatnak meg az értékei? | 13. | Mi a ferdeség? Mit mutatnak meg az értékei? | 14. | Milyen egyéb mutatószámokat ismer? | 15. | Milyen mutatókat alkalmazhat nominális skálánál? | 16. | Milyen mutatókat alkalmazhat ordinális skálánál? | 17. | Milyen mutatókat alkalmazhat intervallum/arány skáláknál? | 18. | Olvassa el "A gyógyszertári adatbázis" szemelvényt, és azonosítsa a különböző egyváltozós mutatókat az olvasottak alapján! |
|
A fejezetrész tartalmi összefoglalója |
Az alkalmazott statisztikai módszerek a változók jellegétől függnek. A változók metrikus vagy nem metrikus jellege alapján vizsgálhatóak a kapcsolatok a különböző statisztikai módszerekkel. Maguk az egyváltozós elemzések megfelelőek a minta bemutatására. Célja az elsődleges betekintés az adatbázisba. Főbb csoportjait a helyzetmutatók, a szóródási mutatók, az alakmutatók és az egyéb mutatószámok alkotják. Helyzetmutatók az átlag, medián és módusz, más és más skálák esetén nyújtanak megfelelő eredményt. Szóródási mutatók a terjedelem, a szórás és a variancia. Alakmutatók a csúcsosság és a ferdeség mutatói, amelyekkel a normál eloszlástól való eltérés vizsgálható. Egyéb mutatók az összeg, esetszám, minimum és maximum érték. Skáláktól függően lehet alkalmazni a különböző mutatószámokat. |
"A gyógyszertári adatbázis"című szemelvény szemléletesen mutatja be a különböző mutatószámokat. |
Tevékenység |
Olvassa el a 11.3. fejezetet (TK. 255.-258. oldalig), és válaszoljon az alábbi kérdésekre! |
1. | Mi a kereszttábla-elemzés? | 2. | Milyen változók kapcsolatát vizsgálhatjuk kereszttáblával? | 3. | Milyen nullhipotézist vizsgál a kereszttábla? | 4. | Melyek a kereszttábla-elemzés lépései? | 5. | Milyen összefüggést vizsgálunk meg a kereszttábla elemzéskor? | 6. | Milyen statisztikát használunk a kereszttábla elemzésekor? | 7. | Milyen mutatót használunk a kereszttábla elemzésekor a kapcsolat erősségének megállapítására? | 8. | Nézze meg újra a 11.6. táblázatot! Hogyan elemezzük a kereszttábla eredményeit? | 9. | Mi alapján számítunk százalékos értékeket? |
|
A fejezetrész tartalmi összefoglalója |
Kereszttábla elemzés során két vagy több, nem metrikus változó között vizsgáljuk az összefüggéseket. Olyan technika, amely két vagy több változót ír le egyidejűleg egy olyan táblával, amely megmutatja a korlátozott számú változó együttes elosztását, ami nem más, mint két gyakorisági elemzés együttes vizsgálata két nem metrikus változó esetében. A vizsgált nullhipotézis azt fejezi ki, hogy a vizsgált két változó között nincs összefüggés. A kereszttábla elemzés lépései: |
1. | Összefüggés megállapítása: statisztikája a Pearson féle Khi négyzet statisztika; ennek szignifikanciája kisebb, mint 0,05, akkor elvetem a nullhipotézist. | 2. | Kapcsolat erősségének megállapítása: ha elvetettem a nullhipotézist, akkor legtöbb esetben a Cramer féle V mutató vizsgálatával elemezhetem ezt (ez a mutató változhat akkor, ha az adatok nem nominálisak. Ordinális mutatók esetében más mutató alkalmazható). | 3. | A kereszttábla elemzése | | a) | függő és független változók azonosítása | | b) | független változó alapján százalékos bontás alapján levonhatjuk a következtetéseket |
|
Tevékenység |
Olvassa el a 11.4. fejezetet! (TK. 258. - 260. oldal), és válaszoljon az alábbi kérdésekre! |
1. | Mi a varianciaelemzés lényege? | 2. | Milyen változók esetében alkalmazható a varianciaelemzés? | 3. | Melyek a varianciaelemzés alkalmazhatóságának feltételei? | 4. | Mi a varianciaelemezés statisztikája? | 5. | Melyek a varianciaelemzés lépései? | 6. | Mi a varianciaelemzés nullhipotézise? | 7. | Hogyan vizsgáljuk az összefüggéseket varianciaelemezés esetében? Mit jelent a teljes eltérés-négyzetösszeg felbontása? | 8. | Hogyan határozható meg az eltérés jellege a varianciaelemzés esetén? |
|
A fejezetrész tartalmi összefoglalója |
A varianciaelemzés két vagy több sokaság várható értékének összehasonlítására szolgál, és azt vizsgálja, hogy van-e különbség két vagy több csoport átlagai között. A függő változónak metrikusnak, míg a független változónak nem metrikusnak kell lennie. Alkalmazhatóságának egyik feltétele az, hogy a függő változó normál eloszlású legyen, illetve teljesüljön a variancia-homogenitás. A nullhipotézis vizsgálatára az F statisztika szolgál. A varianciaelemezés menete: |
1. | Probléma-meghatározás: azaz a nullhipotézis felállítása, mely szerint a sokaságban a kategóriaátlagok megegyeznek. | 2. | Összefüggés vizsgálata: szükséges az egyes csoportok összetételének vizsgálata, amely a teljes eltérés-négyzetösszeg felbontásával, illetve vizsgálatával oldható meg. A kapcsolat szignifikanciájára az F statisztikát használjuk. Abban az esetben, ha az F statisztika szignifikancia-szintje kisebb, mint 0,05, akkor elutasíthatom a nullhipotézist. Ebben az esetben vizsgálhatom a kapcsolat szorosságát, amelyre az eta négyzet mutató alkalmas. (Itt kell megjegyezni, hogy a tankönyvben félreütés szerepel. Az éta négyzet helyesen: ?2.) Ezt követően vizsgáljuk az eltérés jellegét, amely a leíró statisztikákból ellenőrizhető. |
|
A táblázatok értelmezésének gyakorlásához nézze meg a 11.7. és a 11.8. táblázatokat, és értelmezze az ott látható adatokat. Az értelmezéshez szükséges szószedet: |
11.7. táblázat: |
between groups: csoportok közötti (eltérésnégyetösszeg), azaz SSK within groups: a csoporton belüli (eltérésnégyzetösszeg), azaz SSB Total: összesen sum of squares: eltérésnégyzetösszeg df (degree of freedom): szabadságfok Mean square: átlag négyzet F: F statisztika értéke Sig.: szignifikancia (Mindig ezt ellenőrizzük, amennyiben itt az érték 0,05 alatti, a nullhipotézis elutasítható.) |
11.8. táblázat: |
N: (al)minta elemszáma Mean: átlag Std. Deviation: átlagos eltérés Std. Error: átlagos hiba 95% confidence Interval for mean lower bound/Upper bound: Átlagra vonatkoztatott 95 %-os megbízhatósági szint alsó és felső korlátja, azaz 100-ból 95 esetben az átlag ezen értékek közé esik minimum, maximum: a felvett értékek minimuma és maximuma |
Tevékenység |
Olvassa el a 11.5. fejezetet! (TK. 260. - 265. oldal), és válaszoljon az alábbi kérdésekre! |
1. | Mit határozunk meg korrelációval? | 2. | Értelmezze az r-et különböző relációk esetén (11.9. táblázat)! | 3. | Mit határozunk meg regresszióval? | 4. | Mi az alapvető különbség a korreláció és a regresszió között? | 5. | Ismertesse a kétváltozós regresszió-elemzés folyamatát! | 6. | Milyen feltételek kellenek a regresszió-elemzéshez? | 7. | Mit vizsgálunk pontdiagrammal? | 8. | Hogyan vizsgáljuk a kapcsolat erősségét? | 9. | Mivel ellenőrizzük a determinációs együttható szignifikanciáját? | 10. | Mi a regresszió-elemzés általános modellje? | 11. | Mi az LNM? | 12. | Mi a többváltozós lineáris regresszió-számítás lényege és általános modellje? |
|
A fejezetrész tartalmi összefoglalója |
A változók közötti összefüggés szorosságát, a kapcsolat erősségét, intenzitását korreláció-, míg az összefüggés jellegét regresszió-számítással határozzuk meg. Korrelációelemzésnél két metrikus változó közötti lineáris kapcsolatot vizsgálunk, a Pearson-féle együttható jele "r", értéke -1 és 1 között mozog. r=0 esetén a változók korrelálatlanok. Regresszió-elemzésnél egy metrikus függő és egy vagy több független változó közötti összefüggést elemzünk. Itt becsült értékeket keresünk, és meg kell adni a függő és a független változókat. A kétváltozós regresszióelemzés folyamata: |
1. | a regressziószámítás feltételeinek ellenőrzése | 2. | pontdiagram vizsgálata | 3. | kapcsolat erősségének vizsgálata | 4. | általános modell felírása |
|
A többváltozós lineáris regressziószámításnál egy függő és több független változó közötti kapcsolatot vizsgálunk. |
| Önellenőrző kérdések |
1. Melyik mutatóra igaz, hogy alkalmazása intervallumskála és arányskála esetén a legmegfelelőbb? |
2. Melyik mutatóra igaz, hogy kategorizált adatok esetén ez a legmegfelelőbb mutató? |
3. Milyen statisztikai módszer alkalmazható abban az esetben, ha a függő és a független változónk metrikus? |
4. Az alábbiak közül melyek a szóródási mutatószámok? |
5. Párosítsa az alábbi fogalmakat a jellemzőkkel! Írja be az 1...6 számokat a megfelelő helyre! |
6. Jelölje be a helyes állításokat! |
7. Jelölje be a helytelen állításokat! |
8. Egészítse ki az alábbi állításokat táblázatból kikeresett adatokkal! |