KURZUS: Marketingkutatás

MODUL: III. modul: Kérdőív, mintavétel, adatgyűjtés, statisztikai elemzések

12. lecke: Egy- és többváltozós elemzések

Cél

Ha sikeresen elsajátítja a lecke tartalmát, akkor képes lesz arra, hogy a statisztika kőkemény világában stabil lábakon álljon. Azáltal, hogy felismeri a különböző változók metrikus vagy nem metrikus jellegét már magabiztosan kiválaszthatja a változók közötti kapcsolat mérésére megfelelő statisztikai módszereket a hozzájuk tartozó statisztikákkal és kapcsolati mutatókkal együtt.

Követelmények

A leckét elsajátította, ha képes:

  • adott mutatóról eldönteni, hogy milyen adatok esetén használható;
  • eldönteni, hogy különböző metrikus, illetve nem metrikus változók esetén milyen statisztikai módszerek alkalmazhatók;
  • adott mutatóról eldönteni, hogy az melyik típusba (helyzet-, szóródási- vagy alakmutató) sorolható;
  • összekapcsolni a mutatószámokat a jellemzőikkel;
  • eldönteni, hogy adott mutatók adott skálák esetén alkalmazhatók-e;
  • eldönteni a statisztikai módszerekkel kapcsolatos állítások helyességét;
  • adott táblázatból ki tudja keresni a leíró statisztikai adatokat;
Fogalmak
  • átlag,
  • csúcsosság,
  • egyváltozós elemzés,
  • ferdeség,
  • független változó,
  • függő változó,
  • kereszttábla,
  • khi-négyzet próba,
  • korreláció,
  • medián,
  • módusz,
  • regresszióelemzés,
  • szórás,
  • terjedelem,
  • variancia,
  • varianciaelemzés.
Időszükséglet

120 perc

Tevékenység

Olvassa el a 11.1., 11.2. fejezetet (TK. 249.-254. oldalig), és válaszoljon az alábbi kérdésekre!

1.Milyen módszereket alkalmazhatunk a függő és független változók különböző kombinációi alapján?
2.Mi az egyváltozós elemzés lényege, célja?
3.Melyek a helyzetmutatók?
4.Mit mutat meg az átlag? Mikor alkalmazható?
5.Mi a medián? Mikor alkalmazható?
6.Mi a módusz? Mikor alkalmazható?
7.Melyek a szóródási mutatószámok?
8.Mi a terjedelem?
9.Mi a szórás?
10.Mi a variancia?
11.Melyek az alakmutató számok?
12.Mi a csúcsosság? Mit mutatnak meg az értékei?
13.Mi a ferdeség? Mit mutatnak meg az értékei?
14.Milyen egyéb mutatószámokat ismer?
15.Milyen mutatókat alkalmazhat nominális skálánál?
16.Milyen mutatókat alkalmazhat ordinális skálánál?
17.Milyen mutatókat alkalmazhat intervallum/arány skáláknál?
18.Olvassa el "A gyógyszertári adatbázis" szemelvényt, és azonosítsa a különböző egyváltozós mutatókat az olvasottak alapján!
A fejezetrész tartalmi összefoglalója

Az alkalmazott statisztikai módszerek a változók jellegétől függnek. A változók metrikus vagy nem metrikus jellege alapján vizsgálhatóak a kapcsolatok a különböző statisztikai módszerekkel. Maguk az egyváltozós elemzések megfelelőek a minta bemutatására. Célja az elsődleges betekintés az adatbázisba. Főbb csoportjait a helyzetmutatók, a szóródási mutatók, az alakmutatók és az egyéb mutatószámok alkotják. Helyzetmutatók az átlag, medián és módusz, más és más skálák esetén nyújtanak megfelelő eredményt. Szóródási mutatók a terjedelem, a szórás és a variancia. Alakmutatók a csúcsosság és a ferdeség mutatói, amelyekkel a normál eloszlástól való eltérés vizsgálható. Egyéb mutatók az összeg, esetszám, minimum és maximum érték. Skáláktól függően lehet alkalmazni a különböző mutatószámokat.

"A gyógyszertári adatbázis"című szemelvény szemléletesen mutatja be a különböző mutatószámokat.

Tevékenység

Olvassa el a 11.3. fejezetet (TK. 255.-258. oldalig), és válaszoljon az alábbi kérdésekre!

1.Mi a kereszttábla-elemzés?
2.Milyen változók kapcsolatát vizsgálhatjuk kereszttáblával?
3.Milyen nullhipotézist vizsgál a kereszttábla?
4.Melyek a kereszttábla-elemzés lépései?
5.Milyen összefüggést vizsgálunk meg a kereszttábla elemzéskor?
6.Milyen statisztikát használunk a kereszttábla elemzésekor?
7.Milyen mutatót használunk a kereszttábla elemzésekor a kapcsolat erősségének megállapítására?
8.Nézze meg újra a 11.6. táblázatot! Hogyan elemezzük a kereszttábla eredményeit?
9.Mi alapján számítunk százalékos értékeket?
A fejezetrész tartalmi összefoglalója

Kereszttábla elemzés során két vagy több, nem metrikus változó között vizsgáljuk az összefüggéseket. Olyan technika, amely két vagy több változót ír le egyidejűleg egy olyan táblával, amely megmutatja a korlátozott számú változó együttes elosztását, ami nem más, mint két gyakorisági elemzés együttes vizsgálata két nem metrikus változó esetében. A vizsgált nullhipotézis azt fejezi ki, hogy a vizsgált két változó között nincs összefüggés. A kereszttábla elemzés lépései:

1.Összefüggés megállapítása: statisztikája a Pearson féle Khi négyzet statisztika; ennek szignifikanciája kisebb, mint 0,05, akkor elvetem a nullhipotézist.
2.Kapcsolat erősségének megállapítása: ha elvetettem a nullhipotézist, akkor legtöbb esetben a Cramer féle V mutató vizsgálatával elemezhetem ezt (ez a mutató változhat akkor, ha az adatok nem nominálisak. Ordinális mutatók esetében más mutató alkalmazható).
3.A kereszttábla elemzése
 a)függő és független változók azonosítása
 b)független változó alapján százalékos bontás alapján levonhatjuk a következtetéseket
Tevékenység

Olvassa el a 11.4. fejezetet! (TK. 258. - 260. oldal), és válaszoljon az alábbi kérdésekre!

1.Mi a varianciaelemzés lényege?
2.Milyen változók esetében alkalmazható a varianciaelemzés?
3.Melyek a varianciaelemzés alkalmazhatóságának feltételei?
4.Mi a varianciaelemezés statisztikája?
5.Melyek a varianciaelemzés lépései?
6.Mi a varianciaelemzés nullhipotézise?
7.Hogyan vizsgáljuk az összefüggéseket varianciaelemezés esetében? Mit jelent a teljes eltérés-négyzetösszeg felbontása?
8.Hogyan határozható meg az eltérés jellege a varianciaelemzés esetén?
A fejezetrész tartalmi összefoglalója

A varianciaelemzés két vagy több sokaság várható értékének összehasonlítására szolgál, és azt vizsgálja, hogy van-e különbség két vagy több csoport átlagai között. A függő változónak metrikusnak, míg a független változónak nem metrikusnak kell lennie. Alkalmazhatóságának egyik feltétele az, hogy a függő változó normál eloszlású legyen, illetve teljesüljön a variancia-homogenitás. A nullhipotézis vizsgálatára az F statisztika szolgál. A varianciaelemezés menete:

1.Probléma-meghatározás: azaz a nullhipotézis felállítása, mely szerint a sokaságban a kategóriaátlagok megegyeznek.
2.Összefüggés vizsgálata: szükséges az egyes csoportok összetételének vizsgálata, amely a teljes eltérés-négyzetösszeg felbontásával, illetve vizsgálatával oldható meg. A kapcsolat szignifikanciájára az F statisztikát használjuk. Abban az esetben, ha az F statisztika szignifikancia-szintje kisebb, mint 0,05, akkor elutasíthatom a nullhipotézist. Ebben az esetben vizsgálhatom a kapcsolat szorosságát, amelyre az eta négyzet mutató alkalmas. (Itt kell megjegyezni, hogy a tankönyvben félreütés szerepel. Az éta négyzet helyesen: ?2.) Ezt követően vizsgáljuk az eltérés jellegét, amely a leíró statisztikákból ellenőrizhető.

A táblázatok értelmezésének gyakorlásához nézze meg a 11.7. és a 11.8. táblázatokat, és értelmezze az ott látható adatokat. Az értelmezéshez szükséges szószedet:

11.7. táblázat:

between groups: csoportok közötti (eltérésnégyetösszeg), azaz SSK
within groups: a csoporton belüli (eltérésnégyzetösszeg), azaz SSB
Total: összesen
sum of squares: eltérésnégyzetösszeg
df (degree of freedom): szabadságfok
Mean square: átlag négyzet
F: F statisztika értéke
Sig.: szignifikancia (Mindig ezt ellenőrizzük, amennyiben itt az érték 0,05 alatti, a nullhipotézis elutasítható.)

11.8. táblázat:

N: (al)minta elemszáma
Mean: átlag
Std. Deviation: átlagos eltérés
Std. Error: átlagos hiba
95% confidence Interval for mean lower bound/Upper bound: Átlagra vonatkoztatott 95 %-os megbízhatósági szint alsó és felső korlátja, azaz 100-ból 95 esetben az átlag ezen értékek közé esik
minimum, maximum: a felvett értékek minimuma és maximuma

Tevékenység

Olvassa el a 11.5. fejezetet! (TK. 260. - 265. oldal), és válaszoljon az alábbi kérdésekre!

1.Mit határozunk meg korrelációval?
2.Értelmezze az r-et különböző relációk esetén (11.9. táblázat)!
3.Mit határozunk meg regresszióval?
4.Mi az alapvető különbség a korreláció és a regresszió között?
5.Ismertesse a kétváltozós regresszió-elemzés folyamatát!
6.Milyen feltételek kellenek a regresszió-elemzéshez?
7.Mit vizsgálunk pontdiagrammal?
8.Hogyan vizsgáljuk a kapcsolat erősségét?
9.Mivel ellenőrizzük a determinációs együttható szignifikanciáját?
10.Mi a regresszió-elemzés általános modellje?
11.Mi az LNM?
12.Mi a többváltozós lineáris regresszió-számítás lényege és általános modellje?
A fejezetrész tartalmi összefoglalója

A változók közötti összefüggés szorosságát, a kapcsolat erősségét, intenzitását korreláció-, míg az összefüggés jellegét regresszió-számítással határozzuk meg. Korrelációelemzésnél két metrikus változó közötti lineáris kapcsolatot vizsgálunk, a Pearson-féle együttható jele "r", értéke -1 és 1 között mozog. r=0 esetén a változók korrelálatlanok. Regresszió-elemzésnél egy metrikus függő és egy vagy több független változó közötti összefüggést elemzünk. Itt becsült értékeket keresünk, és meg kell adni a függő és a független változókat. A kétváltozós regresszióelemzés folyamata:

1.a regressziószámítás feltételeinek ellenőrzése
2.pontdiagram vizsgálata
3.kapcsolat erősségének vizsgálata
4.általános modell felírása

A többváltozós lineáris regressziószámításnál egy függő és több független változó közötti kapcsolatot vizsgálunk.

Önellenőrző kérdések
1. Melyik mutatóra igaz, hogy alkalmazása intervallumskála és arányskála esetén a legmegfelelőbb?
Átlag.
Medián.
Módusz.
2. Melyik mutatóra igaz, hogy kategorizált adatok esetén ez a legmegfelelőbb mutató?
Átlag.
Medián.
Módusz.
3. Milyen statisztikai módszer alkalmazható abban az esetben, ha a függő és a független változónk metrikus?
Kereszttábla-elemzés.
Korreláció.
Variancia-elemezés.
Diszkriminancia-elemzés.
Regresszió.
4. Az alábbiak közül melyek a szóródási mutatószámok?
Medián.
Terjedelem.
Ferdeség.
Összeg.
Variancia.
5. Párosítsa az alábbi fogalmakat a jellemzőkkel! Írja be az 1...6 számokat a megfelelő helyre!

1: terjedelem
2: ferdeség
3: csúcsosság
4: minimum
5: módusz
6: medián

Az eloszlás horizontális alakját leíró mutatószám:
A leggyakrabban előforduló elem:
A legnagyobb és a legkisebb elem közti különbség:
Az eloszlás alakját vertikálisan leíró mutatószám:
A legkisebb elem:

6. Jelölje be a helyes állításokat!
Terjedelem minimum nominális skálánál számítható.
A medián értelmezhető intervallumskálák esetében.
Nominális skáláknál nem alkalmazhatóak alakmutatók.
A szórás alkalmazható az ordinális skálák esetében.
A nominális skálák jellemezhetőek az átlaggal.
7. Jelölje be a helytelen állításokat!
A kereszttábla igazoló statisztikája az F statisztika.
Ha r=0, akkor a változók korrelálatlanok.
Az éta négyzet a variancia-elemezésben a kapcsolat szorosságát vizsgálja.
A regresszió-elemzésnél a függő változó metrikus, míg a független változó nem metrikus.
Korrelációelemzésnél mindegyik változó nem metrikus.
8. Egészítse ki az alábbi állításokat táblázatból kikeresett adatokkal!



A középvállalatok csoportjában összesen vállalat található.
A kisvállalkozások minimum , maximum főt foglalkoztatnak.
A mikro vállalkozások átlagos alkalmazotti létszáma fő.
Összesen vállalat került a mintába.