KURZUS: Kvantitatív módszerek
MODUL: III. modul: Matematikai statisztika
8. lecke Statisztikai próbák
Tananyag | |||||||||||||
8.1. Alapfogalmak | |||||||||||||
Az eddigi becslési eljárások során a sokasági paramétert ismeretlennek tekintettük, és a mintából származó adatok segítségével közelítőleg meghatároztuk az ismeretlen sokaság értékét. A hipotézisvizsgálatnál a sokaságról állítunk valamit, majd a rendelkezésünkre álló minta alapján ellenőrizzük az állítás helyességét. | |||||||||||||
Az egy vagy több sokaságra vonatkozó állítást, feltevést hipotézisnek nevezzünk. A hipotézis vonatkozhat az egy vagy több sokaság eloszlására, vagy az adott eloszlások egy vagy több paraméterére is. A különféle hipotézisek vizsgálatára szolgáló eljárásokat statisztikai próbáknak nevezzük. A próba egy olyan eljárás, amelynek során a mintából származó információk alapján döntünk a hipotézis elfogadásáról, vagy elutasításáról. | |||||||||||||
A hipotézisvizsgálat első lépése a vizsgálni kívánt hipotézis megfogalmazása. Pontosabban mindig két hipotézist fogalmazunk meg, egy úgynevezett nullhipotézist (H0), és egy ezzel szemben álló alternatív hipotézist (H1). A vizsgálat során a két hipotézist "versenyeztetjük", és azt fogadjuk el igaznak, amelyik a mintavétel eredménye alapján hihetőbbnek tűnik a másiknál. A két hipotézist úgy kell megfogalmazni, hogy: | |||||||||||||
| |||||||||||||
A hipotézis lehet egyszerű, ha fennállásának feltételezése a sokaság eloszlását egyértelműen meghatározottá teszi. Ellenkező esetben összetett hipotézisről beszélünk, azaz az egyszerű hipotézisek halmazáról. | |||||||||||||
A hipotézisek megfogalmazása után a feladatunk a mintaelemek egy olyan függvényének a keresése, amelynek valószínűség-eloszlása a nullhipotézis helyességének feltételezése, a sokaságra tett bizonyos kikötések és a mintavétel adott módja mellet egyértelműen meghatározható. Az e követelményeknek eleget tevő függvényt próbafüggvénynek nevezzük. A próbafüggvény hasonló szerepet tölt be a hipotézisvizsgálat során, mint a becslőfüggvény a becsléskor. A próbafüggvény konstruálása matematikai feladat. | |||||||||||||
A hipotézis helyességének ellenőrzése a próbafüggvény lehetséges értékeinek teljes tartományát osztópontok segítségével (Ca; Cf) két egymást át nem fedő tartományra bontjuk. Az egyik az elfogadási tartomány (E), a másik egy elutasítási vagy kritikus tartomány (K). Az egyes tartományok határait úgy válaszuk meg, hogy a próbafüggvény értéke a nullhipotézis elfogadása esetén előre megadott valószínűséggel () az elfogadási tartományba essen, és a kritikus tartományba esés csak -valószínűséggel következzen be. Az () a konfidencia szint, ennek komplementere a szignifikancia szin (). A próbafüggvény kritikus tartományba esésének valószínűségét szignifikancia szintnek nevezzük, és -val jelöljük. Pl.: =0,05 szignifikancia szint azt jelenti, hogy ha a mintavételt végtelen sokszor végrehajtjuk, akkor 100 esetből összesen 5-ször fordul elő az, hogy a próbafüggvényünk minta alapján kiszámított értéke a kritikus tartományba esik. | |||||||||||||
Ha ezek után a rendelkezésre álló minta adataiból kiszámítjuk a próbafüggvény úgynevezett aktuális értékeit, és ez beleesik az elfogadási tartományba, akkor a nullhipotézist elfogadjuk, ellenkező esetben a nullhipotézist elutasítjuk, és az alternatív hipotézist fogadjuk el. | |||||||||||||
Az elfogadási és a kritikus tartomány egymáshoz viszonyított elhelyezése háromféle lehet: | |||||||||||||
Egyoldali kritikus tartományhoz abban az esetben jutunk, ha az ellenhipotézisben a nullhipotézishez képest egy meghatározott irányú eltérést írunk fel. | |||||||||||||
Bal oldali kritikus tartomány | |||||||||||||
Ha a sokaság várható értékre alternatív hipotézist fogalmazzuk meg, akkor bal oldali, kritikus tartományról beszélünk. A nullhipotézist abban az esetben fogadjuk el, ha a próbafüggvény számított értéke nagyobb az elfogadási tartomány alsó határánál. Az elfogadási tartomány felső határa ebben az esetben pozitív végtelen. Ellenkező esetben a nullhipotézist vetjük el, és természetesen az alternatív hipotézist fogadjuk el. | |||||||||||||
| |||||||||||||
Jobb oldali kritikus tartomány | |||||||||||||
Ha a sokaság várható értékre alternatív hipotézist fogalmazzuk meg akkor jobb oldali kritikus tartományról beszélünk. | |||||||||||||
A nullhipotézist abban az esetben fogadjuk el, ha a próbafüggvény számított értéke kisebb az elfogadási tartomány felső határánál. Az elfogadási tartomány alsó határa ebben az esetben negatív végtelen. Ellenkező esetben a nullhipotézist vetjük el, és természetesen az alternatív hipotézist fogadjuk el. | |||||||||||||
| |||||||||||||
Kétoldali kritikus tartomány | |||||||||||||
Kétoldali kritikus tartomány kijelölésére olyan esetben kerül sor, amikor a nullhipotézisben megfogalmazott állítástól való bármilyen irányú eltérés érdekel bennünket (). | |||||||||||||
Ha a próbafüggvény számított értéke az elfogadási tartományba kerül, akkor a nullhipotézist fogadjuk el, ha a próbafüggvény értéke a kritikus tartományba kerül, akkor a nullhipotézist elvetjük. | |||||||||||||
| |||||||||||||
A hipotézisvizsgálat során elkövetett hibák | |||||||||||||
A mintából a sokaságra vonatkozóan csak valószínűségi következtetés lehetséges, így a hipotézisvizsgálat során hozott döntésünk bizonyos kockázattal jár. | |||||||||||||
Előfordulhat, hogy a nullhipotézis helyes, és a próbafüggvény adott mintából számított értéke mégis a kritikus tartományba esik, Ilyenkor a nullhipotézist annak ellenére, hogy fennáll, elutasítjuk. Ezt a hibás döntést elsőfajú hibának nevezzük. Az ilyen hiba elkövetésének valószínűsége az elfogadási és a kritikus tartomány konstrukciója alapján , amelyet szignifikanciaszintnek nevezünk. | |||||||||||||
Előfordul, hogy a nullhipotézis nem áll fenn (nem igaz), és a próbafüggvény mintából számított értéke mégis az elfogadási tartományba esik. Ez szintén hibás döntés, és ilyenkor másodfokú hibát követünk el. Ezen esemény bekövetkezésének valószínűségét -val jelöljük. | |||||||||||||
A hipotézisvizsgálat során elkövetett hibák | |||||||||||||
| |||||||||||||
| |||||||||||||
Az () valószínűséget a próba megbízhatósági szintjének, az -t pedig a próba erejének nevezzük. | |||||||||||||
A minta elemszámának növelésével - adott szignifikancia szint és alternatív hipotézis esetén - csökkenthető a másodfajú hiba elkövetésének valószínűsége, illetve minél távolabb van paraméter valóságos értéke a nullhipotézisben szereplő feltételezett értéktől, annál kisebb lesz -értéke. | |||||||||||||
A hipotézisvizsgálat menet: | |||||||||||||
| |||||||||||||
8.2. Egymintás statisztikai próbák | |||||||||||||
Az egymintás statisztikai próbák a sokaság valamely paraméterének tesztelésére szolgálnak. | |||||||||||||
8.2.1. Várható értékre irányuló próbák | |||||||||||||
Azt teszteljük, hogy egy sokaság ismeretlen várható értéke (), megegyezik-e az általunk feltételezett várható értékkel (). A nullhipotézis a következő: | |||||||||||||
Konkrét minta esetén: | |||||||||||||
Az alternatív hipotézisünk háromféle lehet: | |||||||||||||
Konkrét minta esetén: | |||||||||||||
8.2.1.1. Egymintás z-próba | |||||||||||||
A sokaság normális eloszlású és a sokasági szórás () ismert, akkor hasonlóan a becsléshez, a z-próbafüggvényt alkalmazzunk. | |||||||||||||
, | |||||||||||||
illetve ismert minta esetén: | |||||||||||||
Ez a próbafüggvény standard normális eloszlású valószínűségi változó. | |||||||||||||
A z-próba elfogadási tartományának határai az alábbiak: | |||||||||||||
| |||||||||||||
A táblázatban csak a értékeit találjuk meg, azonban a értékeit az alábbi összefüggés alapján meghatározhatjuk: |
1. bemutató feladat | ||
Egy automata gépsor lisztet csomagol, a szabvány szerint 100 dkg-os tömeggel, és a megengedett szórás 3 dkg. Ellenőrzés céljából 30 db-os mintát veszünk. A lemért lisztes zacskók átlagos tömege 98 dkg. Ellenőrizzük 5%-os szignifikancia szinten, hogy a gép megfelelően csomagol-e. | ||
. | ||
z0,975 = 1,96; z0,025 = -1,96 | ||
Az elfogadási tartomány: (-1,96; 1,96) |
8.2.1.2. Egymintás t-próba | |||||||||
A normális eloszlású sokaság vizsgálatánál végezzük, ha nem ismerjük az eloszlás szórását. Ebben az esetben a | |||||||||
próbafüggvényt használjuk, illetve konkrét minta esetén: | |||||||||
, | |||||||||
a nullhipotézis ellenőrzésére. | |||||||||
Ha a nullhipotézis igaz, és a sokaság eloszlása valóban normális, akkor a t-próbafüggvény szf=n-1 szabadságfokú Student-féle t-eloszlást követ. A t-próba elfogadási tartományának határai az alábbiak: | |||||||||
| |||||||||
2. bemutató feladat | ||
Az előző sokaság eloszlása normális, az átlag 98 dkg, a szórást a mintából (n=30) becsültük meg, ami 5,5 dkg Ellenőrizzük 5%-os szignifikancia szinten, hogy a gép megfelelően csomagol-e. | ||
. | ||
t290,975=2,05; t290,025= -2,05 | ||
Az elfogadási tartomány: (-2,05; 2,05) | ||
Az elfogadási tartomány tartalmazza a próbafüggvény aktuális értékét (-1,99), ezért a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten a töltési tömeg megfelel a szabványnak. |
8.2.2. Sokasági szórásra vonatkozó próba | |||||||||
A sokasági szórás becslésére a korrigált tapasztalati szórást használjuk. A konfidencia intervallum meghatározását a -eloszlásra (khí) alapozzuk. | |||||||||
próbafüggvényt használjuk, amely szf=n-1 szabadságfokú -eloszlást követ. | |||||||||
A nullhipotézisünk: | |||||||||
A -próba elfogadási tartományának határai az alábbiak: | |||||||||
|
3. bemutató feladat | ||
Az előző példában feltételezzük, hogy a gép 3 dkg-os szórással tölt. A 30 elemű mintából számított szórás 5,5 dkg volt. Ellenőrizzük, hogy helyes volt-e a feltevés, hogy a gép maximum 3 dkg szórással tölt, 5%-os szifnifikancia szinten. | ||
. | ||
A , tehát az elfogadási tartomány (0; 42,6), a próbafüggvény értéke nem esik bele ebbe a tartományba, ezért a nullhipotézist elutasítjuk, azaz a töltés során a szórás meghaladja az előírást. |
8.2.3. Függetlenségvizsgálat | ||
A függetlenségvizsgálat azon nullhipotézis ellenőrzésére szolgál, hogy két ismérv független egymástól. Az alternatív hipotézisben pedig azt fogalmazzuk meg, hogy nem függetlenek. | ||
A két ismérv akkor független egymástól, ha a peremmegoszlási viszonyszámok (relatív gyakoriságok) szorzata egyenlő s megfelelő együttes viszonyszámokkal: | ||
Ha nem ismerjük a véges sokaságot, akkor a mintából származó adatokkal kell eldönteni a függetlenséget. Ilyenkor is egy kontingenciatáblából indulunk ki, de a táblázat ekkor a mintában észlelt gyakoriságokat tartalmazza. | ||
(i=1,2,....,s; j= 1,2,....t) | ||
Pij: az első ismérv i-edik és a második ismérv j-edik változata együttes előfordulásának valószínűsége a sokaságban. | ||
A valószínűségeket a mintából becsüljük: | ||
Vagy a Csuprov-féle együttható szerint, ahol | ||
A szabadságfok: szf=(s-1)*(t-1) | ||
Ez a próba jobb oldali módon hajtható végre. A minta akkor tekinthető elég nagynak, ha még a legkisebb is legalább 5, de még jobb, ha legalább 10. |
4. bemutató feladat | |||||||||||||||||||||||||||||||||||||
Egy szociológiai vizsgálat során azt kívánjuk ellenőrizni, hogy az egyetemet végzett férfiak és nők előrejutási lehetőségei azonosnak tekinthetők-e. Ehhez a 15 éve végzett hallgatók közül 200 főt kiválasztva véletlenszerűen, az alábbi mintát kaptuk. | |||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||
A vizsgálatot 5%-os szignifikancia szinten végezzük el. | |||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||
=18,856 szf=(3-1)*(2-1)=2 | |||||||||||||||||||||||||||||||||||||
Mivel a kritikus érték kisebb, mint a számított érték, a H0-t elutasítjuk, tehát az adatok alapján 5%-os szignifikancia szinten elmondható, hogy a nemhez való tartozás és a beosztás függenek egymástól, azaz elutasítjuk a függetlenséget. |
8.2.4. Illeszkedésvizsgálat | ||||||||||||||||||||||||||||||||||
Egy valószínűségi változó eloszlására vonatkozó állítás vagy feltételezés ellenőrzését illeszkedésvizsgálatnak nevezzük. Attól függően, hogy a hipotézisünket mennyire konkretizáljuk, kétféle illeszkedésvizsgálatot különböztetünk meg: | ||||||||||||||||||||||||||||||||||
Ha a feltételezett eloszlás egyértelműen meghatározott - a típusát és a paramétereit előre rögzítjük -, akkor tiszta illeszkedésvizsgálatról beszélünk. | ||||||||||||||||||||||||||||||||||
Ha a feltételezett eloszlásnak csak a típusát adjuk meg - a paramétereit pedig a mintából becsüljük -, akkor becsléses illeszkedésvizsgálatot végzünk. | ||||||||||||||||||||||||||||||||||
A sokaságot egy ismérv (többnyire mennyiségi, néha minőségi) alapján k-számú részre bontjuk, azaz az adott ismérv alapján osztályozzuk a sokaság egységeit. Ugyanezt azt osztályozást a mintán belül is elvégezzük. | ||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||
Az általunk feltételezett sokaság eloszlása minden ismérvváltozathoz egy maghatározott Pi valószínűséget rendel. A nullhipotézis tehát: | ||||||||||||||||||||||||||||||||||
i=1,2,...k, az alternatív hipotézisünk pedig: | ||||||||||||||||||||||||||||||||||
A helyességét a -próbafüggvénnyel vizsgálhatjuk meg: | ||||||||||||||||||||||||||||||||||
Ez a statisztikai vizsgálat a nullhipotézis helyessége esetén jó közelítéssel szf=(k-b-1) szabadságfokú -eloszlású, ahol a b a Pi valószínűségek meghatározásához szükséges olyan paraméterek száma, amelyeket a mintából becsülünk. Tiszta illeszkedésvizsgálat esetén a b=0. | ||||||||||||||||||||||||||||||||||
Mivel -próbafüggvény a nullhipotézistől való jelentős eltérést nagy pozitív értékkel jelzi, ezért az illeszkedésvizsgálatot a jobb oldali kritikus tartományra kell végrehajtani, azaz a felső kritikus értéket kell keresni , tehát az elfogadási tartomány pedig: | ||||||||||||||||||||||||||||||||||
. |
5. bemutató feladat | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Egy gyorsbüfé hálózatban a vevőket 45 másodperc alatt kell kiszolgálni. A kiszolgálási idő megengedett szórása 7 másodperc. 400 véletlenül kiválasztott vendég kiszolgálási idő szerinti megoszlása a következő: | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ellenőrizzük azt a feltevést, hogy a minta az előírt paraméterű (átlag=45, szórás=7 másodperc) normális eloszlásból származott, P=5%-os szignifikancia szinten. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
A táblázatban vastagított számokat az alábbiak szerint kapjuk: | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
=35-45/7=-1,43 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
=10,79 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Szf=6-1=5, =11,1, | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
A számított érték az elfogadási tartományba esik, így elfogadjuk a nullhipotézist. A kiszolgálási időt 5%-os szignifikancia szinten 45 másodperc várható értékű és 7 másodperc szórású normális eloszlású valószínűségi változónak lehet tekinteni. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
6. bemutató feladat | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Egy széleskörű vizsgálat során, Magyarországon a 15 éves és idősebb népesség 15%-a sovány, 25%-a normál súlyú, és 60%-a túlsúlyos volt 1996-ban. 2005-ben 500 véletlenszerűen kiválasztott minta alapján 72 fő sovány, 176 fő normál súlyú és 252 fő pedig túlsúlyos volt. 1%-os szignifikancia szinten állíthatjuk-e, hogy a két eloszlás egyforma. A kérdés az illeszkedésvizsgálattal válaszolható meg. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
szf=3-1=2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
A két eloszlás nem egyezik, mivel a próbafüggvény számított értéke az elfogadási tartományba esik |
8.3. Két- és többmintás statisztikai próbák | |||||||||
Gyakran előfordul, hogy két sokaságot akarunk vizsgálni, és a hipotézis két paraméter értékének egymáshoz való viszonyára vonatkozik. Ilyenkor kétmintás próbát hajtunk végre, azaz a sokaságokból 1-1 független, véletlen mintát veszünk a hipotézis ellenőrzése céljából. Az egymással összehasonlításra kerülő sokaságok időben, térben vagy bármilyen más tekintetben különbözhetnek egymástól. | |||||||||
8.3.1. Várható értékek különbözőségére irányuló próbák | |||||||||
Két sokaságból külön-külön és egymástól függetlenül vett minta alapján ellenőrizni kívánjuk a vagy konkrét minta esetén a hipotézis helyességét. | |||||||||
8.3.1.1. Kétmintás z-próba | |||||||||
Ha a két sokaság normális eloszlású, és ismert mindkét sokaság szórása, akkor a z-próbafüggvényt alkalmazzuk: | |||||||||
A próba elfogadási tartománya megegyezik az egymintás z-próba elfogadási tartományával: | |||||||||
|
7. bemutató feladat | ||
A levegőszennyeződés vizsgálatakor az ülepedő por (g/m2/hó) mennyiségét mérték meg téli és nyári időszakban. A mérés eredménye: | ||
Télen: n1=60; ; | ||
Megoldás: | ||
z0,975=1,96 |
8.3.1.2. Kétmintás t-próba | ||
Ha a két normális eloszlású sokaság szórását nem ismerjük, és feltételezzük, hogy szórásuk lényegesen nem különbözik, ilyenkor t-próbát alkalmazunk: | ||
(közös szórás) | ||
A szabadságfok szf=n1+n2-2 |
8. bemutató feladat | ||
Egy üzemben a szerelési műveleteket két eltérő módon tanították be. A két csoportból mintát vettek, és feljegyezték a dolgozók teljesítményét. A kérdés, hogy 5%-os valószínűségi szinten van-e különbség a két szerelési mód között? | ||
n1=16; ; s1=18 | ||
Megoldás: | ||
Szf=25 t0,025(25)= -1,71, az elfogadási tartomány: | ||
, azaz | ||
Mivel a számított t-érték beleesik az elfogadási tartományba, ezért a nullhipotézist elfogadjuk, azaz az első betanítási módszer nem jobb, mint a második. | ||
Ha a két minta szórása nagymértékben különbözik, akkor a kétmintás t-próba nem alkalmazható a két várható érték egyezésének eldöntésére. Ilyen esetekben az úgynevezett Welch-eljárást alkalmazzuk: | ||
9. bemutató feladat | ||
Egy üzemben a szerelési műveleteket két eltérő módon tanították be. A két csoportból mintát vettek, és feljegyezték a dolgozók teljesítményét. A kérdés, hogy 5%-os valószínűségi szinten van-e különbség a két szerelési mód között? | ||
n1=16; (; s1=18 | ||
Megoldás: | ||
Szf=25 t0,025(25)= -1,71, az elfogadási tartomány: | ||
, azaz | ||
Mivel a számított t-érték beleesik az elfogadási tartományba, ezért a nullhipotézist elfogadjuk, azaz az első betanítási módszer nem jobb, mint a második. |
8.3.2. Két sokasági szórás egyezőségére irányuló próba | |||||||||
Ha a két sokaság normális eloszlású, a szórások egyezőségének vizsgálatára az F-próbafüggvény alkalmazható, ezért F-próbának nevezzük. | |||||||||
, | |||||||||
vagy | |||||||||
Az F-eloszlás nem szimmetrikus, elfogadási tartománya a következő: | |||||||||
| |||||||||
10. bemutató feladat | ||
Az előző példa folytatása. Ellenőrizzük 10%-os szignifikancia szinten azt a feltevést, hogy a munkások teljesítményének szórása megegyezik. | ||
, | ||
szf1=15; szf2=10 | ||
A számított érték belesik az elfogadási tartományba, így a nullhípotézist elfogadjuk, azaz a teljesítmények szórása között nincs szignifikáns különbség. |
8.3.3. Két eloszlás egyezőségének a vizsgálata | ||
Két eloszlás egyezőségének a vizsgálatát homogenitás vizsgálatnak is nevezzük. | ||
Feltételezzük, hogy valamely változó két sokaságon belüli eloszlása azonos. Erre a-eloszlású próbafüggvényt alkalmazzuk. A két minta elemszáma n1 és n2, akkor értéke: | ||
11. bemutató feladat | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
A virágárakat vizsgálva a pesti és budai virágüzletekben arra keresték a választ, hogy a virágárak eloszlása azonos-e a két helyen 99%-os konfidenciaszinten. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
szf=7-1=6; =0,005; =0,995 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ca=0,68; cf=18,5 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Az elfogadási tartomány: (0,68; 18,5) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
A számított érték beleesik az elfogadási tartományba, azaz a virágárak eloszlása azonos a két helyen. |
8.3.4. Varianciaanalízis | |||||||||||||||||||||
Varianciaanalízissel kettőnél több sokaság várható értékének egyezősége tesztelhető. | |||||||||||||||||||||
A varianciaanalízis abból indul ki, hogy minden megfigyelés 3 komponens összege: | |||||||||||||||||||||
| |||||||||||||||||||||
A helyességét próbafüggvénnyel vizsgáljuk, és ez az F-próbafüggvény. | |||||||||||||||||||||
SSK: a csoportok közötti eltérés négyzetösszege (külső szórás négyzete) | |||||||||||||||||||||
M: a csoportok száma | |||||||||||||||||||||
Ezen kívül ki kell számolni az összes adat szórásnégyzetét is. | |||||||||||||||||||||
Vagy: | |||||||||||||||||||||
SST=SSK+SSB (teljes szórás négyzete) | |||||||||||||||||||||
A varianciatáblázat a következő lesz: | |||||||||||||||||||||
| |||||||||||||||||||||
Az F-próba jobboldali próba. Ha a tapasztalati F-érték (számított) nagyobb az elméleti F-értéknél (táblázatbeli), akkor a várható értékek egyezőségére vonatkozó nullhipotézist az adott szignifikanciaszint mellet elvetjük, és az alternatív hipotézist fogadjuk el. |
12. bemutató feladat | ||||||||||||||||||||||||||
Egy kis élelmiszerbolt tulajdonosa feltételezte, hogy a hétfői és szombati napokon nem ugyanannyi a sajt forgalma, mint a hét többi napján. Azért, hogy a sajtrendelésit jobban le tudja adni, feljegyezte a forgalmat az adott napokon: | ||||||||||||||||||||||||||
| ||||||||||||||||||||||||||
Ellenőrizzük 5%-os szignifikancia szinten, hogy a sajtforgalom azonos a megfigyelt napokon. | ||||||||||||||||||||||||||
SST=21*111,17=2334,57 | ||||||||||||||||||||||||||
=SSK/(M-1)= 1065,47/2=532,735 | ||||||||||||||||||||||||||
A sajtforgalom variancianalízis táblázata | ||||||||||||||||||||||||||
| ||||||||||||||||||||||||||
Mivel F0,95(2;19)=3,52, azaz a táblázatbeli érték kisebb, mint a számított F-érték, így a várható értékek egyezését állító nullhipotézis elvethető. A hét vizsgált napjain 5%-os szignifikancia szinten nem egyforma a sajtforgalom átlagos nagysága. |
Önellenőrző feladatok | |||||||||||||||||||||||||||||||||||||||||
1. Egy édesipari üzemben a cukorkát tartalmazó zacskók szabvány szerinti töltési tömege 50 dkg. A töltési tömeg normális eloszlású. Egy vizsgálat során a véletlenül kiválasztott 25 zacskó töltési tömegének átlaga 49,6 dkg volt 1,71 dkg szórással. | |||||||||||||||||||||||||||||||||||||||||
Vizsgálja meg 5%-os szignifikancia szinten, hogy a zacskók töltési tömege megfelel-e a szabvány szerinti tömegnek! | |||||||||||||||||||||||||||||||||||||||||
a) A próbafüggvény számított értéke:
![]() | |||||||||||||||||||||||||||||||||||||||||
b) Az elfogadási tartomány alsó határa:
![]() | |||||||||||||||||||||||||||||||||||||||||
c) Az intervallum felső határa:
![]() | |||||||||||||||||||||||||||||||||||||||||
2. Egy adott technológiával gyártott háztartási gép szabvány szerinti élettartama 12 ezer üzemóra, 3 ezer üzemóra szórással. Módosítottak a gyártási technológián és az új technológiával készült háztartási gépek közül kiválasztottak 100-at, a minta alapján az átlagos élettartam 15 ezer üzemóra. | |||||||||||||||||||||||||||||||||||||||||
Ellenőrizze 2%-os szignifikancia szinten, hogy az új technológiával gyártott háztartási gépek átlagos élettartama meghaladja-e a szabvány szerintit! | |||||||||||||||||||||||||||||||||||||||||
a) A próbafüggvény számított értéke:
![]() | |||||||||||||||||||||||||||||||||||||||||
b) Melyik hipotézist fogadjuk el?
![]() | |||||||||||||||||||||||||||||||||||||||||
3. Vizsgálja meg 5%-os szignifikancia szinten az előző feladat adati alapján, hogy a gépek élettartamának szórása eltér-e szabványtól, ha a minta átlagának szórása3,2 ezer üzemóra! | |||||||||||||||||||||||||||||||||||||||||
a) A próbafüggvény számított értéke
![]() | |||||||||||||||||||||||||||||||||||||||||
b) Jelölje meg, hogy melyik hipotézist fogadjuk el!
![]() | |||||||||||||||||||||||||||||||||||||||||
4. Egy diabetikus szeretné meghatározni, hogy a napszak befolyásolja-e a kávéfogyasztást. A kávéház vendéginek mintája alapján feljegyezték a fogyasztást: | |||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||
5%-os szignifikancia szinten a diabetikus elfogadja, vagy elutasítja azt a nullhipotézist, hogy a kávérendelések száma azonos a különböző napszakokban? | |||||||||||||||||||||||||||||||||||||||||
a) A próbafüggvény számított értéke
![]() | |||||||||||||||||||||||||||||||||||||||||
b) Jelölje meg, hogy melyik hipotézist fogadjuk el!
![]() | |||||||||||||||||||||||||||||||||||||||||
c) Válassza ki a helyes megfogalmazást!
![]() | |||||||||||||||||||||||||||||||||||||||||
6. Egy automata töltőgép az egyik fajta szárazsüteményt dobozokba tölti. A dobozok töltési tömegének szórása 8 gramm. A töltési tömeg normális eloszlású. Két egymást követő napon 40-40 dobozt vizsgáltak meg. A mintában az átlagos töltési tömegek: | |||||||||||||||||||||||||||||||||||||||||
1. nap: 595,5 gramm. | |||||||||||||||||||||||||||||||||||||||||
a) A próbafüggvény számított értéke
![]() | |||||||||||||||||||||||||||||||||||||||||
b) Jelölje meg, hogy melyik hipotézist fogadjuk el!
![]() | |||||||||||||||||||||||||||||||||||||||||
7. A személysérüléssel járó közúti közlekedési balesetekre vonatkoznak az alábbi, mintavételből származó adatok: | |||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||
Azonos-e a balesetek számának eloszlása a két helyen 5%-os szignifikancia szinten? | |||||||||||||||||||||||||||||||||||||||||
a) A próbafüggvény számított értéke
![]() | |||||||||||||||||||||||||||||||||||||||||
b) Jelölje meg, hogy melyik hipotézist fogadjuk el!
![]() | |||||||||||||||||||||||||||||||||||||||||
8. Egy cég négy különböző típusú autógumi kopásállóságát vizsgáltatta meg. Az 5-5 elemű mintákban a futófelület kopása alapján meghatározott élettartamok ezer km-ben kifejezve az alábbiak voltak: | |||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||
A minta főátlaga: 55, varianciája pedig 33,58. | |||||||||||||||||||||||||||||||||||||||||
Varianciaanalízissel ellenőrizze, hogy az egyes gumiabroncsok kopásállósága 5%-os szignifikancia szinten azonosnak tekinthető-e! | |||||||||||||||||||||||||||||||||||||||||
a) A próbafüggvény számított értéke
![]() | |||||||||||||||||||||||||||||||||||||||||
b) A táblázatbeli F-érték:
![]() | |||||||||||||||||||||||||||||||||||||||||
c) Válassza ki a helyes megfogalmazást!
![]() |