KURZUS: Statisztika II.
MODUL: II. modul: Hipotézisvizsgálat
5. lecke: Egymintás statisztikai próbák
Követelmények | |||||||||
Ön akkor sajátította el megfelelően a tananyagot, ha | |||||||||
| |||||||||
Tananyag | |||||||||
Az egymintás statisztikai próbák a sokaság valamely paraméterének tesztelésére szolgálnak. | |||||||||
5.1. Várható értékre irányuló próbák | |||||||||
Azt teszteljük, hogy egy sokaság ismeretlen várható értéke (), megegyezik-e az általunk feltételezett várható értékkel (). A nullhipotézis a következő: | |||||||||
H0: | |||||||||
Konkrét minta esetén: | |||||||||
Az alternatív hipotézisünk háromféle lehet: | |||||||||
H1: | |||||||||
H1: | |||||||||
H1: | |||||||||
Konkrét minta esetén: | |||||||||
5.1.1. Egymintás z-próba | |||||||||
A sokaság normális eloszlású és a sokasági szórás () ismert, akkor hasonlóan a becsléshez, a z-próbafüggvényt alkalmazzunk. | |||||||||
, illetve ismert minta esetén: | |||||||||
Ez a próbafüggvény standard normális eloszlású valószínűségi változó. | |||||||||
A z-próba elfogadási tartományának határai az alábbiak: | |||||||||
| |||||||||
Bemutató feladat | ||
Egy automata gépsor lisztet csomagol, a szabvány szerint 100 dkg-os tömeggel, és a megengedett szórás 3 dkg. Ellenőrzés céljából 30 db-os mintát veszünk. A lemért lisztes zacskók átlagos tömege 98 dkg. Ellenőrizzük 5%-os szignifikancia szinten, hogy a gép megfelelően csomagol-e. | ||
H0: =100 dkg. | ||
H1: 100 dkg | ||
z0,975 = 1,96; z0,025 = -1,96 | ||
Az elfogadási tartomány nem tartalmazza a próbafüggvény aktuális értékét (-3,65), ezért a nullhipotézist elutasítjuk, azaz 5%-os szignifikancia szinten a töltési tömeg nem felel meg a szabványnak. |
5.1.2. Egymintás t-próba | |||||||||
A normális eloszlású sokaság vizsgálatánál végezzük, ha nem ismerjük az eloszlás szórását. Ebben az esetben a | |||||||||
próbafüggvényt használjuk, illetve konkrét minta esetén: , a nullhipotézis ellenőrzésére. | |||||||||
Ha a nullhipotézis igaz, és a sokaság eloszlása valóban normális, akkor a t-próbafüggvény szf=n-1 szabadságfokú Student-féle t-eloszlást követ. A t-próba elfogadási tartományának határai az alábbiak: | |||||||||
| |||||||||
Bemutató feladat | ||
Az előző sokaság eloszlása normális, az átlag 98 dkg, a szórást a mintából (n=30) becsültük meg, ami 5,5 dkg Ellenőrizzük 5%-os szignifikancia szinten, hogy a gép megfelelően csomagol-e. | ||
H0: =100 dkg. | ||
H1: 100 dkg | ||
t290,975=2,05; t290,025= -2,05 | ||
Az elfogadási tartomány tartalmazza a próbafüggvény aktuális értékét (-1,99), ezért a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten a töltési tömeg megfelel a szabványnak. |
5.1.3. Asszimptotikus z-próba | |||||||||
Véges szórású tetszőleges eloszlásból származó nagy minta esetén alkalmazzuk: | |||||||||
| |||||||||
A továbbiakban megegyezik az egymintás z-próbával. | |||||||||
5.2. Sokasági szórásra vonatkozó próba | |||||||||
A sokasági szórás becslésére a korrigált tapasztalati szórást használjuk. A konfidencia intervallum meghatározását a -eloszlásra (khí) alapozzuk. | |||||||||
próbafüggvényt használjuk, amely szf=n-1 szabadságfokú -eloszlást követ. A nullhipotézisünk: | |||||||||
H0: | |||||||||
A -próba elfogadási tartományának határai az alábbiak: | |||||||||
|
Bemutató feladat | ||
Az előző példában feltételezzük, hogy a gép 3 dkg-os szórással tölt. A 30 elemű mintából számított szórás 5,5 dkg volt. Ellenőrizzük, hogy helyes volt-e a feltevés, hogy a gép maximum 3 dkg szórással tölt, 5%-os szifnifikancia szinten. | ||
H0: =3 dkg. | ||
H1: >3 dkg | ||
A , tehát az elfogadási tartomány (0; 42,6), a próbafüggvény értéke nem esik bele ebbe a tartományba, ezért a nullhipotézist elutasítjuk, azaz a töltés során a szórás meghaladja az előírást. |
5.3. Sokasági arányszámmal (valószínűséggel) kapcsolatos próba | ||
A sokasági arányt P-vel jelöljük. Ez azt jeleni, hogy egy egyedet kiválasztva P a valószínűsége annak, hogy az egyed rendelkezik az adott tulajdonsággal. Ellenőrizni akarjuk, hogy a sokasági arány egyenlő-e egy általunk előre feltételezett P0-értékkel. A nullhipotézis a következő: | ||
H0:P=P0 | ||
A nullhipotézis helyességet z-próbafüggvény segítségével ellenőrizhetjük. | ||
A továbbiakban megegyezik az egymintás z-próbával. | ||
Az eddigiek során csak egy sokasági jellemzőre vonatkozó feltételezés vizsgálatát végeztük el. A hipotézisvizsgálattal azonban egy sokaságnak két sokasági jellemzője között fennálló kapcsolatot is ellenőrizhetünk. | ||
5.4. Függetlenségvizsgálat | ||
A függetlenségvizsgálat azon nullhipotézis ellenőrzésére szolgál, hogy két ismérv független egymástól. Az alternatív hipotézisben pedig azt fogalmazzuk meg, hogy nem függetlenek. | ||
Ha a sokaságról teljes körű információval rendelkezünk, akkor az előző félévben tanult kontingenciatábla segítségével döntjük el a függetlenséget. | ||
A két ismérv akkor független egymástól, ha a peremmegoszlási viszonyszámok (relatív gyakoriságok) szorzata egyenlő s megfelelő együttes viszonyszámokkal: | ||
Ha nem ismerjük a véges sokaságot, akkor a mintából származó adatokkal kell eldönteni a függetlenséget. Ilyenkor is egy kontingenciatáblából indulunk ki, de a táblázat ekkor a mintában észlelt gyakoriságokat tartalmazza. | ||
H0: (i=1,2,....,s; j= 1,2,....t) | ||
H1: | ||
Pij: az első ismérv i-edik és a második ismérv j-edik változata együttes előfordulásának valószínűsége a sokaságban. | ||
A valószínűségeket a mintából becsüljük: | ||
| ||
Vagy a Csuprov-féle együttható szerint, ahol | ||
A szabadságfok: szf=(s-1)*(t-1) | ||
Ez a próba jobb oldali módon hajtható végre. A minta akkor tekinthető elég nagynak, ha még a legkisebb n*ij is legalább 5, de még jobb, ha legalább 10. |
Bemutató feladat | |||||||||||||||||||||||||||||||||||||||||
Egy szociológiai vizsgálat során azt kívánjuk ellenőrizni, hogy az egyetemet végzett férfiak és nők előrejutási lehetőségei azonosnak tekinthetők-e. Ehhez a 15 éve végzett hallgatók közül 200 főt kiválasztva véletlenszerűen, az alábbi mintát kaptuk. | |||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||
A vizsgálatot 5%-os szignifikancia szinten végezzük el. | |||||||||||||||||||||||||||||||||||||||||
H0: H1: | |||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||
0=18,856 szf=(3-1)*(2-1)=2 | |||||||||||||||||||||||||||||||||||||||||
0,95(2)=5,99 | |||||||||||||||||||||||||||||||||||||||||
Mivel a kritikus érték kisebb, mint a számított érték, a H0-t elutasítjuk, tehát az adatok alapján 5%-os szignifikancia szinten elmondható, hogy a nemhez való tartozás és a beosztás függenek egymástól, azaz elutasítjuk a függetlenséget. |
5.5. Illeszkedésvizsgálat | ||||||||||||||||||||||||||||||||||
Egy valószínűségi változó eloszlására vonatkozó állítás vagy feltételezés ellenőrzését illeszkedésvizsgálatnak nevezzük. Attól függően, hogy a hipotézisünket mennyire konkretizáljuk, kétféle illeszkedésvizsgálatot különböztetünk meg: | ||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||
A sokaságot egy ismérv (többnyire mennyiségi, néha minőségi) alapján k-számú részre bontjuk, azaz az adott ismérv alapján osztályozzuk a sokaság egységeit. Ugyanezt azt osztályozást a mintán belül is elvégezzük. | ||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||
Az általunk feltételezett sokaság eloszlása minden ismérvváltozathoz egy maghatározott Pi valószínűséget rendel. A nullhipotézis tehát: | ||||||||||||||||||||||||||||||||||
H0:P(ci)=Pi i=1,2,...k, az alternatív hipotézisünk pedig: | ||||||||||||||||||||||||||||||||||
H1:P(ci)Pi | ||||||||||||||||||||||||||||||||||
A H0 helyességét a -próbafüggvénnyel vizsgálhatjuk meg: | ||||||||||||||||||||||||||||||||||
Ez a statisztikai vizsgálat a nullhipotézis helyessége esetén jó közelítéssel szf=(k-b-1) szabadságfokú -eloszlású, ahol a b a Pi valószínűségek meghatározásához szükséges olyan paraméterek száma, amelyeket a mintából becsülünk. | ||||||||||||||||||||||||||||||||||
b=1, ha a minta átlaga vagy szórása ismert | ||||||||||||||||||||||||||||||||||
Tiszta illeszkedésvizsgálat esetén a b=0. | ||||||||||||||||||||||||||||||||||
Mivel -próbafüggvény a nullhipotézistől való jelentős eltérést nagy pozitív értékkel jelzi, ezért az illeszkedésvizsgálatot a jobb oldali kritikus tartományra kell végrehajtani, azaz a felső kritikus értéket kell keresni, tehát az elfogadási tartomány pedig: | ||||||||||||||||||||||||||||||||||
. |
Bemutató feladat | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Egy gyorsbüfé hálózatban a vevőket 45 másodperc alatt kell kiszolgálni. A kiszolgálási idő megengedett szórása 7 másodperc. 400 véletlenül kiválasztott vendég kiszolgálási idő szerinti megoszlása a következő: | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ellenőrizzük azt a feltevést, hogy a minta az előírt paraméterű (átlag=45, szórás=7 másodperc) normális eloszlásból származott, P=5%-os szignifikancia szinten. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
A táblázatban vastagított számokat az alábbiak szerint kapjuk: | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
zif=(xif-)/=35-45/7=-1,43 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(-Z(if))=1-P(zi1) táblázatból | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pi=P'ik-P'ik-1=0,2389-0,0764=0,1625 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
f*i=n*Pi=400*0,0764=30,56 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(fi-f*i)2/f*i=(20-30,56)2/30,56=3,65 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ugyan így kell a többi értéket is kiszámítani | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
0=10,79 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Szf=6-1=5, 1-0,05(5)=11,1, az elfogadási tartomány (0;11,1). A számított érték az elfogadási tartományba esik, így elfogadjuk a nullhipotézist. A kiszolgálási időt 5%-os szignifikancia szinten 45 másodperc várható értékű és 7 másodperc szórású normális eloszlású valószínűségi változónak lehet tekinteni. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2. Egy széleskörű vizsgálat során, Magyarországon a 15 éves és idősebb népesség 15%-a sovány, 25 %-a normál súlyú, és 60 %-a túlsúlyos volt 1996-ban. 2005-ben 500 véletlenszerűen kiválasztott minta alapján 72 fő sovány, 176 fő normál súlyú és 252 fő pedig túlsúlyos volt. 1%-os szignifikancia szinten állíthatjuk-e, hogy a két eloszlás egyforma. A kérdés az illeszkedésvizsgálattal válaszolható meg. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
szf=3-1=2 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
0,99(2)=9,21 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
A két eloszlás nem egyezik. |
Önellenőrző feladatok | ||||||||||||||||||||||||||||
Jelölje meg a helyes választ! | ||||||||||||||||||||||||||||
1/a. Mely esetben alkalmazna z-próbát?
![]() | ||||||||||||||||||||||||||||
1/b. Mely esetben alkalmazna t-próbát?
![]() | ||||||||||||||||||||||||||||
1/c. Milyen próbát alkalmazna a sokasági szórás ellenőrzésére?
![]() | ||||||||||||||||||||||||||||
1/d. Milyen próbát alkalmazna a sokasági arány ellenőrzésére?
![]() | ||||||||||||||||||||||||||||
1/e. Milyen próbát alkalmazna egy sokasági változói eloszlásának vizsgálatára?
![]() | ||||||||||||||||||||||||||||
1/f. Függetlenségvizsgálat során arra keressük a választ,
![]() | ||||||||||||||||||||||||||||
2. Egy édesipari üzemben a cukorkát tartalmazó zacskók szabvány szerinti töltési tömege 50 dkg. A töltési tömeg normális eloszlású. Egy vizsgálat során a véletlenül kiválasztott 25 zacskó töltési tömege (dkg) az alábbi volt: | ||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||
2/a. Vizsgálja meg 5%-os szignifikancia szinten, hogy a zacskók töltési tömege megfelel-e a szabvány szerinti tömegnek! Írja be a mezőkbe a megfelelő értékeket! A számításokat az átlag esetében 1 tizedesjegy, a többi esetben 2 tizedesjegy pontossággal végezze el! A minta alapján az átlagos töltősúly: 49,6 dkg A minta alapján az átlagos töltősúly szórása: dkg ![]() | ||||||||||||||||||||||||||||
2/b Jelölje meg, hogy melyik hipotézist fogadjuk el!
![]() | ||||||||||||||||||||||||||||
3. Egy fémmegmunkáló üzemben az egyik csavartípus hosszmérete 50,00 mm 0,10mm szórással. A hosszméret normális eloszlású valószínűségi változó. A gyártás során véletlenül kiválasztottak 26 db csavart annak vizsgálatára, hogy nincs-e szignifikáns eltérés a névleges hosszmérettől. A mérések eredményei az alábbiak (mm): | ||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||
3/a. Vizsgálja meg 1%-os szignifikancia szinten, hogy van-e szignifikáns eltérés a legyártott csavarok névleges és tényleges hosszmérete között! Írja be a mezőkbe a megfelelő értékeket! A számításokat az átlag esetében 1 tizedesjegy, a többi esetben 2 tizedesjegy pontossággal végezze el! A minta alapján az átlagos hosszméret: 49,925 mm A próbafüggvény számított értéke: ![]() | ||||||||||||||||||||||||||||
3/b Jelölje meg, hogy melyik hipotézist fogadjuk el!
![]() | ||||||||||||||||||||||||||||
3/c Válassza ki a helye megfogalmazást!
![]() | ||||||||||||||||||||||||||||
4. Egy adott technológiával gyártott háztartási gép szabvány szerinti élettartama 12 ezer üzemóra, 3 ezer üzemóra szórással. Módosítottak a gyártási technológián és az új technológiával készült háztartási gépek közül kiválasztottak 100-at, ezek az átlagos élettartama 15 ezer üzemóra 3,2 ezer üzemóra szórással. | ||||||||||||||||||||||||||||
Ellenőrizze 2%-os szignifikancia szinten, hogy az új technológiával gyártott háztartási gépek átlagos élettartama meghaladja-e a szabvány szerintit! | ||||||||||||||||||||||||||||
4/a Válassza ki a helyes hipotézist!
![]() | ||||||||||||||||||||||||||||
4/b Írja be a mezőkbe a megfelelő értékeket! Ha szükséges a számok helyett használja a matematikai karaktereket! A próbafüggvény számított értéke: ![]() | ||||||||||||||||||||||||||||
4/c Jelölje be a helyes állítást!
![]() | ||||||||||||||||||||||||||||
5. Vizsgálja meg 5%-os szignifikancia szinten az előző feladat adati alapján, hogy a gépek élettartamának szórása eltér-e szabványtól! | ||||||||||||||||||||||||||||
5/a Válassza ki a helyes hipotézist!
![]() | ||||||||||||||||||||||||||||
5/b Írja be a mezőkbe a megfelelő értékeket! Ha szükséges a számok helyett használja a matematikai karaktereket! A számításokat 1 tizedesjegy pontossággal végezze el! A próbafüggvény számított értéke: ![]() | ||||||||||||||||||||||||||||
5/c Jelölje meg, hogy melyik hipotézist fogadjuk el!
![]() | ||||||||||||||||||||||||||||
6. Az egy főre jutó húsfogyasztás vizsgálatára 160 elemű mintát vettek, a minta adatai az alábbiak: | ||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||
Állapítsa meg, hogy az egy főre jutó húsfogyasztás tekinthető-e normális eloszlású valószínűségi változónak 5%-os szignifikancia szinten! A számításokat az átlag és a szórás esetében 1 tizedesjegy, a többi esetben a bemutató feladatnál látható pontossággal végezze el! | ||||||||||||||||||||||||||||
6/a Válassza ki a helyes hipotézist!
![]() | ||||||||||||||||||||||||||||
Megjegyzés: b=2, mert a minta átlaga és szórása ismert. | 6/b Írja be a mezőkbe a megfelelő értékeket! A próbafüggvény számított értékét és az intervallum felső határát 2 tizedesjegy pontossággal számítsa ki! A próbafüggvény számított értéke: ![]() | |||||||||||||||||||||||||||
6/c Jelölje meg, hogy melyik hipotézist fogadjuk el!
![]() | ||||||||||||||||||||||||||||
7. Egy diabetikus szeretné meghatározni, hogy a napszak befolyásolja-e a kávéfogyasztást. A kávéház vendéginek mintája alapján feljegyezték a fogyasztást: | ||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||
5%-os szignifikancia szinten a diabetikus elfogadja, vagy elutasítja azt a nullhipotézist, hogy a kávérendelések száma azonos a különböző napszakokban? | ||||||||||||||||||||||||||||
7/a Írja be a mezőkbe a megfelelő értékeket! A próbafüggvény számított értékét és az intervallum felső határát 2 tizedesjegy pontossággal számítsa ki! A próbafüggvény számított értéke: ![]() | ||||||||||||||||||||||||||||
7/b Jelölje meg, hogy melyik hipotézist fogadjuk el!
![]() | ||||||||||||||||||||||||||||
7/c Válassza ki a helye megfogalmazást!
![]() | ||||||||||||||||||||||||||||
8. A televíziós főszezon első 13 hetén keresztül vizsgálták szombat este 8-9 óra között a nézettségi arányokat: Az A-televíziót a nézők 29%-a, a B-televíziót a nézők 28%-a, a C-televíziót a nézők 25%-a, a D-televíziót a nézők 18%-a választotta. A társaságok megváltoztatták szombat esti programjaikat, majd a változtatás után két héttel 300 háztartást megkérdeztek, melyik adást nézik: A-televízió 95 háztartás, B-televízió 70 háztartás, C-televízió 89 háztartás, D-televízió 46 háztartás. Legyen a szignifikancia szint és vizsgálja, hogy megváltoztak-e a nézettségi arányok! | ||||||||||||||||||||||||||||
8/a Írja be a mezőkbe a megfelelő értékeket! A próbafüggvény számított értékét 2 tizedesjegy pontossággal számítsa ki! A relatív gyakoriságot 2 tizedesjegyre kerekítve használja a számítások során! A próbafüggvény számított értéke: ![]() | ||||||||||||||||||||||||||||
8/b Jelölje meg, hogy melyik hipotézist fogadjuk el!
![]() | ||||||||||||||||||||||||||||
8/c Válassza ki a helye megfogalmazást!
![]() |