MODUL: III. modul: Matematikai statisztika
19. lecke: Az egy- és kétmintás u-próba
| Tananyag: Kiss Béla - Krebsz Anna: Valószínűség-számítás és matematikai statisztika 3.5., 3.6.2. és 3.6.3. fejezet |
Elméleti összefoglaló |
Statisztikai hipotézisen (feltevésen) egy vagy több, valószínűség-eloszlásra vonatkozó feltevést értünk. |
Statisztikai próbának nevezzük azt az eljárást, amely alapján egy statisztikai hipotézisről döntünk. |
Elméleti lépések: |
1. | Az ismeretlen eloszlásra vagy az eloszlás ismeretlen paraméterére (például az előző tapasztalatok alapján) egy nullhipotézist állítunk fel. Az eloszlás vagy paraméter számára a nullhipotézistől eltérő más lehetőségek bizonyos halmazát, esetleg az összes más lehetőséget együttesen ellenhipotézisnek, vagy alternatív hipotézisnek nevezzük és -gyel jelöljük. | 2. | A feltevésünk ellenőrzésére mintavételen alapuló konzisztens statisztikai függvényt konstruálunk. | 3. | Meghatározzuk a statisztikai függvény eloszlását. | 4. | Kijelöljük az eloszlás kritikus tartományát, ahova a statisztikai függvény, mint valószínűségi változó, értéke csak kicsiny (pl.: 5%, 1%, 0,1%) valószínűséggel esik. A kritikus tartományt elutasítási tartománynak is nevezzük. A kritikus tartomány komplementerét elfogadási tartománynak hívjuk. A döntés szintjét jellemző számot a próba szignifikancia szintjének vagy röviden a próba szintjének nevezzük. |
|
A kritikus tartomány kijelölése: |
1. | A feltétellel megadott kétoldali próba esetén a kritikus tartomány egy és egy intervallum uniójából áll. Az intervallumok és a határait az eloszlásfüggvényének felhasználásával az és az feltételekből határozzuk meg. Az elfogadási tartomány ekkor az intervallum. (Egyenlőséggel megfogalmazott hipotézis esetén alkalmazzuk.) | 2. | A feltétellel megadott egyoldali próba esetén a kritikus tartomány egy intervallum. Az intervallum határát az eloszlásfüggvényének felhasználásával a feltételből határozzuk meg. Az elfogadási tartomány ekkor az intervallum. (Egyenlőtlenséggel (nagyobb) megfogalmazott hipotézis esetén alkalmazzuk.) | 3. | A feltétellel megadott egyoldali próba esetén a kritikus tartomány egy intervallum. Az intervallum határát az eloszlásfüggvényének felhasználásával a feltételből határozzuk meg. Az elfogadási tartomány ekkor a intervallum. (Egyenlőtlenséggel (kisebb) megfogalmazott hipotézis esetén alkalmazzuk.) |
|
Gyakorlati lépések: |
1. | Mintát veszünk az alapsokaságból. | 2. | A minta adatokból kiszámítjuk a statisztikai függvény helyettesítési értékét. | 3. | A kapott számérték alapján döntünk: | | a) | Megtartjuk a nullhipotézist, ha a kiszámított helyettesítési érték az elfogadási tartományba esik. | | b) | Elvetjük a nullhipotézist, ha a kiszámított helyettesítési érték a kritikus (elutasítási) tartományba esik. Ekkor a feltételezett eloszláshoz képest egy valószínűtlen esemény következett be. Ekkor szignifikáns (jelentős) az adatokban tükröződő eltérés a feltétevésünkhöz képest. |
|
Egy statisztikai próbát paraméteres próbának nevezünk, ha az alapsokaság valamely paraméterére vagy paramétereire vonatkozik. |
A továbbiakban egy statisztikai mintát nagy elemszámúnak mondunk, ha a mintaelemek n száma legalább 30, mivel ekkor a standard normális és a Student-eloszlással számított valószínűség értékek már alig különböznek. |
Az egymintás u-próba |
Alkalmazása: Egy ismert szórású, de ismeretlen várható értékű normális eloszlású valószínűségi váltózó várható értékére vonatkozó hipotézis helyességének ellenőrzése. |
A próba statisztika:, ahol n a minta elemszáma. |
Eloszlása: A nullhipotézis fennállása esetén standard normális eloszlású valószínűségi változó. |
Megjegyzések. |
1. | Nagy elemszámú minta esetén, a centrális határérték tétel miatt a próba a eloszlásától függetlenül közelítőleg normális eloszlású, ezért ebben az esetben a próba nem normális eloszlású valószínűségi változó esetén is alkalmazható. | 2. | Nagy elemszámú minta esetén a próba akkor is alkalmazható, ha a szórás nem ismert. Ekkor a szórás a mintából történő becslésével helyettesíthető és a próba statisztika alakúra módosul. | 3. | Nagy elemszámú minta esetén, ha egy A esemény karakterisztikus valószínűségi változója, akkor a próbával az A esemény valószínűségére vonatkozó hipotézis ellenőrzésére is alkalmazható, mivel ekkor . |
|
A kétmintás u-próba |
Alkalmazása: Ismert és szórású, de ismeretlen és várható értékű normális eloszlású és valószínűségi változók várható értékének különbségére vonatkozó hipotézis helyességének ellenőrzése. |
A próba statisztika:, ahol a -re, pedig az -ra vonatkozó független minta elemszáma. |
Eloszlása: A nullhipotézis fennállása esetén standard normális eloszlású valószínűségi változó. |
Megjegyzések. |
1. | Nagy elemszámú minta esetén a centrális határérték tétel miatt a próba a és eloszlásától függetlenül közelítőleg normális eloszlású. Ezért ebben az esetben a próba nem normális eloszlású valószínűségi változók esetében is alkalmazható. | 2. | Ha , azaz a szórások megegyeznek, akkor a próbastatisztika alakúra egyszerűsíthető. | 3. | Nagy elemszámú minta esetén ha , de a közös szórás nem ismert, akkor az a mintából történő becslésével helyettesíthető és a próba statisztika: alakúra módosul. |
|
Kidolgozott feladatok |
1. feladat Egy bizonyos alkatrész egyik jellemző mérete az előírás szerint 3,2 mm. Tudjuk, hogy ez a méret normális eloszlást követ, továbbá az is ismert, hogy a szórás 0,054 mm. 10 db véletlenszerűen kiválasztott alkatrész megfelelő méretének átlaga 3,28 mm. Igaz-e 98%-os szignifikanciaszinten, hogy az alkatrész jellemző méretének várható értéke 3,2 mm? |
Megoldás: Ismert szórású, normális eloszlású valószínűségi változó várható értékére vonatkozó hipotézist vizsgálunk, ezért jogos az u-próba alkalmazása. nullhipotézis: ellenhipotézis: Kétoldali próbát alkalmazunk, mert -t egyenlőséggel fogalmaztuk meg (nem egyenlő lehet kisebb is és nagyobb is). A kritikus és az elfogadási tartomány kijelölése: Tudjuk, hogy a próbastatisztika standard normális eloszlású, ezért a standard normális eloszlás eloszlásfüggvényéből tudjuk meghatározni a tartományok határait. Az elfogadási tartomány alakú, míg az elutasítási (kétoldali) tartomány és . A feltétel szerint , és . Az utóbbi másként , vagyis . Ebből . A szimmetria miatt . Tehát az elfogadási tartomány: . Az elutasítási (kritikus) tartomány: és . Határozzuk meg a próbastatisztika helyettesítési értékét!
Mivel a kapott érték a kritikus tartományba esik, ezért a hipotézist az adott szinten elvetjük. |
2. feladat Egy konzerv töltőtömege normális eloszlású valószínűségi változó, 15 g szórással. A konzervgyár szerint a töltőtömeg várható értéke legalább 250 g. Ennek ellenőrzésére egy villámteszten 12 mérést végeztek. A kapott mintaátlag 248,2 g. Igaz-e a konzervgyár állítása 95%-os szignifikanciaszinten? |
Megoldás: Ismert szórású, normális eloszlású valószínűségi változó várhatóértékére vonatkozó hipotézist vizsgálunk, ezért alkalmazhatjuk az u-próbát. nullhipotézis: ellenhipotézis: Egyoldali próbát alkalmazunk, mert -t egyenlőtlenséggel fogalmaztuk meg. A kritikus és az elfogadási tartomány kijelölése: A kritikus tartomány , az elfogadási tartomány pedig alakú. u-t most is a standard normális eloszlás eloszlásfüggvényéből határozzuk meg. A feltétel szerint és . Az előbbi szerint , de tudjuk, hogy , így , ebből , vagyis . Tehát a kritikus tartomány , az elfogadási tartomány pedig . A próbastatisztika helyettesítési értéke:
Mivel a kapott érték az elfogadási tartományba esik, ezért a konzervgyár állítását igaznak fogadjuk el az adott szignifikanciaszinten. |
3. feladat Egy termék élettartamának vizsgálatakor 150 mérést végeztek. A kapott eredmények (órában) és . Igaz-e 98%-os szignifikancia szinten, hogy a termék élettartamának várható értéke legfeljebb 1000 óra? |
Megoldás: Bár nem tudjuk, hogy az élettartam milyen eloszlást követ és a szórás sem ismert, de a nagy elemszámú minta (150 mérés) miatt alkalmazhatjuk az u-próbát. nullhipotézis: ellenhipotézis: Most is egyoldali próbát alkalmazunk az egyenlőtlenséggel megfogalmazott miatt. A kritikus és az elfogadási tartomány kijelölése: Az elfogadási tartomány , a kritikus tartomány pedig alakú. u meghatározását most is segítségével végezzük. és . Az elsőből u meghatározható: , vagyis . Tehát az elfogadási tartomány: , a kritikus tartomány pedig . A próbastatisztika helyettesítési értéke:
Mivel a kapott érték az elfogadási tartományba esik, ezért a nullhipotézist az adott szignifikancia szinten elfogadjuk. |
4. feladat Egy termék hossza névlegesen 100 mm. Ennek ellenőrzésére 120 mérést végeztek. A kapott eredmények és . Igaz-e 98%-os szignifikanciaszinten, hogy a hossz várható értéke 100 mm? |
Megoldás: A termék hosszának eloszlása és szórása nem ismert, de a nagy elemszámú minta (120) miatt most is használhatjuk az u-próbát. nullhipotézis: ellenhipotézis: Kétoldali próbát alkalmazunk, mert -t egyenlőséggel fogalmaztuk meg. Az elfogadási tartományra , míg a kritikus tartományra és . u1, és u2 segítségével meghatározható. Az utolsó kifejezésből , tehát , amiből és a szimmetria miatt . Tehát az elfogadási tartomány: , az elutasítási tartomány pedig és . A próbastatisztika helyettesítési értéke:
Mivel a kapott érték az elutasítási (kritikus) tartományba esik, ezért a nullhipotézist elvetjük. |
5. feladat Egy horgászzsinór teherbírása névlegesen 20 kg. Ennek ellenőrzésére 400 mérést végeztek. A kapott eredmények: és . Igaz-e 99%-os szignifikanciaszinten, hogy a teherbírás várható értéke 20kg? |
Megoldás: Ismeretlen az eloszlás típusa és szórása, de a nagy elemszámú minta miatt most is használhatjuk az u-próbát. nullhipotézis: ellenhipotézis: Kétoldali próbát alkalmazunk. Az elfogadási tartományra , míg a kritikus tartományra és . Az utóbbi kifejezésből , tehát . Ebből és a szimmetria miatt . Tehát az elfogadási tartomány: , az elutasítási tartomány pedig és . A próbastatisztika helyettesítési értéke:
Mivel a kapott érték az elutasítási (kritikus) tartományba esik, ezért a nullhipotézist nem fogadjuk el, nem igaz, hogy a teherbírás várható értéke 20 kg. |
6. feladat Az előző példában igaz-e 99%-os szignifikancaiszinten, hogy a teherbírás várható értéke legalább 19,5 kg? |
Megoldás: nullhipotézis: ellenhipotézis: Egyoldali próbát alkalmazunk: és . miatt . Mivel , ezért , amiből , vagyis . Tehát a kritikus tartomány , az elfogadási tartomány pedig . A próbastatisztika helyettesítési értéke:
Mivel a kapott érték az elfogadási tartományba esik, ezért a nullhipotézist elfogadjuk, vagyis a teherbírás várható értéke legalább 19,5 kg. |
7. feladat Két üzemben deszkákat készítenek. A deszkák hossza mindkét esetben normális eloszlást követ, az egyik gyárban , a másikban szórással. Az egyik üzemben 10, a másikban 12 elemű mintán vizsgálták a deszkák hosszát. A kapott eredmények: és . Igaz-e 95%-os szignifikanciaszinten, hogy a deszkák hosszának várható értéke a két üzemben megegyezik? |
Megoldás: Mivel a deszkák hossza mindkét esetben normális eloszlást követ és a szórások is ismertek, ezért alkalmazhatjuk a várható értékek különbségeinek vizsgálatára a kétmintás u-próbát. Mivel a várható értékek egyezését vizsgáljuk, ezért nullhipotézis: ellenhipotézis: Az egyenlőség miatt kétoldali próbát használunk. Mivel standard normális eloszlású, ezért az elfogadási és a kritikus tartományt most is segítségével határozhatjuk meg. , és . Mivel , ezért . Ebből pedig , tehát következik. A szimmetria miatt . Az elfogadási tartomány: . A kritikus tartomány: és . A próbastatisztika helyettesítési értéke:
Mivel a kapott érték az elfogadási tartományba esik, ezért a hipotézist elfogadjuk. |
8. feladat Az előző két üzemben új gépsort állítottak munkába. Azt nem tudjuk, hogy milyen eloszlást követ az elkészült deszkák hossza, de az ismert, hogy a szórás mindkét esetben kereken 2 cm. Ismét azt vizsgáljuk, hogy a két üzemben készült deszkák hosszának várható értéke egyenlő-e. Az első üzemben 100, a másodikban 120 elemű mintát vizsgáltak. A kapott eredmények: és . Most igaz-e 95%-os szignifikanciaszinten, hogy a minták várható értéke egyenlő? |
Megoldás: Bár a deszkák hosszának eloszlása nem ismert, de a nagy elemszámú minták és az ismert szórások miatt alkalmazhatjuk a kétmintás u-próbát. nullhipotézis: ellenhipotézis: Mivel a szignifikanciaszint azonos az előzővel, ezért az elfogadási és a kritikus tartomány is ugyanaz, mint előbb: az elfogadási tartomány: , a kritikus tartomány: és . A próbastatisztika helyettesítési értéke:
Mivel a kapott érték az elutasítási (kritikus) tartományba esik, ezért most nem fogadjuk el a hipotézist, vagyis a két új gépsoron készült deszkák hosszának várható értéke nem egyezik meg. |
9. feladat Ismét lecserélték a gépsort mindkét üzemben, de az új gépekről sem azt nem tudjuk, hogy milyen eloszlás szerint dolgoznak, sem azt, hogy milyen szórással, csupán annyi információ áll rendelkezésünkre, hogy a szórások megegyeznek. Most a mérési adatok: és , és , és . Igaz-e 98%-os szignifikanciaszinten, hogy a deszkák hosszának várható értéke megegyezik? |
Megoldás: A nagy elemszámú, ismeretlen eloszlású, ismeretlen, de megegyező szórású minták miatt az u-próba megfelelő alakja használható:
A nullhipotézis és az ellenhipotézis ugyanaz, mint az előző feladatokban: nullhipotézis: ellenhipotézis: Az elfogadási tartományra: . Az elutasítási tartományra: és . Mivel , ezért , amiből következik. Az elfogadási tartomány: . Az elutasítási tartomány: és . A próbastatisztika helyettesítési értéke:
A kapott érték az elutasítási tartományba esik, ezért a hipotézist nem fogadjuk el. |
| Ellenőrző kérdések |
1. Kétoldali u-próba esetén a 95%-os szignifikanciaszinthez tartozó elfogadási tartomány: |
2. Egymintás u-próba esetén az esetén a 98%-os szignifikanciaszinthez tartozó elutasítási (kritikus) tartomány: |
3. Az alábbiak közül melyik hamis: |
4. Az alábbiak közül melyik igaz: |
5. Egy termék hosszának vizsgálatakor 200 mérést végeztek. A mérési adatok alapján és . Igaz-e 95%-os szignifikanciaszinten, hogy a hossz várható értéke 200 cm? |
6. Egy normális eloszlású valószínűségi változó szórása 1,2, egy 12 elemű mintából meghatározott mintaátlag 11,3. Igaz-e 98%-os szignifikanciaszinten, hogy a valószínűségi változó várható értéke legalább 11,5? |
7. Két normális eloszlású valószínűségi változó várható értékét szeretnénk összehasonlítani. Az egyik szórása 2,1, a másik szórása 2,4. Mindkét esetben 10 elemű mintát vizsgáltunk, a mintaátlagok 22,3 és 21,8. Igaz-e 95%-os szignifikanciaszinten, hogy a két valószínűségi változó várható értéke megegyezik. |
8. Két valószínűségi változó várható értékét szeretnénk összehasonlítani. Az egyikből 100, a másikból 160 elemű minta áll rendelkezésünkre. Tudjuk, hogy mindkettő szórása 3,2. Az egyik minta átlaga 110,8, a másiké pedig 108,1. Igaz-e 98%-os szignifikanciaszinten, hogy a két valószínűségi változó várható értéke megegyezik? |