KURZUS: Statisztika II.

MODUL: II. modul: Hipotézisvizsgálat

4. lecke: Alapfogalmak

Követelmények

Ön akkor sajátította el megfelelően a tananyagot, ha

  • tudja mit jelent a hipotézisvizsgálat,
  • tudja a próbafüggvény lehetséges értékeinek tartományát, és annak felbontását,
  • ki tudja választania felsorolásból a szignifikancia szint jelentését,
  • tudja a hipotézisvizsgálat során elkövetett hibákat.
Tananyag

Az eddigi becslési eljárások során a sokasági paramétert ismeretlennek tekintettük, és a mintából származó adatok segítségével közelítőleg meghatároztuk az ismeretlen sokaság értékét. A hipotézisvizsgálatnál a sokaságról állítunk valamit, majd a rendelkezésünkre álló minta alapján ellenőrizzük az állítás helyességét.

Az egy vagy több sokaságra vonatkozó állítást, feltevést hipotézisnek nevezzünk. A hipotézis vonatkozhat az egy vagy több sokaság eloszlására, vagy az adott eloszlások egy vagy több paraméterére is. A különféle hipotézisek vizsgálatára szolgáló eljárásokat statisztikai próbáknak nevezzük. A próba egy olyan eljárás, amelynek során a mintából származó információk alapján döntünk a hipotézis elfogadásáról, vagy elutasításáról.

A hipotézisvizsgálat első lépése a vizsgálni kívánt hipotézis megfogalmazása. Pontosabban mindig két hipotézist fogalmazunk meg, egy úgynevezett nullhipotézist (H0), és egy ezzel szemben álló alternatív hipotézist (H1). A vizsgálat során a két hipotézist "versenyeztetjük", és azt fogadjuk el igaznak, amelyik a mintavétel eredménye alapján hihetőbbnek tűnik a másiknál. A két hipotézist úgy kell megfogalmazni, hogy:

  • akármelyiket is tekintjük majd a másiknál hihetőbbnek, megválaszolható legyen a bennünket érdeklő kérdés;
  • a formális logikai szabályai szerint kizárják egymást, azaz egyszerre ne lehessenek igazak, de együtt minden lehetőséget kimerítsenek.

A hipotézis lehet egyszerű, ha fennállásának feltételezése a sokaság eloszlását egyértelműen meghatározottá teszi. Ellenkező esetben összetett hipotézisről beszélünk, azaz az egyszerű hipotézisek halmazáról.

A hipotézisek megfogalmazása után a feladatunk a mintaelemek egy olyan függvényének a keresése, amelynek valószínűség-eloszlása a nullhipotézis helyességének feltételezése, a sokaságra tett bizonyos kikötések és a mintavétel adott módja mellet egyértelműen meghatározható. Az e követelményeknek eleget tevő függvényt próbafüggvénynek nevezzük. A próbafüggvény hasonló szerepet tölt be a hipotézisvizsgálat során, mint a becslőfüggvény a becsléskor. A próbafüggvény konstruálása matematikai feladat.

A hipotézis helyességének ellenőrzése a próbafüggvény lehetséges értékeinek teljes tartományát osztópontok segítségével (Ca; Cf) két egymást át nem fedő tartományra bontjuk. Az egyik az elfogadási tartomány (E), a másik egy elutasítási vagy kritikus tartomány (K). Az egyes tartományok határait úgy válaszuk meg, hogy a próbafüggvény értéke a nullhipotézis elfogadása esetén előre megadott valószínűséggel ( p=1α ) az elfogadási tartományba essen, és a kritikus tartományba esés csak α-valószínűséggel következzen be. Az ( 1α ) a konfidencia szint, ennek komplementere a szignifikancia szint ( α). A próbafüggvény kritikus tartományba esésének valószínűségét szignifikancia szintnek nevezzük, és α-val jelöljük. Pl.: α=0,05 szignifikancia szint azt jelenti, hogy ha a mintavételt végtelen sokszor végrehajtjuk, akkor 100 esetből összesen 5-ször fordul elő az, hogy a próbafüggvényünk minta alapján kiszámított értéke a kritikus tartományba esik.

Ha ezek után a rendelkezésre álló minta adataiból kiszámítjuk a próbafüggvény úgynevezett aktuális értékeit, és ez beleesik az elfogadási tartományba, akkor a nullhipotézist elfogadjuk, ellenkező esetben a nullhipotézist elutasítjuk, és az alternatív hipotézist fogadjuk el.

Az elfogadási és a kritikus tartomány egymáshoz viszonyított elhelyezése háromféle lehet:

1. Baloldali kritikus tartomány:

2. Kétoldali kritikus tartomány:

3. Jobboldali kritikus tartomány:

Egyoldali kritikus tartományhoz abban az esetben jutunk, ha az ellenhipotézisben a nullhipotézishez képest egy meghatározott irányú eltérést írunk fel.

  • ha a sokasági várható értékre H1: μ< m 0 , akkor baloldali,
  • ha H1: μ> m 0 , akkor jobboldali kritikus tartományról beszélünk.

Kétoldali kritikus tartomány kijelölésére olyan esetben kerül sor, amikor a nullhipotézisben megfogalmazott állítástól való bármilyen irányú eltérés érdekel bennünket (H1: μ m 0 ).

A hipotézisvizsgálat során elkövetett hibák

A mintából a sokaságra vonatkozóan csak valószínűségi következtetés lehetséges, így a hipotézisvizsgálat során hozott döntésünk bizonyos kockázattal jár.

  • Előfordulhat, hogy a nullhipotézis helyes, és a próbafüggvény adott mintából számított értéke mégis a kritikus tartományba esik, Ilyenkor a nullhipotézist annak ellenére, hogy fennáll, elutasítjuk. Ezt a hibás döntést elsőfajú hibának nevezzük. Az ilyen hiba elkövetésének valószínűsége az elfogadási és a kritikus tartomány konstrukciója alapján α, amelyet szignifikanciaszintnek nevezünk.
  • Előfordul, hogy a nullhipotézis nem áll fenn (nem igaz), és a próbafüggvény mintából számított értéke mégis az elfogadási tartományba esik. Ez szintén hibás döntés, és ilyenkor másodfokú hibát követünk el. Ezen esemény bekövetkezésének valószínűségét β-val jelöljük.
Valóságos helyzetH0-ra vonatkozó döntés
Elfogadjukelutasítjuk
H0 igazHelyes döntés
1α
Elsőfajú hiba
α
H1 igazMásodfajú hiba
β
Helyes döntés
1β

Az ( 1α ) valószínűséget a próba megbízhatósági szintjének, az ( 1β )-t pedig a próba erejének nevezzük.

A minta elemszámának növelésével - adott szignifikancia szint és alternatív hipotézis esetén - csökkenthető a másodfajú hiba elkövetésének valószínűsége, illetve minél távolabb van μ paraméter valóságos értéke a nullhipotézisben szereplő feltételezett értéktől, annál kisebb lesz β-értéke.

A hipotézisvizsgálat menet:

1.Megfogalmazni a nullhipotézist és az alternatív hipotézist.
2.Próbafüggvény keresése a nullhipotézisben megfogalmazott állításnak megfelelően.
3.Kiválasztani a szignifikancia szintet
4.Mintavétel, és a próbafüggvény értékének kiszámítása.
5.Az elfogadási és kritikus tartomány megállapítása a szignifikancia szintnek megfelelően.
6.Döntés a nullhipotézis helyességének elfogadásáról, vagy a nullhipotézis elutasítása.
Önellenőrző kérdések

Jelölje be a helyes állításokat!

1/a
A hipotézisvizsgálatnál a sokasági paraméter ismeretlen, és azt próbafüggvény segítségével határozzuk meg.
A hipotézisvizsgálatnál a sokaságról állítunk valami, és annak helyességét a minta alapján próbafüggvény segítségével ellenőrizzük.
1/b
A hipotézisvizsgálat során általában több hipotézist fogalmazunk meg.
A hipotézisvizsgálat során egy hipotézist fogalmazunk meg.
A hipotézisvizsgálat során egy nullhipotézist és egy alternatív hipotézist fogalmazunk meg.
1/c
A próbafüggvény lehetséges értékeinek tartományát két tetszőleges részre bontjuk
A próbafüggvény lehetséges értékeinek tartományát két egymást át nem fedő részre bontjuk
A próbafüggvény lehetséges értékeinek tartományát több tetszőleges részre bontjuk

Folytassa a mondatot a helyes megfogalmazással!

2/a. A próbafüggvény elfogadási tartományba esésének valószínűségét...
szignifikancia szintnek nevezzük.
konfidenciaszintnek nevezzük.
2/b. A próbafüggvény kritikus tartományba esésének valószínűségét...
szignifikancia szintnek nevezzük, és α-val jelöljük.
szignifikancia szintnek nevezzük, és 1α -val jelöljük.
2/c. Az elfogadási tartomány...
ahol a nullhipotézis elutasításra kerül.
ahol az alternatív hipotézis elutasításra kerül.
2/d. A hipotézisvizsgálat elsőfajú hibája
hogy a nullhipotézis helyes, és a próbafüggvény adott mintából számított értéke mégis a kritikus tartományba esik
hogy a nullhipotézis nem áll fenn, és a próbafüggvény mintából számított értéke mégis az elfogadási tartományba esik.

Válassza ki a megfogalmazáshoz tartozó jelöléseket!

3/a. A baloldali kritikus tartomány:
H1: μ> m 0
H1: μ< m 0
H1: μ m 0
3/b. A kétoldalú kritikus tartomány:
H1: μ> m 0
H1: μ< m 0
H1: μ m 0