KURZUS: Matematika (Valószínűség-számítás és matematikai statisztika)

MODUL: III. modul: Matematikai statisztika

20. lecke: Az egy- és kétmintás t-próba

Tananyag: Kiss Béla - Krebsz Anna: Valószínűség-számítás és matematikai statisztika 3.6.4., és 3.6.5. fejezet

Elméleti összefoglaló

Az egymintás t-próba

Alkalmazása: Ismeretlen D( ξ )=σ szórású és ismeretlen M( ξ )=m várható értékű normális eloszlású ξ valószínűségi változó várható értékére vonatkozó m 0 hipotézis helyességének ellenőrzése.

A próba statisztika: t ^ n1 = m ^ n m s ^ n n , ahol n a minta elemszáma.

Eloszlása: A t ^ n1 (n-1) szabadságfokú Student-eloszlású valószínűségi változó.

Megjegyzés. Általában csak kis minta elemszám esetén használjuk, mivel nagy elemszámú minta esetén az eloszlása közelítőleg standard normális eloszlású és az u próba megfelelő alakjával helyettesíthető.

A kétmintás t-próba

Alkalmazása: Ismeretlen D( ξ )= σ 1 és D( η )= σ 2 , de megegyező σ= σ 1 = σ 2 szórású és ismeretlen M( ξ )= m 1 és M( η )= m 2 várható értékű normális eloszlású ξ és η valószínűségi változók várható értékének különbségére vonatkozó m 0 = m 0,1 m 0,2 hipotézis helyességének ellenőrzése.

A próba statisztika: t ^ ( n 1 + n 2 2 ) = m ^ n 1 m ^ n 2 m 0 ( n 1 1 ) s ^ n 1 2 +( n 2 1 ) s ^ n 2 2 n 1 + n 2 2 1 1 n 1 + 1 n 2 , ahol n 1  a ξ-re, n 2   pedig az η-ra vonatkozó független minta elemszáma.

Eloszlása: A t ^ ( n 1 + n 2 2 ) ( n 1 + n 2 2 ) -szabadságfokú Student-eloszlású valószínűségi változó.

Megjegyzés: Általában csak kis minta elemszám esetén használjuk, mivel nagy elemszámú minta esetén az eloszlása közelítőleg standard normális eloszlású és az u próba megfelelő alakjával helyettesíthető.

Kidolgozott feladatok

1. feladat Egy bizonyos típusú csavar tömege normális eloszlást követ, de sem a szórást, sem a várható értéket nem ismerjük. Egy 10 elemű mintát vizsgálva a csavarok tömegére az alábbiakat kaptuk (g): 12,01; 12,03; 11,95; 12,1; 11,9; 11,96; 12,12; 11,16; 11,87; 12,22. Igaz-e 95%-os szignifikanciaszinten, hogy a csavarok tömegének várható értéke 12 g?

Megoldás: Kis elemszámú, normális eloszlásból származó minta áll rendelkezésünkre, várható értékét vizsgáljuk, tehát jogosan alkalmazzuk a t-próbát.
nullhipotézis: H 0 :m=12 g
ellenhipotézis: H 1 :m12 g
Az egyenlőséggel megfogalmazott nullhipotézis miatt kétoldali próbát alkalmazunk. A minta elemszáma n=10 , ezért a t ^ n1 = m ^ n m s ^ n n próbastatisztika n1=9 szabadsági fogú Student (t) eloszlású.
Tudjuk, hogy P( t 1 < t ^ < t 2 )=0,95 ; P( t ^ < t 1 )=0,025 és P( t 2 < t ^ )=0,025 . A Student-eloszlás táblázatát felhasználva t 1 és t 2 értéke meghatározható. Jelöljük a k-szabadsági fokú Student eloszlású valószínűségi változó eloszlásfüggvényét T k ( x ) -szel. Ekkor mivel P( t 2 < t ^ )=0,025 , ezért P( t ^ < t 2 )=0,975 . Tehát T 9 ( t 2 )=0,975 , ebből t 2 =2,2622 adódik, a szimmetria miatt pedig t 1 =2,2622 .
Tehát az elfogadási tartomány: ( 2,2622;2,2622 ) .
Az elutasítási tartomány: ( ;2,2622 ) és ( 2,2622; ) .
A megadott minta jellemzői:
m ^ n =11,932
s ^ n =0,2914
n=10
A próbastatisztika helyettesítési értéke:
t ^ n1 = m ^ n m s ^ n n = 11,93212 0,2914 10 =0,7379
Mivel a kapott érték az elfogadási tartományba esik, ezért a hipotézist elfogadjuk.

2. feladat Egy iskola egyik évfolyamán a tanulók magassága normális eloszlást követ. 16 tanuló magasságát megmérve azt tapasztaljuk, hogy az átlagmagasságuk 165,2 cm, a korrigált tapasztalati szórás pedig 6,3 cm. Igaz-e 98%-os szignifikanciaszinten, hogy a tanulók magasságának várható értéke legalább 166 cm?

Megoldás: Normális eloszlásból származó, kis elemszámú, ismeretlen szórású mintát vizsgálunk, tehát alkalmazhatjuk a t-próbát.
nullhipotézis: H 0 :m166 cm
ellenhipotézis: H 1 :m<166 cm
Az egyenlőtlenséggel megadott nullhipotézis miatt egyoldali próbát alkalmazunk. Mivel a minta elemszáma n=16 , ezért a próbastatisztika n1=15 szabadsági fokú Student (t) eloszlású.
A P( t ^ < t 1 )=0,02 és P( t ^ > t 1 )=0,98 kifejezésekből t 1 -et meghatározhatjuk. A szimmetria miatt P( t ^ > t 1 )=P( t ^ < t 1 )=0,98 , vagyis T 15 ( t 1 )=0,98 . Táblázatból visszakeresve azt kapjuk, hogy t 1 =2,2485 , így t 1 =2,2485 .
Az elutasítási tartomány: ( ;2,2485 ) .
Az elfogadási tartomány: ( 2,2485; ) .
A próbastatisztika helyettesítési értéke:
t ^ n1 = m ^ n m s ^ n n = 165,2166 6,3 16 =0,5079
Mivel a kapott érték az elfogadási tartományba esik, ezért a hipotézist elfogadjuk.

3. feladat Egy fagylaltárus által kiadott gombócok tömegét vizsgáltuk, és a következő eredményeket kaptuk (dkg): 4,1; 4,6; 4,5; 3,9; 4,2; 4,5; 3,8; 4,3. Tételezzük fel, hogy a gombócok tömege normális eloszlást követ. Igaz-e 95%-os szignifikanciaszinten, hogy a tömeg várható értéke kevesebb, mint 4 dkg?

Megoldás: Kis elemszámú, normális eloszlásból származó minta alapján akarunk dönteni a várható értékről, tehát alkalmazhatjuk a t-próbát.
nullhipotézis: H 0 :m4 dkg
ellenhipotézis: H 1 :m<4 dkg
Az egyenlőtlenséggel megfogalmazott nullhipotézis miatt egyoldali próbát alkalmazunk.
A P( t ^ < t 1 )=0,95 és P( t ^ > t 1 )=0,05 kifejezésekből t 1 értéke meghatározható. Mivel a minta elemszáma n=8 , ezért t ^ eloszlása n1=7 szabadsági fokú Student (t) eloszlás. Így P( t ^ < t 1 )=0,95 -ből T 7 ( t 1 )=0,95 . Táblázatból visszakeresve t 1 =1,8946 adódik.
Tehát az elfogadási tartomány: ( ;1,8946 ) .
Az elutasítási tartomány: ( 1,8946; ) .
A feladatban szereplő minta jellemzői:
m ^ n =4,2375
s ^ n =0,2924
n=8
A próbastatisztika helyettesítési értéke:
t ^ n1 = m ^ n m s ^ n n = 4,23754 0,2924 8 =2,2973
A kapott érték az elutasítási tartományba esik, ezért a hipotézist nem fogadjuk el az adott szignifikanciaszinten.

4. feladat Egy termék hossza névlegesen 10 mm. Ellenőrzésképp 12 mérést végeztek. A kapott eredmények 10,2; 9,4; 10,1; 9,8; 10,4; 10,0; 10,2; 9,6; 11,1; 10,8; 10,3; 10,4. Tételezzük fel, hogy a termék hossza normális eloszlást követ. Igaz-e 98%-os szignifikanciaszinten, hogy a hossz várható értéke 10 mm?

Megoldás: Most is jogos a t-próba alkalmazása, akárcsak az előző esetekben.
nullhipotézis: H 0 :m=10 mm
ellenhipotézis: H 1 :m10 mm
Az egyenlőséggel megfogalmazott nullhipotézis miatt kétoldali próbát alkalmazunk.
A P( t 1 < t ^ < t 2 )=0,98 ; P( t ^ < t 1 )=0,01 és P( t 2 < t ^ )=0,01 egyenlőségekből t 1 és t 2 értéke meghatározható.
Mivel P( t 2 < t ^ )=0,01 , ezért P( t ^ < t 2 )=0,99 . A minta elemszáma n=12 , ezért t ^ eloszlása n1=11 szabadsági fokú Student (t) eloszlás. Így T 11 ( t 2 )=0,99 . Ebből t 2 =2,7181 adódik, a szimmetria miatt pedig t 1 =2,7181 .
Tehát az elfogadási tartomány: ( 2,7181;2,7181 ) .
Az elutasítási tartomány: ( ;2,7181 ) és ( 2,7181; ) .
A feladatban szereplő minta jellemzői:
m ^ n =10,1916
s ^ n =0,4738
n=12
A próbastatisztika helyettesítési értéke:
t ^ n1 = m ^ n m s ^ n n = 10,191610 0,4738 12 =1,4008
A kapott érték az elfogadási tartományba esik, ezért a hipotézist elfogadjuk.

5. feladat Két különböző (A és B) gyár által készített, ugyanolyan célt szolgáló termékek tömegét vizsgáltuk. A kapott eredmények (g):
A: 8,2 8,1 8,8 8,4 8,4 8,0 8,5 8,9 8,6 B: 8,6 8,3 8,9 8,2 8,9 8,1 8,9
Tételezzük fel, hogy a termékek hossza mindkét esetben normális eloszlású, a szórás pedig mindkét esetben azonos. Igaz-e 95%-os szignifikanciaszinten, hogy a két gyár által készített termékek tömegének várható értéke egyenlő?

Megoldás: Két kis elemszámú, azonos szórású normális eloszlásból származó minta alapján hasonlítjuk össze a két sokaság várható értékét, tehát alkalmazhatjuk a kétmintás t-próbát.
nullhipotézis: H 0 : m 1 = m 2 (azaz m= m 1 m 2 =0 )
ellenhipotézis: H 1 :m= m 1 m 2 0
Az egyenlőséggel megfogalmazott nullhipotézis miatt kétoldali próbát alkalmazunk. A minták elemszáma n 1 =9 és n 2 =7 , így t ^ n 1 + n 2 2=14 szabadsági fokú Student (t) eloszlású.
P( t 1 < t ^ < t 2 )=0,95 , P( t ^ < t 1 )=0,025 és P( t 2 < t ^ )=0,025 . Mivel P( t 2 < t ^ )=0,025 , ezért P( t ^ < t 2 )=0,975 . Így T 14 ( t 2 )=0,975 . Ebből t 2 =2,1448 adódik, a szimmetria miatt pedig t 1 =2,1448 .
Az elfogadási tartomány: ( 2,1448;2,1448 ) .
Az elutasítási tartomány: ( ;2,1448 ) és ( 2,1448; ) .
Az adott minták jellemzői:
m ^ n 1 =8,4333
s ^ n 1 =0,3041
n 1 =9
m ^ n 2 =8,5571
s ^ n 2 =0,3552
n 2 =7
A próbastatisztika helyettesítési értéke:
u ^ = m ^ n 1 m ^ n 2 m 0 ( n 1 1 ) s ^ n 1 2 +( n 2 1 ) s ^ n 2 2 n 1 + n 2 2 1 1 n 1 + 1 n 2 = 8,43338,55710 80,0924+60,1261 9+72 1 9 + 1 7 =0,7518
A kapott érték az elfogadási tartományba esik, azaz a két gyár által készített termékek hosszának várható értéke az adott szignifikanciaszinten megegyezik.

6. feladat Józsi bácsi és Mari néni szomszédok, mindketten dinnyét termesztenek. Egy alkalommal megmértek 6-6 véletlenszerűen kiválasztott dinnyét. A kapott értékek (kg):
Józsi bácsi: 8,1 5,3 7,6 6,9 7,2 8,2 Mari néni: 5,2 6,7 9,1 8,3 7,1 6,6 .
Tételezzük fel, hogy a dinnyék tömege mindkét esetben normális eloszlást követ, és a szórásuk megegyezik. Igaz-e 95%-os szignifikanciaszinten, hogy Józsi bácsi dinnyéi tömegének nagyobb a várható értéke?

Megoldás: Kis elemszámú, egyező szórású, normális eloszlásból származó mintákat vizsgálunk a várható érték szempontjából, így alkalmazhatjuk a kétmintás t-próbát. Vizsgáljuk a feltett kérdés (igaz-e, hogy m 1 > m 2 ) helyett az ellentettjét (igaz-e, hogy m 1 m 2 ). Ekkor alkalmazhatjuk a már eddig is használt módszereket.
nullhipotézis: H 0 : m 1 m 2 (azaz m= m 1 m 2 0 )
ellenhipotézis: H 1 :m= m 1 m 2 >0

Az egyenlőtlenséggel megfogalmazott nullhipotézis miatt egyoldali próbát alkalmazunk.
P( t ^ < t 1 )=0,95 és P( t 1 < t ^ )=0,05 . Mivel a minták elemszáma n 1 =6 és n 2 =6 , ezért t ^ eloszlása n 1 + n 2 2=10 szabadsági fokú t-eloszlás.

P( t ^ < t 1 )=0,95 -ből T 10 ( t 1 )=0,95 adódik, amiből t 1 =1,8125 adódik.
Az elfogadási tartomány: ( ;1,8125 ) .
Az elutasítási tartomány: ( 1,8125; ) .

Az adatok jellemzői:
Józsi bácsi:
m ^ n 1 =7,2167
s ^ n 1 =1,0648
n 1 =6
Mari néni:
m ^ n 2 =7,1667
s ^ n 2 =1,3735
n 2 =6

A próbastatisztika helyettesítési értéke:
u ^ = m ^ n 1 m ^ n 2 m 0 ( n 1 1 ) s ^ n 1 2 +( n 2 1 ) s ^ n 2 2 n 1 + n 2 2 1 1 n 1 + 1 n 2 = 7,21677,16670 51,1338+51,8865 6+62 1 6 + 1 6 =0,0705

A kapott érték az elfogadási tartományba esik, ezért a hipotézist elfogadjuk az adott szignifikanciaszinten, vagyis az adott szignifikanciaszinten nem igaz, hogy Józsi bácsi dinnyéi tömegének nagyobb a várható értéke (hiszen ennek ellenkezőjét fogadtuk el).

Ellenőrző kérdések
1. Az m= m 0 hipotézist vizsgáljuk 95%-os szignifikanciaszinten egymintás t-próbával. Ha 14 elemű mintával dolgozunk, akkor az elfogadási tartomány:
a) ( 1,7613; 1,7613 )
b) ( 2,1604; 2,1604 )
c) ( 1,7709; 1,7709 )
d) ( 2,7613; 2,7613 )
2. Az m m 0 hipotézist vizsgáljuk 98%-os szignifikanciaszinten egymintás t-próbával. Ha 10 elemű mintával dolgozunk, akkor a kritikus tartomány:
a) ( 2,3984;  )
b) ( 2,3593;  )
c) ( 2,8214;  )
d) ( 2,7638;  )
3. Az m m 0 hipotézist vizsgáljuk 99%-os szignifikanciaszinten egymintás t-próbával. Ha 15 elemű mintával dolgozunk, akkor az elfogadási tartomány tartomány:
a) ( 2,9467;  )
b) ( 2,6025;  )
c) ( 2,9768;  )
d) ( 2,6245;  )
4. Egy bizonyos üdítőital palackban lévő mennyiségét vizsgálva az alábbi eredményeket kaptuk (cm3): 246, 243, 251, 251, 247, 248, 252, 250. tudjuk, hogy a palackba került ital mennyisége normális eloszlást követ. Igaz-e 95%-os szignifikanciaszinten, hogy a térfogat várható értéke 250 cm3?
a) A próbastatisztika értéke -1,3817, a hipotézist elvetjük.
b) A próbastatisztika értéke -1,6333, a hipotézist elfogadjuk.
c) A próbastatisztika értéke -1,6333, a hipotézist elvetjük.
d) A próbastatisztika értéke -1,3817, a hipotézist elfogadjuk.
5. Egy normális eloszlású valószínűségi változót 12 elemű minta alapján vizsgálunk. A minta jellemzői: m ^ n =81,3 és s ^ n =3,4 . Igaz-e 98%-os szignifikanciaszinten, hogy a valószínűségi változó várható értéke 80?
a) A próbastatisztika értéke 1,3245, a hipotézist elfogadjuk.
b) A próbastatisztika értéke 1,3245, a hipotézist elvetjük.
c) A próbastatisztika értéke 1,5673, a hipotézist elfogadjuk.
d) A próbastatisztika értéke 1,5673, a hipotézist elvetjük.
6. Két indián néptörzs, a toltékok és a truztékok fiainak magasságát vizsgáljuk. Feltételezhetjük, hogy a magasság mindkét esetben normális eloszlást követ, és ezen normális eloszlású valószínűségi változók szórása megegyezik. A mérési adatok (cm): Toltékok: 165, 163, 170, 158, 162, 159, 173, 168, 167. Truztékok: 162, 159, 172, 163, 180, 173, 161.Igaz-e 98%-os szignifikanciaszinten, hogy a magasságok várható értéke megegyezik?
a) A próbastatisztika értéke 2,3457, a hipotézist elvetjük.
b) A próbastatisztika értéke -0,6659, a hipotézist elfogadjuk.
c) A próbastatisztika értéke -1,5017, a hipotézist elfogadjuk.
d) A próbastatisztika értéke 1,8522, a hipotézist elfogadjuk.
7. Két azonos szórású normális eloszlásból származó minta alapján vizsgáljuk a várható értékek egyenlőségét 95%-os szignifikanciaszinten. A minták elemszáma 10 és 12. Ekkor az elfogadási tartomány:
a) ( 2,0739; 2,0739 )
b) ( 1,7171; 1,7171 )
c) ( 2,0860; 2,0860 )
d) ( 1,7247; 1,7247 )