MODUL: III. modul: Matematikai statisztika
18. lecke: Egyszerűbb statisztikai mérőszámok meghatározása
| Tananyag: Kiss Béla - Krebsz Anna: Valószínűség-számítás és matematikai statisztika 3.1., 3.2. és 3.3. fejezet |
Elméleti összefoglaló |
A mintaelemek számtani középértékét mintaátlagnak, vagy empirikus középnek nevezzük és -pal jelöljük, azaz . |
A mintaelemek közepüktől való eltérésnégyzeteinek átlagát a minta szórásnégyzetének, vagy empirikus (tapasztalati) szórásnégyzetének nevezzük és -tel jelöljük, azaz . |
A korrigált tapasztalati szórásnégyzetet az formulával definiáljuk. |
A valószínűség-számítás részben mondottakkal megegyezően igazolható, hogy az empirikus szórásnégyzet alakban is írható. |
A mintavételi változók nagyság szerint növekvően rendezett értékei közül az i-ediket -vel (i = 1, ..., n) jelöljük. |
A minta legkisebb és legnagyobb elemének számtani közepét, azaz -t a minta középpontjának nevezzük. |
A minta legnagyobb és legkisebb elemének különbségét, azaz -t a minta terjedelmének nevezzük. |
A minta (empirikus) mediánja, ha n = 2m -1, és , ha n = 2m, azaz páratlan elemszám esetén a középső érték, páros elemszám esetén pedig a két középső érték átlaga. |
A minta eloszlásfüggvénye (empirikus eloszlásfüggvény) , ahol a minta növekvő nagyság szerint rendezett elemei közül az i -edik. |
Legyen egy adott n elemű minta, az a,b számokra pedig teljesüljön az és a feltétel. Osszuk fel az intervallumot m részintervallumra (osztályra) az osztópontok segítségével. Az egyes részintervallumba eső mintaelemek számát jelöljük -vel (i = 1, 2, ..., m). |
A gyakorisági hisztogramot úgy kapjuk, hogy az intervallumra magasságú téglalapot rajzolunk (i = 1, 2, ..., m). |
A sűrűség hisztogramot úgy kapjuk, hogy az intervallumra magasságú téglalapot rajzolunk (i = 1, 2, ..., m). |
Kidolgozott feladatok |
1. feladat Egy focicsapat játékosainak cm-ben mért magasságai a következők: 189, 191, 185, 188, 190, 175, 180, 178, 185, 179, 184. Határozzuk meg ezen adathalmaz jellemzőit: |
a) | mintaátlag | b) | tapasztalati szórásnégyzet | c) | korrigált tapasztalati szórásnégyzet | d) | a minta középpontja | e) | terjedelem | f) | medián |
|
Megoldás: |
a) | a mintaátlag: , azaz
| b) | tapasztalati szórásnégyzet: , azaz
| c) | korrigált tapasztalati szórásnégyzet: , azaz
| d) | a minta középpontja: Ehhez először nagyság szerint nem csökkenő sorrendben kell rendezni az adatokat: 175, 178, 179, 180, 184, 185, 185, 188, 189, 190, 191. A minta középpontja a rendezett mintában az első és az utolsó elem átlaga, azaz
| e) | a minta terjedelme: A legnagyobb és a legkisebb elem különbsége, azaz
| f) | a minta mediánja: A rendezett mintában a középső érték (páros elemszámú minta esetén a két középső átlaga), azaz most a hatodik, tehát 185. |
|
2. feladat Egy középiskola végzős diákjai a következő eredményt érték el a matematika érettségin: jeles (5): 15 fő jó (4): 23 fő közepes (3): 38 fő elégséges (2): 32 fő elégtelen(1): 10 fő Készítsük el az érdemjegyek gyakorisági hisztogramját, határozzuk meg a mintaátlagot, a mediánt, a tapasztalati szórást és a korrigált tapasztalati szórást! |
Megoldás: Az egyes részintervallumok hossza megegyezik (egységnyi), az oszlopok magassága pedig a gyakorisági értékkel egyenlő. |

|
A mintaátlag: Az összes diák: Így az átlag: A medián: Páros elemszámú minta esetén a rendezett minta két középső elemátlaga, azaz most a 118 elemű mintánál az 59. és a 60. elem átlaga. A rendezett minta:
Mivel az 59. és 60. elem is 3, ezért a medián . A tapasztalati szórás: A tapasztalati szórás a tapasztalati szórásnégyzet négyzetgyöke. A tapasztalati szórásnégyzet meghatározására most célszerűbb a formulát használni. Ebből már ismert.
Így a tapasztalati szórásnégyzet: , a tapasztalati szórás pedig: A korrigált tapasztalati szórást természetesen a korrigált tapasztalati szórásnégyzetből fogjuk meghatározni, amelyről tudjuk, hogy . Így a korrigált tapasztalati szórásnégyzet: , a korrigált tapasztalati szórás pedig: Látható, hogy a tapasztalati szórás és a korrigált tapasztalati szórás között nagy elemszámú mintánál igen csekély az eltérés (most kevesebb, mint 0,005). |
3. feladat Egy vállalat dolgozóinak bruttó fizetéseiről a következőket tudjuk: 50 000-100 000 Ft: 3 fő 100 000-150 000 Ft: 6 fő 150 000-200 000 Ft: 5 fő 200 000-250 000 Ft: 3 fő 250 000-300 000 Ft: 2 fő Készítsük le a bruttó fizetések gyakorisági hisztogramját, tapasztalati eloszlásfüggvényét, továbbá a mintaátlag és a minta szórásnégyzetének becslését! |
Megoldás: A gyakorisági hisztogram: Az egyes részintervallumok hossza 50 000 egység (egyenletes felosztás), a téglalapok magassága pedig az adott intervallumba eső elemek számával egyenlő. |

|
A tapasztalati eloszlásfüggvény: Osztályokban (tól-ig) adott gyakoriságok esetén a tapasztalati eloszlásfüggvénynél az ugrásokat az osztályközepeknél jelöljük. Esetünkben az osztályok: , , , és (ezer Ft), így az osztályközepek pedig 75, 125, 175, 225, 275 (ezer Ft). A tapasztalati eloszlásfüggvény: |

|
Az egyes téglalapok magassága: , , , , |
A mintaátlag becslése: , ahol n a minta elemszáma, m az osztályok száma, az i-edik osztályba eső elemek száma, pedig az osztályközép. Így a mintaátlag becslése:
|
A tapasztalati szórásnégyzet becslése:
A szórás becslése így |
| Ellenőrző feladatok |
1. Adott a következő minta: 8,22; 6,42; 7,53; 6,55; 8,07; 7,37; 7,56; 9,02; 8,55; 7,93. A mintaátlag: |
2. A fenti minta tapasztalati szórása: |
3. A fenti minta korrigált tapasztalati szórása: |
4. A fenti minta mediánja: |
5. A fenti minta terjedelme: |
6. Ha egy 9 elemű minta tapasztalati szórása 1,24, akkor korrigált tapasztalati szórásnégyzete: |
7. Ha egy statisztikai minta minden eleme 12, akkor tapasztalati szórása |
8. A tapasztalati eloszlásfüggvény |
9. Az alábbiak közül melyik hamis: |