KURZUS: Kvantitatív módszerek
MODUL: III. modul: Matematikai statisztika
7. lecke Statisztikai becslés
Tananyag | ||||||||||||
A valószínűségi változó vizsgálatakor az lenne az ideális, ha végtelen nagy adathalmaz állna rendelkezésünkre, ugyanis ebben az esetben kapnánk csak elég pontos információkat a vizsgált sokaság különböző jellemzőiről. Végtelen sok adattal azonban nem tudunk dolgozni, mert a rendelkezésre álló erőforrások (idő, pénz, kapacitás stb.) ennek határt szabnak. Így a vizsgált valószínűségi változó véges számú megfigyelt értékeiből álló adathalmazt ismerjük, és ezekből az adatokból kell statisztikai következtetéseket levonni a valószínűségi változó eloszlására jellemző paramétereire. | ||||||||||||
7.1. Mintavételi eljárások | ||||||||||||
A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük. A sokaság tartalmazhat véges vagy végtelen sok elemet. A statisztikai sokaságból vizsgálat céljából kiválasztott csoportot mintának nevezzük. A mintavétel különböző eljárásokkal a sokaság n-számú elemének kiválasztásából áll. A kiválasztott elemekhez tartozó számértékeket mintavételi változóknak nevezzük, és úgy tekintjük, mint n-számú független és egyforma eloszlású valószínűségi változót. | ||||||||||||
A kiválasztott mintának reprezentatívnak kell lennie, azaz ugyanazokkal a tulajdonságokkal kell rendelkeznie, mint az alapsokaságnak, hiszen csak így tudunk a minta elemeivel végzett elemzések után következtetéseket levonni az alapsokságra vonatkozóan. | ||||||||||||
Egy sokaság elemszáma lehet véges és végtelen. A véges (N) elemszámú sokaság megadásának legegyszerűbb módja egyetlen ismérv szerint az alábbi: | ||||||||||||
Y1, Y2, ..., YN | ||||||||||||
Ha a sokaság végtelen számú, akkor nem adható meg ebben a formában. Ekkor két esetet különböztetünk meg: | ||||||||||||
| ||||||||||||
Összefoglalva: | ||||||||||||
| ||||||||||||
A gyakorlatban többnyire véges sokaságból történik a mintavétel. A sokaság milyenségétől függetlenül a belőle származó minta mindig véges, és elemszámát n-nel jelöljük. A minta megadása pedig az elemek felsorolásával történik: y=(y1, y2, .., yn). | ||||||||||||
Fontos kérdés, hogy hogyan válasszunk ki mintát a sokaságból. Ennek különböző módjai ismertek. A mintavételnél fontos követelmény a pontosság és az olcsóság. Hogy a kettő közül melyiket mennyire vesszük figyelembe, az meghatározza a mintaelemek kiválasztási módját. | ||||||||||||
A mintaelemek kiválasztása történhet visszatevéssel vagy visszatevés nélkül. | ||||||||||||
Visszatevéses mintavétel: a kiválasztott elemeket visszahelyezzük a mintába és így ugyanaz az elem többször is bekerülhet a mintába. (Ez a független, azonos eloszlású minta :FAE). Egy N elemszámú sokaságból n-elemet Nn-féleképpen választhatunk ki. | ||||||||||||
Visszatevés nélküli mintavétel: a kiválasztott elemet nem tesszük vissza, így minden mintaelem csak egyszer kerülhet a mintába (Egyszerű véletlen mintavétel (EV). Egy N elemszámú sokaságból n-elemet -féleképpen választhatunk ki. | ||||||||||||
Végtelen elemszámú sokaság esetén mindkét eljárásnál a minta elemei, mint valószínűségi változók, minden esetben függetlenek lesznek egymástól. Véges sokaság esetén csak a visszatevéses mintavétel eredményez független mintaelemeket. | ||||||||||||
Véges sokaság esetén a minta jellemzője az n/N kiválasztási arány, amely azt mutatja meg, hogy a sokaság elemeinek mekkora hányada kerül a mintába. | ||||||||||||
A mintavétel módja nagymértékben meghatározza a minta tulajdonságát, aminek igazi jelentősége a mintavételi hiba meghatározásánál van. | ||||||||||||
A mintával kapcsolatban fontos fogalom a kis és nagy minta. Ennek jelentőségét az adja, hogy a mintából számított jellemzők nagy részének (átlag, szórás stb.) eloszlása nagy minta esetén közelítőleg normális eloszlásúvá válik, így egyszerűbb kezelni. Kis mintaszám esetén ez általában nem mutatható ki. Szimmetrikus vagy ahhoz közel álló sokasági eloszlás esetén már viszonylag kis elemszámú minták (n>30) is nagy mintának tekinthetők, míg a szimmetrikustól eltérő sokaság esetén csak a több százas mintanagyság tekinthető nagy mintának. |
1. bemutató feladat | ||
Kis minta, visszatevéses mintavétellel | ||
Egy urnában 2 fekete és 8 fehér golyó van, 3 elemű mintát veszünk. Bármilyen golyót választunk ki elsőre, mivel visszatesszük, a 2. és 3. kiválasztáskor is ugyanolyan a sokaság állapota, azaz 2/10=1/5 a valószínűsége, hogy fehér, és 8/10=4/5 a valószínűsége annak, hogy fekete golyót húzunk. A mintaelemek kiválasztása független egymástól. | ||
Kis minta visszatevés nélküli mintavétellel | ||
1. kiválasztás: 1/5 a fekete és 4/5 a fehér kiválasztásának valószínűsége. | ||
Nagy minta visszatevéses mintavétellel | ||
Legye 200.000 fekete és 800.000fehér golyó az urnában. A fekete kiválasztásának valószínűsége itt is 1/5=0,2 | ||
Nagy minta visszatevés nélküli mintavétellel | ||
1. mintavétel: 1/5=0,2 a fekete valószínűsége |
A minta nagysága és a mintavétel módja mellett fontos a mintavételi eljárás megválasztása. A mintavételi eljárás során az alapsokaságból meghatározott számú egyedet választunk ki. A mintavételi eljárások sokféleségét az adja, hogy a minimális ráfordítással, maximális információt elve tartalmazza az olcsóság és fontosság ellentétét. Ezért a mintavételi eljárások mindig kompromisszumot takarnak a rendelkezésre álló pénz és idő, valamint az elérhető pontosság között. A mintavételi eljárások sokfélesége végül is ennek az ésszerű kompromisszumnak az adott vizsgálati célhoz való illesztését jelentik | ||
7.1.1. Véletlen mintavételi eljárások | ||
A véletlen mintavétel lényege, hogy a mintát alkotó elemek a kiválasztás során egyenlő valószínűséggel kerüljenek bele a mintába. Az ember a véletlen kiválasztás végrehajtására nem megfelelő, ugyanis a szubjektív kiválasztás általában nem felel meg az egyenlő valószínűség elvének, főleg nagy sokaság és minta esetén. | ||
Ha a sokaság minden tagjához egy sorszámot rendelünk, akkor egy olyan számsort kell megadnunk, amely a véletlenszerűséget biztosítja a mintavételkor. Ilyen számsort háromféleképpen adhatunk meg: | ||
| ||
A véletlen szám segítségével történő mintavétel csak olyan esetekben használható, ha a sokaság egyenletes eloszlású. | ||
Folytonos sokaság esetében a felezéses módszert alkalmazzák, addig felezik a mintát, amíg vizsgálható méretű mintanagyságot kapnak. | ||
7.1.1.1.Egyszerű véletlen mintavétel (EV) | ||
Homogén, véges elemszámú sokaság esetén visszatevés nélkül választjuk ki a mintát, elemenként egyenlő valószínűséggel. Véletlen szám segítségével történő mintavételkor az ismételten előforduló sorszámot átugorjuk. A mintavétel során az N elemű sokaságból -féle (N alatt az n) különböző összetételű mintát kapunk. | ||
Ez a módszer főleg a természettudományi kísérleteknél, főleg a biológiai eredmények értékelésekor alkalmazható. Társadalmi-gazdasági jelenségek vizsgálatára nem használható. | ||
7.1.1.2. Független, azonos eloszlású minta (FAE) | ||
FAE mintát akkor kapunk, ha homogén és végtelen sokaságból visszatevéssel veszünk mintát. Végtelen sokaságból vett visszatevés nélküli minta is lehet FAE-minta, hiszen a kiválasztott elemek nem befolyásolják a megmaradó sokaság eloszlását. Az egyes mintaelemek kiválasztása azonos valószínűséggel történik. Tipikus alkalmazási területe a tömegtermelés minőségi ellenőrzésének. | ||
7.1.1.3. Rétegezett mintavétel (R) | ||
A rétegezett mintavétel során a vizsgált ismérv szempontjából heterogén sokaságot több homogén (minél kisebb szórású) részsokaságra bontjuk úgy, hogy a csoportok kiadják a teljes sokaságot, továbbá egyetlen sokasági elem se tartozzon két vagy több csoportba. Az egyes rétegeken belül a minta elemének a kiválasztása egyszerű véletlen mintavétellel történik. Ez a módszer a társadalomtudományok területén nagyon gyakori. | ||
| ||
7.1.1.4. Csoportos mintavétel (Cs) | ||
A homogén sokaságot csoportokra bontjuk, a mintát egyszerű véletlen mintavétellel kiválasztott csoport egyedei alkotják. A csoportok meghatározása lehet természetes, azaz eleve adott, de mesterségesen is történhet. Az N elemű sokaságot M részre bontjuk, ahol az egyes csoportok ni eleműek, és . | ||
Főleg közvélemény-kutatáskor alkalmazzák ezt a mintavételt. | ||
7.1.1.5. Többlépcsős mintavétel (TL) | ||
Homogén sokaság vizsgálata esetén alkalmazható. Először csoportos mintavétellel kiválasztjuk az elsődleges mintavételi egységeket. 1-1 homogén nagyobb csoportból egyszerű véletlen kiválasztással egyedeket jelölünk ki, amelyek kiscsoportokat alkotnak. Ha megfelelő a minta, akkor kétlépcsős mintavételről beszélünk. Ha nem, akkor a kiscsoportokkal tovább ismételjük az eljárást. | ||
7.1.2. Nem véletlen mintavételi eljárások | ||
A véletlen mintavétel esetén elkövetett hibák valószínűség-számítási ismeretek segítségével meghatározhatóak. A nem véletlen mintavétel esetén kapott minta és az eredeti sokaság között azonban nehéz a mintavétel során elkövetett hibákat számszerűsíteni, a torzításokat kiszűrni. | ||
A torzítások csak csökkenthetők, de nem szűrhetők ki teljesen. A torzítások minimalizálása érdekében célszerű, ha | ||
| ||
A nem véletlen mintavételi eljárások tipikus esetei a társadalmi vizsgálatok, sok esetben személyes megkérdezés során alakul ki az információ. | ||
7.1.2.1. Szubjektív kiválasztás | ||
Önkényesnek is nevezik, mivel a mintavevő a szakmai ismeretére támaszkodva az általa jellemzőnek tartott egyedeket választja ki a sokaságból. | ||
7.1.2.2. Kvóta szerinti kiválasztás | ||
Előre megadjuk a minta összetételét, azaz előre rögzített megoszlási viszonyszámnak megfelelő lesz a minta. Ehhez megfelelő információ szükséges a sokaságról a vizsgált ismérv szerint. A véletlennel kombinált kvóta kiválasztás azonban jobb, mint a csak kvóta szerinti. A kvótás eljárás a rétegezett mintavételhez hasonló eredményt ad. A lakosság körében végzett felmérések, az adatvédelem miatt egyre inkább kvótás eljárással készülnek. | ||
7.1.2.3. Koncentrált kiválasztás | ||
Feltételezi, hogy a sokaság vizsgált jellemzőjét döntően kevés számú egyed határozza meg. A mintavétel során ezeket, a meghatározó elemeket választjuk ki. Pl.: a nemzetgazdasági fogyasztással kapcsolatos elemzések során a fogyasztói árindex meghatározásánál a legnagyobb mértékben fogyasztott termékeket választják ki. | ||
7.1.3. Kombinált kiválasztás | ||
A véletlen és a tudatos kiválasztás kombinációja. Az N elemű véges sokaságot a vizsgálandó ismérv alapján sorba rendezzük. Az n mintaelem-szám megadása után a sokaság minden k-adik eleme bekerül a mintába olyan módon, hogy | ||
(a hányados egész része) | ||
Összefoglalásul elmondható, hogy a mintavétel alapvető célja, hogy létrehozzon az alapsokaság helyett egy kevesebb költséggel és idővel vizsgálható részsokaságot, amely minta elegendő információt nyújt arra, hogy belőle az eredeti sokaságra levont következtetéseink valószínűségi értelemben kellően pontosak legyenek. | ||
7.1.4. Mintavételi hiba | ||
A statisztikai adatfelvételek és az annak eredményeit felhasználó elemzések mindig tartalmaznak hibát. A statisztikai hiba egy része a módszertan sajátosságaiból is adódik (tömörítés, közelítés, becslés), ez velejárója a statisztikai elemzéseknek. A statisztikus célja, hogy a hibát minimálisra csökkentse (mintavételi és nem mintavételi hibát együtt). A mintavételi hiba matematikai-statisztikai eszközökkel becsülhető. A nem mintavételi hiba korábbi tapasztalatok alapján becsülhető meg. A mintavétel tervezésénél a mintavételi hibával és annak vizsgálatával foglalkozunk. | ||
Egy adott sokaság esetén egy meghatározott számú mintát nemcsak egyféleképpen lehet kiválasztani, így minden minta más és más összetételű. | ||
Vegyünk egy példát, amelynél ismerjük a teljes sokaságot, de a gyakorlatban ez ritkán valósul meg, hisz a mintavételre pont azért van szükség, mert a teljes alapsokaságot nem ismerjük. |
2. bemutató feladat | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
A Ferihegyre érkező külföldi légitársaságok adatai: | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Megoldás: | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Vegyük most 2, 3 és 5 elemű mintákat, és számítsuk ki az átlagokat és a szórásokat mintánként. Az elemeket az alábbiak szerint választhatjuk ki: | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Látható, hogy az egyes mutatók értéke mintánként változó, a mintákból számított átlagok az alapsokaság átlaga körül szóródnak. Ez a szóródás a nagyobb minták esetén kisebb, azaz a nagyobb mintákból számított átlagok pontosabban jelzik a sokaságot. Bármelyik mintából számított átlaggal jellemezzük a sokaságot, hibát követünk el. A mintavételi hiba a sokaság jellegén az alkalmazott mintavételi eljárástól és alapvetően a mintanagyságtól is függ. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
7.2.Statisztikai becslés | ||
A statisztikai becslés az alapsokaságot alkotó valószínűségi változók eloszlásának, jellemzőinek és paramétereinek becslését jelenti az alapsokaságból vett mintából számított mutatók alapján. A statisztikai becsléseket úgynevezett becslőfüggvények segítségével végezzük el. A becslőfüggvény olyan valószínűségi-változó függvény, ami valamely sokasági jellemző mintából történő közelítő meghatározására szolgál. | ||
Egy sokasági jellemzőre több becslőfüggvény is készíthető. Ahogy a véletlen minta elemei valószínűségi változók, ugyanúgy a becslőfüggvény értéke is az. Egy adott n-elemű minta csak egyetlen becsült értékkel rendelkezik. A minta alapján az alapsokaságnak többféle jellemzője is becsülhető, pl.: | ||
| ||
A becslőfüggvény akkor lesz jó, ha a különféle (véletlen) minták esetén értéke a becsülni kívánt jellemző körül ingadozik, és az ingadozás lehetőleg kicsi. A becslőfüggvénnyel szemben támasztott követelmények: | ||
| ||
Torzítatlanság | ||
Torzítatlannak nevezünk egy becslőfüggvényt, ha annak várható értéke megegyezik a becsülni kívánt sokasági jellemzővel. Azaz: | ||
Két becslőfüggvény közül, ha más kritériumot nem veszünk figyelembe, a torzítatlant részesítjük előnybe. A torzítás mértékét a torzítás mérőszámával (Bs) lehet kifejezni. Torzítatlan becslőfüggvény esetén: | ||
Két torzított becslőfüggvény esetén azt tekintjük a jobbnak, amelyiknél a torzítás abszolút értéke kisebb, azaz az alábbi esetben: | ||
az első becslőfüggvényt választjuk. | ||
Hatásosság | ||
Egy torzítatlan becslőfüggvénynek lehet olyan nagy a szóródása, hogy ez használhatatlanná teszi a becslésre. Ha a és a torzítatlan becslőfüggvénye -nak, és a , akkor azt mondjuk, hogy a hatásosabb becslőfüggvénye -nak, mint a . A becslőfüggvény valamennyi lehetséges mintán felvett értékeiből számított szórásnégyzetet mintavételi szórásnégyzetnek, ennek négyzetgyökét pedig a becslőfüggvény, illetve a becslés standard hibájának nevezzük. . | ||
Két torzítatlan becslőfüggvény szórásnégyzetét hányados formában összehasonlítva relatív hatásfoknak nevezzük. . Ha értéke nagyobb mint 1, akkor a a hatásosabb. | ||
Konzisztencia | ||
Követelménye azt írja elő, hogy a becslés torzítatlan legyen, és a mintanagyság minden határon túl történő növelése esetén annak a valószínűsége, hogy a becsülni kívánt paraméter és a becslőfüggvény eltérése kisebb egy ? számnál egy legyen vagy a szórásnégyzete a nullához tartson. | ||
vagy | ||
Más szóval: nagy minta esetén a becsült érték nagy valószínűséggel közelítse meg a sokasági jellemző értékét. | ||
Robosztusság | ||
Akkor mondjuk, hogy egy becslőfüggvény robosztus, ha az érzéketlen a kiinduló feltételekre. Ha a sokasági eloszlást nem ismerjük, akkor a becslésre a robosztus becslőfüggvényt használjuk. | ||
7.2.1.Intervallumbecslés | ||
Jelölje egy valószínűségi változó eloszlásfüggvényét, "a" pedig a valószínűségi változó eloszlásának egy jellemző paraméterét, amelynek értékét nem ismerjük, Egy n-elemű mintát veszünk; x1, x2,...,xn-értékekkel és ebből a mintából következtetünk az a-paraméterre. A mintavételi változókból létrehozunk egy függvényt, amelynek értéke ingadozik mintáról mintára, de következtetni lehet belőle a-értékére. Azt mondjuk, hogy az a-paraméter statisztikai becslése. Az -becslést torzítatlannak mondjuk, ha várható értéke a-val megegyezik. Az általában nem egyezik meg a-val. Gyakorlatilag elegendő annyit tudnunk, hogy a valódi a-paraméter benne van egy intervallumban, amelyet a minta alapján határozunk meg. A becslésnek ezt a módját intervallumbecslésnek nevezzük, az intervallumot pedig megbízhatósági vagy konfidencia intervallumnak. | ||
Megadunk egy közepű intervallumot, amelybe a-értéke egyhez közelálló valószínűséggel beleesik, azaz: | ||
. | ||
Ahol d: az intervallum szélessége, (1-p) pedig azt a valószínűséget jelenti, amellyel a megadott intervallum lefedi az a-paramétert | ||
Az (1-p)-t százalékban szoktuk megadni. Leggyakrabban használt értékei: 90%; 95%; és 99%. A p a hibaszázalékot jelenti. Az intervallum szélessége a p-értékétől, a minta elemszámától és szórásától. függ | ||
Általában szimmetrikus intervallumokat keresünk. Az intervallumbecslésnél is több esetet különböztetünk meg. | ||
7.2.1.1. Intervallumbecslés a várható értékre: Normális eloszlású sokaság esetén, ha a sokaság szórása () ismert | ||
Legyen valószínűségi változó normális eloszlású várható értékkel és szórással. Tegyük fel, hogy értékét ismerjük, de értéke ismeretlen. Vegyünk egy n-elemű mintát és becsüljük meg -paramétert a minta átlagával. | ||
A becsléshez a z-próbafüggvényt alkalmazunk. | ||
Keressük azt a intervallumot, melybe nagy, (1-) valószínűséggel beleesik a valószínűségi változó várható értéke. | ||
A központi határeloszlás tétel szerint független, azonos eloszlású valószínűségi változók összegének standardizáltja közelítőleg standard normális eloszlású. | ||
Mivel -re (várható értékre) keressük az intervallumot, ezért a konfidencia intervallum az alábbi lesz: | ||
. | ||
: a mintából meghatározott várható érték | ||
Konkrét minta esetén: | ||
. | ||
Először ki kell számolni a standard hibát: | ||
A zp értékét "A standard normális eloszlás eloszlásfüggvényeinek értékei" című táblázatból keressük ki a megfelelő valószínűségi szinten (p). | ||
Az intervallumbecslés általában kétoldalú, mivel a becsült érték köré szimmetrikus intervallumot szerkesztünk, azaz az intervallum alsó és felső határát pontosan meghatározzuk. Ebben az esetben a táblázatból nem az (1-) valószínűségi szinthez tartozó értéket keressük, hanem az (1-/2)-hez tartozót. | ||
Ha (1-)=95%=095, akkor =0,05, tehát /2=0,025, így (1-/2)=0,975. A "z"-értékek táblázatból a 0,975-höz tartozó értéket keressük ki, amely 1,96, azaz z0,975=1,96. | ||
Egyoldalú intervallum esetén, az (1-) valószínűségi szinthez tartozó értéket keressük, az intervallumnak csak a felső határát tudjuk megállapítani, az alsó határ a negatív végtelen lesz. A "z"-értékek táblázatból a 0,95-höz tartozó értéket keressük ki, amely 1,65, azaz z0,95=1,65. | ||
A mennyiséget hibahatárnak vagy maximális hibának nevezzük, és -val jelöljük. | ||
A várható érték tehát: | ||
A becslési hibahatárt többféleképpen csökkenthetjük: | ||
|
3. bemutató feladat | ||
Egy gépkocsi típus átlagos fogyasztásának szórása a gyári adatok alapján 0,9 l/100 km. A vizsgálat céljából vett 50 elemű minta átlaga 6,2 l/100 km. 95%-os megbízhatósági szinten állapítsuk meg a fogyasztás konfidencia intervallumát! | ||
Megoldás: | ||
a) Először ki kell számolni a standard hibát: | ||
A "z"-értékek táblázatból a 0,975-höz tartozó értéket keressük ki: z0,975=1,96 | ||
A gépkocsik átlagos fogyasztása 5,95 és 6,45 liter között van 100 km-ként. | ||
b) Nézzük meg, ha a minta elemszáma 100 lett volna, hogyan alakul a konfidencia intervallum. | ||
| ||
A gépkocsik átlagos fogyasztása 6,02 és 6,38 liter között van 100 km-ként. | ||
c) Legyen a megbízhatósági szint 90%, az elemszám az eredetei, azaz n=50 | ||
z0,95=1,65 | ||
| ||
A gépkocsik átlagos fogyasztása 5,99 és 6,41 között van 100 km-ként. | ||
4. bemutató feladat | ||
Legyen egy ismeretlen várható értékű és ismert szórású valószínűségi változó. A várható értéket egy 56 elemű mintából becsüljük, a minta átlaga 18,3. Határozzuk meg a várható érték mintaátlaggal történő becslésének 98%-os megbízhatósági szintű konfidencia intervallumát! | ||
Megoldás: | ||
A "z"-értékek táblázatból a 0,99-hez tartozó értéket keressük ki: z0,975=2,33 | ||
A várható érték tehát 18,30,932, azaz |
7.2.1.2. Intervallumbecslés a várható értékre: Normális eloszlású sokaság esetén, ha a sokaság szórása nem ismert | ||
Illetve nem normális, de ismert eloszlású sokaság esetén, ha nagy mintát vettünk | ||
Legyen valószínűségi változó normális eloszlású, várható értékkel és szórással. Tegyük fel, hogy értéke és értéke ismeretlen. Vegyünk egy n-elemű mintát és becsüljük meg paramétert a minta átlagával. | ||
Mivel az alapsokaság szórása nem ismert, így azt is becsülni kell, azaz a mintából számítjuk ki. Ilyenkor z-valószínűségi változó helyett t-valószínűségi változót (Student-féle eloszlás) használjuk. | ||
A t-eloszlású valószínűségi változó szabadságfoka: szf=n-1. | ||
A hibahatár: , | ||
az intervallum pedig: | ||
A t-eloszlás is szimmetrikus eloszlás, azaz a z-eloszláshoz hasonlóan alakul az egy- és kétoldalú intervallum. A szabadságfok növelésével a t-eloszlás egyre inkább közelít a normális eloszláshoz, száznál nagyobb mintaszám esetén a két eloszlás eltérése minimális. |
5. bemutató feladat | ||
Egy konzervüzemben az egyik műszakban elkészült konzervek töltési súlyának átlagát szeretnénk meghatározni. 500 minta alapján az átlagos töltőtömeg 497 g, a töltőtömeg szórása 19,49g. 95%-os valószínűséggel mennyi a konzervek töltősúlya? | ||
A konfidencia intervalluma g, azaz 495,29 és 498,71 g között várható a konzervek súlya. | ||
6. bemutató feladat | ||
Egy ebédszállító cégnél 100 napig figyelve az adagokat azt kapjuk, hogy az egytálételek tömegének átlaga 43,2 dkg, 2 dkg-os szórással. Adjunk meg 98%-os megbízhatósági szinten a konfidencia intervallumot az étel tömegének várható értékére! | ||
Megoldás: | ||
A konfidencia intervalluma g, azaz 42,728 és 43,672 g között van az étel tömegének várható értékére. |
7.2.1.2. Normális eloszlású sokaság szórásnégyzetének és szórásának konfidencia intervalluma | ||
A sokasági szórásnégyzet () becslésére a torzítatlan becslést eredményező korrigált tapasztalati szórásnégyzetet (s2) használjuk. | ||
Ha Y normális eloszlású, akkor bizonyítható, hogy az változó (n-1) szabadságfokú -eloszlást követ. A -eloszlás aszimmetrikus, így a konfidencia intervallum az alábbi: | ||
Átrendezve: | ||
és a értékét táblázatból kell kikeresni a megfelelő szabadságfoknál és valószínűségi szintnél. | ||
Konkrét minta esetén a szórás intervalluma a következő: | ||
7. bemutató feladat | ||
250 g-os kávét csomagoló gép működését vizsgálva 100 elemű mintát veszünk. A töltési tömeg normális eloszlású. Határozzuk meg, hogy milyen határok között lesz a kávécsomagok töltési tömegének szórása 95%-os valószínűségen. Az átlag töltési súly 248g, a minta szórása 5,53g. | ||
Megoldás: | ||
Szf=100-1=99; =0,05, /2=0,025, 1-/2=0,975, | ||
A nettó töltési tömeg szóródása (ingadozása) 95%-os valószínűségi szinten 4,83g és 6,39g között van. |
7.2.1.3. Adott intervallumszélességhez tartozó elemszám illetve valószínűségi szint meghatározása | ||
Eddig adott elemszám és valószínűségi szint mellett határoztuk meg a konfidencia intervallumot. A becsléskor azonban előre rögzíthetjük a hibahatárt és ehhez kell meghatározni a szükséges minta elemszámát adott valószínűségi szinten. Ha az elemszám és a hibahatár is adott, akkor meg tudjuk mondani, hogy hány százalékos valószínűséggel kerül a sokasági jellemző az adott elemszám esetén az előre meghatározott intervallumba. | ||
Elemszám meghatározása: adott az intervallum és a valószínűség. | ||
Mivel: illetve , átalakítás után az alábbiakat kapjuk: | ||
illetve | ||
Valószínűségi szint meghatározása: | ||
és a képletek az átalakítás után az alábbiak: | ||
, illetve . | ||
A kiszámított zp-értékhez tartozó táblázatbeli -értékből tudjuk a valószínűséget kiszámítani: | ||
, | ||
ahol | ||
A t-eloszlás esetében a kiszámított értéket megkeressük a táblázatban az adott szabadságfoknál, és leolvassuk a hozzá tartozó valószínűséget. |
8. bemutató feladat | ||
Egy vizsgálat során, megállapították, hogy a hallgatók átlagos testmagassága 169 cm és 173 cm között van 95%-os valószínűséggel. | ||
A sokaság szórása 9,99 cm. | ||
| ||
Megoldás: | ||
a) | ||
b) |
Önellenőrző kérdések | |||||||||||||||||||||||||
1. Válassza ki a véletlen mintavételi eljárásokat!
![]() | |||||||||||||||||||||||||
2. Válassza ki az igaz állítást!
![]() | |||||||||||||||||||||||||
3. Jelölje be a helyes állítást!
![]() | |||||||||||||||||||||||||
4. Az alábbiakban megadott "z"-értékekhez keresse meg a hozzájuk tartozó valószínűségeket! A kiszámított értékeket 2 tizedesjegy pontossággal százalékban kifejezve írja be a táblázat megfelelő cellájába! Standard normális eloszlásfüggvény értékei
![]() | |||||||||||||||||||||||||
5. Keresse ki a megnevezett statisztikai táblából a megadott feltételek mellett a táblabeli értékeket! A kikeresett értékeket írja a táblázat megfelelő celláiba! Student eloszlás értékei ("t"-tábla)
![]() | |||||||||||||||||||||||||
6. Egy település háztartásának havi villamos-energia fogyasztás szerinti megoszlása | |||||||||||||||||||||||||
| |||||||||||||||||||||||||
A településen a háztartások átlagosan 161,0 kWh villamos-energiát fogyasztanak. | |||||||||||||||||||||||||
| |||||||||||||||||||||||||
a) A standard hiba
![]() | |||||||||||||||||||||||||
b) A hibahatár:
![]() | |||||||||||||||||||||||||
c) az intervallum alsó határa:
![]() | |||||||||||||||||||||||||
d) az intervallum felső határa:
![]() | |||||||||||||||||||||||||
e) a szórás intervallumának alsó határa:
![]() | |||||||||||||||||||||||||
f) a szórás intervallumának alsó határa:
![]() | |||||||||||||||||||||||||
g) A szükséges minta elemszáma:
![]() | |||||||||||||||||||||||||
7. Egy palackozó automata működésének hosszú távú megfigyelése szerint a gép 16 cm3 szórással dolgozik. 60 palack tartalmát vizsgálva azt kaptuk, hogy a palackokba töltött ital térfogatának átlaga 488 cm3. Adjunk 95%-os megbízhatósági szinten konfidencia intervallumot az egyes palackokba töltött ital térfogatának várható értékére! | |||||||||||||||||||||||||
a) A standard hiba
![]() | |||||||||||||||||||||||||
b) A hibahatár:
![]() | |||||||||||||||||||||||||
c) az intervallum alsó határa:
![]() | |||||||||||||||||||||||||
d) az intervallum felső határa:
![]() |