KURZUS: Kvantitatív módszerek

MODUL: III. modul: Matematikai statisztika

6. lecke: Egyszerűbb statisztikai mérőszámok meghatározása

Tananyag
6.1. Számított középérték

A mintaelemek számtani középértékét mintaátlagnak, vagy empirikus középnek nevezzük és m ^ n -pal vagy x ¯ -sal jelöljük.

A leggyakrabban alkalmazott középérték, jele: x . A számtani átlag az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok összege változatlan marad.

Fajtái az átlagolandó értékek előfordulása alapján:

a) Egyszerű számtani átlag: minden átlagolandó érték egyszer fordul elő az adatsorban

x = x i n

1. bemutató feladat

Egy focicsapat játékosainak cm-ben mért magasságai a következők:
189, 191, 185, 188, 190, 175, 180, 178, 185, 179, 184.

Megoldás:

x = 189+191+185+188+190+175+180+178+185+179+184 11 =184

Az átlagos testmagasság a csapatban 184 cm.

Gyakorisági sor: az ismérv előfordulásának gyakoriságát tüntetjük fel. A gyakoriság (fi) megmutatja, hogy az egyes ismérvváltozatok hányszor fordulnak elő a megfigyelt sokaságban. Ha az egyes gyakoriságokat azok összegéhez viszonyítjuk, akkor az adott ismérvérték relatív gyakoriságát (gi) kapjuk meg:

g i = f i Σ f i

ahol:
gi: az i-edik ismérvérték relatív gyakorisága
fi: az i-edik ismérvérték gyakorisága
Σ f i : a sokaság elemeinek száma, azaz egyenlő n-nel.

Ha az ismérvváltozatok száma nagy, akkor az adatokat rangsoroljuk, és ez megkönnyíti a változó osztályozását. Az osztályozás sűríti az információt. A legnagyobb és legkisebb ismérvek által adott intervallumot úgy osztjuk osztályokba, hogy az egyes osztályközökön belül a gyakoriságok közel egyenlő eloszlásúak legyenek, így az osztályközép alkalmas lesz az osztály jellemzésére.

Az osztályok olyan adatcsoportok, ahol az egyes osztályok közötti mennyiségi változás minőségi változást takar.

Az osztályközök száma: 2k>N

Osztályköz hossza: h= x max x min k

b) Súlyozott számtani átlag: az átlagolandó értékek többször fordulnak elő az adatsorban:

x = f i x i f i

Mivel g i = f i Σ f i , ezért a relatív gyakoriságokkal is kiszámolható az átlag:

x = g i x i

2. bemutató feladat

Egy vidéki könyvtárban a kikölcsönzött könyvek száma és a könyvtártagok száma:

Kölcsönzött könyvek száma (db)fi
214
338
422
59
Összesen83

x = 14*2+38*3+22*4+9*5 83 =3,31

Egy könyvtártag átlagosan 3,31 db könyvet kölcsönöz ki

Osztályközös gyakorisági sor esetén az osztályközépek töltik be az átlagolandó értékek szerepét. Az osztályközép számítása:

x i = x i(alsóh.) + x i(felsőh.) 2

ahol:
xi(alsóh.): az i-edik osztályköz alsó határa,
xi(felsőh.): az i-edik osztályköz felső határa.

A számításnál nem vesszük figyelembe az elkülönítést szolgáló utolsó számjegyet.
Pl.: 21-50 esetében:

x i = 20+50 2 =35

Ha az osztályközök alsó vagy felső határa nincs megadva, akkor nyitott osztályközről beszélünk. Az alsó határt úgy adjuk meg, hogy az osztályköz szélessége azonos legyen az őt követő osztályköz szélességével. A felső határ megadásakor pedig az előző osztályköz szélességét vesszük figyelembe.

Pl.
...-50
51-100
101-150
151-

Ebben az esetben az osztályköz hossza 50, tehát az első osztályköz 1-50 lesz, az utolsó pedig 151-200.

3. bemutató feladat

140 villanyégő égési idejét vizsgálva az alábbi adatokat kaptuk:

Élettartam (óra)fiOsztályközép
-80012750
801-90028850
901-100046950
1001-1100321050
1101-221150
Összesen140

Számítsuk ki az égők átlagos élettartamát!

Megoldás:

Élettartam (óra)fiOsztályközép
701-80012750
801-90028850
901-100046950
1001-1100321050
1101-1200221150
Összesen140

x = 12*750+28*850+..+22*1150 140 =967,14 óra az átlagos élettartam

Az adatokból elkészíthető a gyakorisági diagram, amelyet hisztogramnak nevezünk.
Az egyes részintervallumok hossza 100 egység (egyenletes felosztás), a téglalapok magassága pedig az adott intervallumba eső elemek számával egyenlő.

A tapasztalati eloszlásfüggvény:
Osztályokban (tól-ig) adott gyakoriságok esetén a tapasztalati eloszlásfüggvénynél az ugrásokat az osztályközepeknél jelöljük. Esetünkben az osztályok: [ 701; 800 ) , [ 801; 900 ) , [ 901; 1000 ) , [ 1001; 1100 ) és [ 1101; 1200 ) (óra), így az osztályközepek pedig 750, 850, 950, 1050, 21150 (óra). Először ki kell számolni a relatív gyakoriságot (gi) és kumulált relatív gyakoriságot (gi').

Élettartam (óra)figigi'
701-800120,090,09
801-900280,200,29
901-1000460,330,61
1001-1100320,230,84
1101-1200220,161,00
Összesen1401-

A tapasztalati eloszlásfüggvény:

6.2. Helyzeti középértékek

A helyzeti középértékek a sokaságban elfoglalt helyzetüknél fogva jellemzik a vizsgált jelenséget vagy folyamatot. Ahhoz, hogy az egyedek sokaságon belüli elhelyezkedése jellemezhető legyen, az egyedeket valamilyen előre rögzített szabály szerint sorba kell rendezni. Általában növekvő sorrendbe rendezzük az ismérvértékeket, azaz rangsort képezünk.

6.2.1. Módusz

A legegyszerűbb helyzeti mutató a leggyakoribb érték, amely egyben a "legsűrűbb" érték, és módusznak nevezzük. A módusz egy gyakorisági eloszlásnak az az ismérvváltozata, amely a leggyakrabban fordul elő, azaz a legnagyobb gyakorisággal. Egy eloszlásnak több módusza is lehet.

4. bemutató feladat

927 férfit megkérdeztek a nyakkendőjük számáról:

Ny. száma01234567899>Össz.
Gyak.12820212984162022354393119927

Diagramon ábrázolva:

Mo=1 és Mo=5

Azaz ennek a gyakorisági sornak két módusza van.

Folytonos gyakorisági sor esetén már nehezebb megállapítani a módusz konkrét értékét. Az osztályközös gyakorisággal megadott adatok esetében a statisztikai gyakorlat nem egységes. Kevés ismérvértéket felvehető diszkrét jelenségnél adott osztályköz felső határát meghaladja a következő osztályköz alsó határa, és ekkor az osztályközepeknél az osztályközök tényleges és megadott határai megegyeznek egymással, és az osztályba sorolás egyértelmű. Ekkor az osztályközök megadott alsó és felső határaival kell számolni. Folytonos ismérvértékeknél vagy sok ismérvértékkel rendelkező diszkrét ismérvértékeknél az osztályköz-határok kétféle megadása lehetséges. Első esetben az adott osztályköz felső határa és a következő osztályköz alsó határa megegyezik egymással, és az osztályköz-határral megegyező értékű elemeket az alacsonyabb osztályközbe soroljuk be. Második esetben közölt osztályköz-határokat adunk meg, amelyek csak arról tájékoztatnak, hogy az osztályköz-határokkal megegyező értékű elemeket az alacsonyabb osztályközbe soroljuk. Ekkor az osztályközepek kiszámításához és a módusz és medián becsléséhez az előző osztályköz felső határával számolunk.

M o = m 0 + f m o - f m o-1 ( f m o - f m o-1 ) +( f m o - f m o+1 ) *h

mo: a modális osztályköz alsó határa,
fmo: a modális osztályköz gyakorisága
fmo-1: a modális osztályközt megelőző osztályköz gyakorisága,
fmo+1: a modális osztályközt követő osztályköz gyakorisága
h: az osztályköz hossza

5. bemutató feladat

140 villanyégő égési idejét vizsgálva az alábbi adatokat kaptuk:

Élettartam (óra)fiOsztályközép
-80012750
801-90028850
901-100046950
1001-1100321050
1101-221150
Összesen140

Számítsuk ki az égők élettartamának móduszát!

Megoldás:

A táblázatban jól látható, hogy a legtöbb adat 901-100 között van, azaz a leggyakoribb érték itt található.

M o = m 0 + f m o - f m o-1 ( f m o - f m o-1 ) +( f m o - f m o+1 ) *h=900+ 46-28 (46-28)+(46-32) 100=956,25

Az égők élettartama 956,25 óra körül sűrűsödi, azaz ez a leggyakoribb élettartam.

6.2.2. Medián

A másik leggyakrabban alkalmazott helyzeti középérték a medián. A nagyság szerint sorba rendezett értékek közül a középső. A medián az az érték, amelynél kisebb értékek gyakorisága azonos a nálánál nagyobb értékek gyakoriságával, azaz a medián a megfigyelt értékek rangsorát két egyenlő részre osztja.

Páratlan számú adat esetén:

Me= n+1 2 -edik elem a medián.

6. bemutató feladat

Egy vizsgán 17 hallgató az alábbi pontszámokat érte el:

8, 8, 9, 10, 10, 10, 11, 11, 12, 12, 13, 13, 13, 14, 14, 14, 14

Megoldás:

A medián a 9. elem, így Me=12

Páros számú adat esetén: a medián sorszámát (sMe) az alábbiak alapján számítjuk ki

s Me = n+1 2 0,5és n+1 2 +0,5 -edik elem lesz a medián, a hozzátartozó értékeket átlagolni kell.

7. bemutató feladat

8 rúdugró az alábbi magasságokat ugrotta át:

4,6; 4,8; 4,8; 4,9; 5,0; 5,0; 5,1; 5,3 (m)

Megoldás:

A medián a 4. és 5. elem átlaga lesz:

Me= 1 2 *(4,9+5,0)=4,95 m

Folytonos gyakorisági sor esetén hasonlóan a móduszhoz, nehezebb megállapítani a középső értéket.

Me= x me,a + n 2 f ' me1 f me h me

n/2: a medián sorszáma (középső érték)
me: a mediánt tartalmazó osztályköz alsó határa
f'me-1: a mediánt tartalmazó osztályközt megelőző osztályköz kumulált gyakorisága
fme: a mediánt tartalmazó osztályköz gyakorisága
h: az osztályköz hossza

8. bemutató feladat

140 villanyégő égési idejét vizsgálva az alábbi adatokat kaptuk:

Élettartam (óra)fiOsztályközép
-80012750
801-90028850
901-100046950
1001-1100321050
1101-221150
Összesen140

Számítsuk ki az égők élettartamának mediánját!

Megoldás:

Először ki kell számolni a kumulált gyakoriságot:

Élettartam (óra)fiOsztályközépfi'
-8001275012
801-9002885040
901-10004695086
1001-1100321050118
1101-221150140
Összesen140--

Me= x me,a + n 2 f ' me1 f me h me =900+ 140 2 40 46 100=965,22

Az égők felének élettartama 965,22 óránál kevesebb, felének pedig több.

6.2.3. Kvantilisek

A középértékek mellett fontos helyzeti mutatók a kvantilisek. Ha a rangsorba rendezett sokaságot egy x-ismérvérték q:(1-q) arányban osztja ketté, akkor ezt az ismérvértéket q-ad rendű vagy q-adik kvantilisnek nevezzük. A kvantilisek meghatározása egyúttal a sokaság egy osztályozását jelenti. Ezen osztályozás során egyenlő gyakoriságú osztályközöket kapunk.

6.2.3.1. Kvartilisek

A sokaságot négy egyenlő elemszámú részsokaságra bontjuk.
Az alsó kvartilis: Q1, amely megmutatja, hogy a sokaság 1/4-része mely értéknél kisebb.
A középső kvartilis: Q2, amely megegyezik a mediánnal.
A felső kvartilis: Q3, amely megmutatja, hogy a sokaság 3/4-része mely értéknél kisebb, illetve 1/4 része mely értéknél nagyobb.

Az alsó kvartilis sorszáma: s= n+1 4

A felső kvartilis sorszáma pedig: s=3* n+1 4

A képletek megegyeznek a medián képletével, természetesen a megfelelő fogalmak cseréje esetén.
Pl. a felső kvartilis kiszámítása:

Q 3 = q 3 + 3* n 4 f q 31 ' f q 3 *h

3*n/4: a felső kvartilis sorszáma
q3 a felső kvartilist tartalmazó osztályköz alsó határa
f'q3-1: a felső kvartilist tartalmazó osztályközt megelőző osztályköz kumulált gyakorisága
fq3: a felső kvartilist tartalmazó osztályköz gyakorisága
h: az osztályköz hossza

9. bemutató feladat

140 villanyégő égési idejét vizsgálva az alábbi adatokat kaptuk:

Élettartam (óra)fiOsztályközép
-80012750
801-90028850
901-100046950
1001-1100321050
1101-221150
Összesen140

Számítsuk ki az égők élettartamának alsó és felső kvartilisét!

Megoldás:

Élettartam (óra)fiOsztályközépfi'
-8001275012
801-9002885040
901-10004695086
1001-1100321050118
1101-221150140
Összesen140--

Az alsó kvartilis 140/4=35, azaz a 35. elem, ez a 801-900-as intervallumban található:

Q 1 = q 1 + n 4 f q 11 ' f q1 *h=800+ 140 4 12 28 100=882,14

Az felső kvartilis 3*(140/4)=105, azaz a 105. elem, ez a 1001-1100-as intervallumban található:

Q 3 = q 3 + 3* n 4 f q 31 ' f q 3 *h=1000+ 3 140 4 86 32 100=1059,375

6.2.3.2. Tercilisek

Ha két osztópont segítségével három egyenlő részre osztjuk a sokaságot, akkor terciliseket kapunk (T1 és T2). Az alsó tercilis (T1) a sokaság első harmadolópontja, amely megmutatja, hogy mely értéknél kisebb a sokaság 1/3-ad része, illetve mely értéknél nagyobb a sokaság 2/3-ad része. A felső tercilis (T2) a sokaság felső harmadolópontja, amely megmutatja, hogy mely értéknél kisebb a sokaság 2/3-ad része, illetve mely értéknél nagyobb a sokaság 1/3-ad része.
Kiszámításuk a mediánhoz hasonló.

Az alsó tercilis képletet:

T 1 = t 1 + n 3 f t 11 ' f t 1 *h

A felső tercilis képlete:

T 2 = t 2 + 2* n 3 f t 31 ' f t3 *h

10. bemutató feladat

140 villanyégő égési idejét vizsgálva az alábbi adatokat kaptuk:

Élettartam (óra)fiOsztályközép
-80012750
801-90028850
901-100046950
1001-1100321050
1101-221150
Összesen140

Számítsuk ki az égők élettartamának alsó és felső tercilisét!

Megoldás:

Élettartam (óra)fiOsztályközépfi'
-8001275012
801-9002885040
901-10004695086
1001-1100321050118
1101-221150140
Összesen140--

Az alsó tercilis 140/3=46,67, azaz a 46-47. elem, ez a 901-1000-as intervallumban található:

T 1 = t 1 + n 3 f t 11 ' f t 1 *h=900+ 140 3 40 46 100=914,49

Az felső tercilis 2*(140/3)=93,33, azaz a 93-94. elem, ez a 1001-1100-as intervallumban található:

T 2 = t 2 + 2* n 3 f t 31 ' f t3 *h=1000+ 2 140 3 86 32 100=1022,92

6.2.3.3. Decilisek

A decilisek számítása során 9 osztópont segítségével tíz egyenlő részre bontjuk a sokaságot, azaz tíz egyenlő gyakoriságú osztályközt hozunk létre.  Az első deicilis (D1) megmutatja, hogy a sokaság 1/10-d része mely értéknél kisebb.

Kiszámítása a kvartilisekhez hasonló, természetesen a megfelelő jelölések változtatásával. Például a 7. decilis értéke az alábbi képlettel számítható ki:

D 7 = d 7 + 7* n 10 f d 71 ' f d 7 *h

11. bemutató feladat

140 villanyégő égési idejét vizsgálva az alábbi adatokat kaptuk:

Élettartam (óra)fiOsztályközép
-80012750
801-90028850
901-100046950
1001-1100321050
1101-221150
Összesen140

Számítsuk ki az égők élettartamának 4. és 7. decilisét!

Megoldás:

Élettartam (óra)fiOsztályközépfi'
-8001275012
801-9002885040
901-10004695086
1001-1100321050118
1101-221150140
Összesen140--

A 4. decilis 4*(140/10)=56, azaz az 56. elem, ez a 901-1000-as intervallumban található:

D 4 = d 4 + 4* n 10 f d 41 ' f d 7 *h=900 4 140 10 40 46 100=934,78

A 7. decilis 47*(140/10)=98, azaz az 98. elem, ez a 1001-1100-as intervallumban található:

D 7 = d 7 + 7* n 10 f d 71 ' f d 7 *h=1000+ 7 140 10 86 32 100=1037,5

6.3. A statisztikai minta további jellemzői

A ξ 1 , ξ 2 ,..., ξ n minta eloszlásfüggvénye (empirikus eloszlásfüggvény) F n ( x )={ 0,  ha x ξ 1 * , k n , ha  ξ k * <x< ξ k+1 * , ha k=1,2,...,n1 1,   ha x ξ n * ,
ahol ξ i * a minta növekvő nagyság szerint rendezett elemei közül az i -edik.

Legyen ξ 1 , ξ 2 ,..., ξ n egy adott n elemű minta, az a,b számokra pedig teljesüljön az a ξ 1 * és a ξ n * <b feltétel. Osszuk fel az [ a;b ] intervallumot m részintervallumra (osztályra) az a= x 0 < x 1 <...< x m1 < x m =b osztópontok segítségével. Az egyes [ x i1 , x i ) részintervallumba eső mintaelemek számát jelöljük k i -vel (i = 1, 2, ..., m).

A gyakorisági hisztogramot úgy kapjuk, hogy az [ x i1 , x i ) intervallumra k x i x i1 magasságú téglalapot rajzolunk (i = 1, 2, ..., m).

A sűrűség hisztogramot úgy kapjuk, hogy az [ x i1 , x i ) intervallumra k n( x i x i1 ) magasságú téglalapot rajzolunk (i = 1, 2, ..., m).

6.4. Szóródási mutatók

A középértékek csak egyetlen tulajdonságát rögzítik az eloszlásnak, ezért a statisztikai sokaság jellemzésére általában nem elegendőek. Egy sokaság eloszlása nagyon sokféle lehet, így az eloszlás formája is különböző lehet.

Az ismérvértékek szóródásának mérésére és mérőszámok képzésére különböző lehetőségek vannak. Szóródáson azonos fajta számszerű adatok (általában egy mennyiségi ismérv értékének) különbözőségét értjük. A szóródás mérése az ismérvértékek valamely középértéktől vett eltérései vagy egymás közötti különbségei alapján történik.

Ezen eltérések, különbségek alapján számított mérőszámok a szóródás abszolút mutatói, amelyek mértékegysége megegyezik a megfigyelt ismérv mértékegységével.

A szóródás relatív mutatói elvonatkoztatnak az ismérvértékek mértékegységétől, nagyságrendjétől, a szóródás térbeli vagy időbeli összehasonlítására szolgálnak.

A szóródás legfontosabb mutatószámai:

  • terjedelem (R),
  • szórás ( σ, s),
  • relatív szórás (V, CV)
6.4.1. A szóródás terjedelme (R)

Azt mutatja meg, hogy a sokaság elemei milyen értékintervallumban helyezkednek el.
A szóródás terjedelme alatt az előforduló legkisebb és legnagyobb érték különbségét értjük:
R= x max x min

A szóródás terjedelme egy nagyon egyszerű és csak közelítő mérőszáma a szóródásnak. Az eloszlásnak csak a legkisebb és a legnagyobb értékét veszi figyelembe, és a két szélső érték közötti többi értéket nem. Arról, hogy a többi érték hol helyezkedik el, nem mond semmit.

6.4.2. A szórás

A legismertebb és a leggyakrabban használt mutató a szórás. A szórás az egyes értékek számtani átlagtól való eltéréseinek négyzetes átlaga, azaz megmutatja, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlagtól.

Tapasztalati szórás: az egész sokaságra vonatkozik.

σ= Σ ( x i x ) 2 n         σ= Σ f i ( x i x ) 2 Σ f i         σ= Σ g i ( x i x ) 2

elméleti szórás (korrigált tapasztalati szórás): a mintából számoljuk ki.

s= Σ ( x i x ) 2 n1                           s= Σ f i ( x i x ) 2 Σ f i 1

Tulajdonságai:

  • Ha az ismérvértékhez hozzáadunk egy állandót (A), a szórás értéke nem változik, mivel ilyenkor a számtani átlag is pont ezzel az állandóval lesz nagyobb.
  • Ha az ismérvértéket megszorozzuk egy állandóval (B), akkor a szórás |B|-szeresére változik, mivel ebben az esetben a számtani átlag értéke "B"-szer nagyobb lesz.
  • Ha xi>0, akkor a szórásra az alábbi összefüggést írhatjuk fel: 0σ x ¯ * n1

Az alsó korlát a σ=0 minden olyan esetben fennáll, amikor x i = x ¯ , (i=1,2,..n). A felső korlát σ= x ¯ * n1 csak akkor igaz, ha xi=0 és x n =n* x ¯ .

12. bemutató feladat

140 villanyégő égési idejét vizsgálva az alábbi adatokat kaptuk:

Élettartam (óra)fiOsztályközép
-80012750
801-90028850
901-100046950
1001-1100321050
1101-221150
Összesen140

Számítsuk ki az égők átlagos élettartamának tapasztalati és elméleti szórását!

Megoldás:

σ= Σ f i ( x i x ) 2 Σ f i = 12 (750967,14) 2 +28 (850967,14) 2 +...+22 (1150967,14) 2 140 = =117,0073 s= Σ f i ( x i x ) 2 Σ f i 1 = 12 (750967,14) 2 +28 (850967,14) 2 +...+22 (1150967,14) 2 139 = =117,494

A szórást leggyorsabban a zsebszámológépek statisztikai üzemmódjával lehet meghatározni
σ=117,0073 óra
s=117,494 óra

6.4.2.1. Variancia

A variancia, vagy szórásnégyzet önálló mutatóként is használatos. Nagy jelentősége például a varianciaanalízisben van, amely több középérték összehasonlítására szolgál. Többféle jelölést találunk a szakirodalomban: s2, SS, MQ

6.4.2.2. A szórásnégyzet és a szórás felbontása

Ha a sokaság részekre, azaz részsokaságokra bontható, akkor a szórásnégyzetet is fel lehet bontani két részre:

  • Belső szórásnégyzetre: σ B 2
  • Külső szórásnégyzetre σ K 2

A belső- és külső szórásnégyzet összege a teljes szórásnégyzet: σ T 2 = σ B 2 + σ K 2

és a csoport főátlaga között értelmezett különbségekből meghatározott) szórásnégyzeteinek az átlaga.

σ j 2 = i=1 j ( x ij x ¯ j ) 2 n j

σ B 2 = j=1 n n j * σ j 2 n σ B 2 = j=1 n i=1 j ( x ij x ¯ j ) 2 n

ahol
j: a csoportosító ismérv változatainak a száma
σ j 2 : a j-edik részsokaság szórásnégyzete
nj: a j-edik részsokaság elemszáma
n: a sokaság elemszáma

Belső szórás:

σ B = σ B 2

A külső szórásnégyzet az egyes részsokaságok átlagai (részátlag) és a teljes sokasági átlag (főátlag) eltérés négyzetösszegének az átlaga (a részsokaságok nagyságával súlyozva).

σ K 2 = j=1 n Σ n j * ( x ¯ j x ¯ ) 2 n , σ K 2 = j=1 n i=1 j ( x ij - x ¯ ) 2 n

ahol
x ¯ j : a részsokaságok átlaga
x ¯ : a teljes sokaság átlaga (főátlag)

Külső szórás:

σ K = σ K 2

A teljes szórás ( σ T ) azt fejezi ki, hogy a vizsgált sokaságban az egyes értékek átlagosan mennyivel térnek el a főátlagtól.

A belső szórás ( σ B ) azt fejezi ki, hogy a részsokaságok egyes értékei átlagosan mennyivel térnek el a saját részátlaguktól.

A külső szórás ( σ K ) azt fejezi ki, hogy a vizsgált sokaságban az egyes részsokaságok átlagai átlagosan mennyivel térnek el a sokasági főátlagtól.

13. bemutató feladat

A hallgatók szakok szerinti csoportosításban az alábbi eredményt érték el egy vizsgán. A maximálisan elérhető pontszám 100 pont volt.

Az egyes szakokon tanuló hallgatók vizsgaeredménye
SzakHallgatók száma (fő)Az elért eredményük átlagpontszámaAz eredmények szórás
Közgazdász20635,6
Jogász30605,9
Mérnök25506,4

Számítsa ki az adatok alapján a belső-, a külső és a teljes szórást, majd értelmezze azokat!

Megoldás:

A vizsga átlagpontszáma:

x = f i x i f i = 20*63+30*60+25*50 20+30+25 =57,47

A belső szórásnégyzet:

σ B 2 = n j * σ j 2 n = 20* 5,6 2 +30* 5,9 2 +25* 6,4 2 20+30+25 =35,94

A belső szórás:

σ B = σ B 2 = 35,94 =5,99

Az egyes szakokon belül a hallgatók eredménye átlagosan 5,99 ponttal tér el az adott szakon elért átlagos pontszámtól.

A külső szórásnégyzet:

σ K 2 = Σ n j * ( x j ¯ x ¯ ) 2 n = 20* (6357,47) 2 +30* (6057,47) 2 +25* (5057,47) 2 20+30+25 = =29,32

A külső szórás:

σ K = σ K 2 = 29,32 =5,41

Az egyes szakok átlagos vizsgaeredménye 5,41 ponttal tér el az összes hallgató által élért átlageredménytől.

A teljes szórásnégyzet:

σ T 2 = σ B 2 + σ K 2 =35,94+29,32=65,26

A teljes szórás:

σ= σ 2 = 65,26 =8,08 ,

A vizsgán megjelent hallgatók eredménye átlagosan 8,08 ponttal tér el az összes hallgató által élért átlageredménytől.

6.4.3. Relatív szórás (V, CV)

Sok esetben a szóródás vizsgálatára a szórás, mint átlagos szóródási paraméter nem elegendő. Továbbá bizonyos esetekben szükség lehet arra, hogy az ismérvértékek nagyságrendjétől, illetve mértékegységétől elvonatkoztatott "tiszta szám" jellegű mérőszámmal mérjünk, és összehasonlíthatóvá tegyük a szórásokat. E célból bármelyik eddig bemutatott mérőszámot viszonyíthatjuk az átlaghoz. A legismertebb ilyen szóródási mérőszám a relatív szórás vagy variációs koefficiens, amely kifejezi, hogy a szórás az átlag hányad része. A relatív szórás az ismérvértékek átlagtól vett átlagos relatív eltérését fejezi ki. Mértékegység nélküli mutató, általában százalékban kifejezve adjuk meg.

V= σ x , illetve V= s x

Kifejezi, hogy a sokaság egyes egyedeinek értéke átlagosan hány százalékkal tér el az átlagtól.

Mivel mértékegység nélküli mutató, ezért különböző mértékegységű ismérvértékek szóródásának összehasonlítására is alkalmas. A szóráshoz hasonlóan megadhatjuk az alsó és a felső korlátját:

0V n1

A szóródási együtthatót százalékosan kifejezve a gazdasági gyakorlatban a változékonyságot az alábbiak szerint minősíthetjük:

  • 0-10%: állandóságot (homogenitást)
  • 10-20%: közepes változékonyságot,
  • 20-30%: erős változékonyságot
  • 30% felett szélsőséges ingadozást fejez ki.
14. bemutató feladat

140 villanyégő égési idejét vizsgálva az alábbi adatokat kaptuk:

Élettartam (óra)fiOsztályközép
-80012750
801-90028850
901-100046950
1001-1100321050
1101-221150
Összesen140

Számítsuk ki az égők átlagos élettartamának relatív tapasztalati és relatív elméleti szórását!

Megoldás:

Ha a szórás az alapsokaságra vonatkozna:

V= σ x = 117,073 967,14 =0,1211=12,11%

A villanyégők élettartama átlagosan 12,11%-kal tér el a sokaság átlagától

Ha a szórás a mintára vonatkozik

V= s x = 117,494 967,14 =0,1215=12,15%

A villanyégők élettartama átlagosan 12,15%-kal tér el a sokaság átlagától.

Önellenőrző kérdések

1. Egy településen a családok megoszlása a családban élő gyermekek száma szerint

Gyermekek száma (fő)Családok száma (db)
0992
1954
2761
3148
440
515
65
Összesen2915

Forrás: Magyar statisztikai zsebkönyv, 2006.

a)Számítsa ki a családonként az átlagos gyermekszámot!
b)Határozza meg a gyakorisági sor mediánját!
c)Határozza meg a gyakorisági sor móduszát!
d)Határozza meg a gyakorisági sor tapasztalati és korrigált tapasztalati szórását!
e)Határozza meg a gyakorisági sor relatív tapasztalati és a relatív és korrigált tapasztalati  szórását!
a) Egy családban a gyermekek száma átlagosan:
2,11
1,91
1,09
2,09
b) A medián
0
1
2
3
c) A módusz
0
1
2
3
d) A tapasztalati szórás
1,1203
1,0221
1,0322
1,0422
e) A relatív tapasztalati szórás
94,79%
93,45%
94,88%
93,77%
f) A korrigált tapasztalati szórás
1,1201
1,0222
1,0322
1,0441
g) A relatív korrigált tapasztalati szórás
92,77%
93,78%
94,88%
95,89%

2. A nyugdíjban részesülők megoszlása 2007. januárban

A teljes ellátás havi összege (Ft)Öregségi nyugdíjasok megoszlása (%)Kumulált gyakoriság
(%)
-200000,40,4
20001-300000,71,1
30001-400002,94,0
40001-500008,712,7
50001-6000013,926,6
60001-7000017,343,9
70001-8000017,961,8
80001-9000010,972,7
90001-1000008,180,8
100001-1100005,786,3
110001-1200004,390,6
120001-1500006,897,6
150001-2,4100,0
Összesen100,0-

Forrás: Magyar statisztikai zsebkönyv, 2006.

a)Számítsa ki a nyugdíjak átlagát!
b)Határozza meg a gyakorisági sor mediánját!
c)Határozza meg a gyakorisági sor móduszát!
d)Határozza meg a gyakorisági sor alsó tercilisét!
e)Határozza meg a gyakorisági sor felső kvartilisét!
f)Határozza meg a gyakorisági sor 8. decilisét!
g)Határozza meg a gyakorisági sor korrigált tapasztalati szórását!
h)Határozza meg a gyakorisági sor relatív korrigált tapasztalati szórását!
a) A nyugdíjak átlagos összege:
78.360 Ft
78.510 Ft
79.450 Ft
82.310 Ft
b) A medián
73.408 Ft
73.675 Ft
70.789 Ft
75.312 Ft
c) A módusz
73.408 Ft
73.675 Ft
70.789 Ft
75.312 Ft
d) Az alsó tercilis:
63.456 Ft
65.322 Ft
62.345 Ft
63.892 Ft
e) A felső kvartilis:
92.840 Ft
93.760 Ft
93.870 Ft
93.990 Ft
f) A 8. decilis:
98.130 Ft
99.012 Ft
99.723 Ft
89.012 Ft
g) A korrigált tapasztalati szórás
27.787 Ft
28.776 Ft
28.976 Ft
28.888 Ft
h) A relatívkorrigált tapasztalati szórás
35,77%
36,65%
37,88%
38,89%

3. Egy állattenyésztő juhállományának megoszlása fajta és gyapjúhozam szerint

Gyapjúhozam (kg)Fésűs merinóNémet húsmerinó
Fajta (db)
-4,5108
4,6-5,53012
5,6-6,53020
6,6-7,5405
7,6-8,5703
8,6-202
Összesen20050
Átlag6,9505,780
Szórás (s)1,3991,250

A sokaság átlaga: 6,716
A feladat adataiból számítsa ki a belső szórást, a külső szórást, és a teljes szórást!

a) A belső szórás:
1,370
1,480
1,490
1,400
b) A külső szórás (az eredeti adatokból számolva):
0, 345
0,497
0,468
0,353
c) A teljes szórás (az eredeti adatokból számolva):
1,476
1,446
1,416
1,406