KURZUS: Statisztika I.

MODUL: III. modul: Mennyiségi sorok további elemzési eszközei

6. lecke: Szóródási mutatók

Követelmények

Ön akkor sajátította el megfelelően a tananyagot, ha

  • felsorolásból ki tudja választani a szóródásra igaz állítást;
  • felsorolásból ki tudja választani a szórásra igaz állítást;
  • felsorolásból ki tudja választani a szórás definícióját;
  • felsorolásból ki tudja választani a belső szórásra igaz állítást;
  • felsorolásból ki tudja választani a Gini-féle mutatóra igaz állítást;
  • önállóan meg tudja határozni az adatsor terjedelmét, szórását, relatív szórását, az abszolút és átlagos eltérést;
  • ki tudja számolni és értelmezni tudja a belső szórást, külső szórást és a teljes szórást;
  • meg tudja határozni az átlagos különbség mutatószámát, és értelmezni annak jelentését.
Tananyag

A középértékek csak egyetlen tulajdonságát rögzítik az eloszlásnak, ezért a statisztikai sokaság jellemzésére általában nem elegendőek. Egy sokaság eloszlása nagyon sokféle lehet, így az eloszlás formája is különböző lehet.

Az ismérvértékek szóródásának mérésére és mérőszámok képzésére különböző lehetőségek vannak. Szóródáson azonos fajta számszerű adatok (általában egy mennyiségi ismérv értékének) különbözőségét értjük. A szóródás mérése az ismérvértékek valamely középértéktől vett eltérései vagy egymás közötti különbségei alapján történik. Ezen eltérések, különbségek alapján számított mérőszámok a szóródás abszolút mutatói, amelyek mértékegysége megegyezik a megfigyelt ismérv mértékegységével. A szóródás relatív mutatói elvonatkoztatnak az ismérvértékek mértékegységétől, nagyságrendjétől, a szóródás térbeli vagy időbeli összehasonlítására szolgálnak.

A szóródás legfontosabb mutatószámai:

  • terjedelem (R),
  • átlagos eltérés ( δ),
  • szórás ( σ, s),
  • relatív szórás (V, CV)
  • átlagos különbség (G).

Az egyes mutatószámokra az elmélet végén talál példát!

6.1. A szóródás terjedelme (R)

Azt mutatja meg, hogy a sokaság elemei milyen értékintervallumban helyezkednek el.
A szóródás terjedelme alatt az előforduló legkisebb és legnagyobb érték különbségét értjük:

R=xmax - xmin

A szóródás terjedelme egy nagyon egyszerű és csak közelítő mérőszáma a szóródásnak. Az eloszlásnak csak a legkisebb és a legnagyobb értékét veszi figyelembe, és a két szélső érték közötti többi értéket nem. Arról, hogy a többi érték hol helyezkedik el, nem mond semmit.

6.2. Átlagos eltérés ( δ)

Az átlagos eltérés az ismérvértékek számtani átlagtól vett eltérésein alapul, azaz az egyes értékek számtani átlagtól vett eltérései abszolút értékének számtani átlaga:

δ= | x i x ¯ | n     δ= f i | x i x ¯ | f i

Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem a súlyok aránya befolyásolja ezért a relatív gyakoriságból is kiszámítható:

δ= g i | x i x ¯ |

Bemutató feladat

Pl. 50 izzó élettartamát vizsgálva.

Élettartam (óra)fiOszt. Közép | x i - x ¯ | gi g i | x i - x ¯ |
600-70056502100,121,0
700-800117501100,2224,2
800-90016850100,323,2
900-100010950900,218,0
1000-1100810501900,1630,4
Összesen5096,8

δ= 96,8

Ugyanezekkel az adatokkal dolgozva, csak a gyakoriságokat változtatjuk meg:

Élettartam (óra)fiOszt. Közép | x i - x ¯ | gi g i | x i - x ¯ |
600-700116502100,2246,2
700-80057501100,111,0
800-90010850100,22,0
9001-100016950900,3228,8
1000-1100810501900,1630,4
Összesen50118,4

δ= 118,4

6.3. A szórás

A legismertebb és a leggyakrabban használt mutató a szórás. A szórás az egyes értékek számtani átlagtól való eltéréseinek négyzetes átlaga, azaz megmutatja, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlagtól.

Tapasztalati szórás: az egész sokaságra vonatkozik.

σ= Σ ( x i x ) 2 n         σ= Σ f i ( x i x ) 2 Σ f i         σ= Σ g i ( x i x ) 2

elméleti szórás: a mintából számoljuk ki.

s= Σ ( x i x ) 2 n1                   s= Σ f i ( x i x ) 2 Σ f i 1

Az eredeti táblázat (50 villanyégő) adataiból számítsuk ki a szórást

σ= Σ f i ( x i x ) 2 Σ f i = 5* (650860) 2 +11* (750860) 2 +...+8* (1050860) 2 50 =120,42

Tulajdonságai:

  • Ha az ismérvértékhez hozzáadunk egy állandót (A), a szórás értéke nem változik, mivel ilyenkor a számtani átlag is pont ezzel az állandóval lesz nagyobb.
  • Ha az ismérvértéket megszorozzuk egy állandóval (B), akkor a szórás | B | -szeresére változik, mivel ebben az esetben a számtani átlag értéke "B"-szer nagyobb lesz.

A szórás mindig nagyobb értékű, mint az átlagos eltérés!

6.3.1. Variancia

A variancia, vagy szórásnégyzet önálló mutatóként is használatos. Nagy jelentősége például a varianciaanalízisben van, amely több középérték összehasonlítására szolgál. Ezzel az anyaggal majd a Statisztika II-ben találkozunk. Többféle jelölést találunk a szakirodalomban: s2, SS, MQ

6.3.2. A szórásnégyzet és a szórás felbontása

Ha a sokaság részekre, azaz részsokaságokra bontható, akkor a szórásnégyzetet is fel lehet bontani két részre:

  • Belső szórásnégyzetre: σ B 2
  • Külső szórásnégyzetre σ K 2

A belső- és külső szórásnégyzet összege a teljes szórásnégyzet: σ T 2 = σ B 2 + σ K 2

A belső szórásnégyzet az egyes részsokaságok (csoporton belüli elemek és a csoport főátlaga között értelmezett különbségekből meghatározott) szórásnégyzeteinek az átlaga.

σ B 2 = Σ n j * σ j 2 n ,

ahol
j: a csoportosító ismérv változatainak a száma
σ j 2 : a j-edik részsokaság szórásnégyzete
nj: a j-edik részsokaság elemszáma
n: a sokaság elemszáma

A külső szórásnégyzet az egyes részsokaságok átlagai (részátlag) és a teljes sokasági átlag (főátlag) eltérés négyzetösszegének az átlaga (a részsokaságok nagyságával súlyozva).

σ K 2 = Σ n j * ( x ¯ j x ¯ ) 2 n ,

ahol
x ¯ j : a részsokaságok átlaga
x ¯ : a teljes sokaság átlaga (főátlag)

A teljes szórás ( σ T ) azt fejezi ki, hogy a vizsgált sokaságban az egyes értékek átlagosan mennyivel térnek el a főátlagtól.

A belső szórás ( σ B ) azt fejezi ki, hogy a részsokaságok egyes értékei átlagosan mennyivel térnek el a saját részátlaguktól.

A külső szórás ( σ K ) azt fejezi ki, hogy a vizsgált sokaságban az egyes részsokaságok átlagai átlagosan mennyivel térnek el a sokasági főátlagtól.

Bemutató feladat

A hallgatók szakok szerinti csoportosításban az alábbi eredményt érték el egy vizsgán. A maximálisan elérhető pontszám 100 pont volt.

SzakHallgatók száma (fő)Az elért eredményük átlagpontszámaAz eredmények szórás
Közgazdász20635,6
Jogász30605,9
Mérnök25506,4

Számítsa ki az adatok alapján a belső-, a külső és a teljes szórást, majd értelmezze azokat!

A vizsga átlagpontszáma, azaz a főátlag:

x = f i x i f i = 20*63+30*60+25*50 20+30+25 =57,47

A belső szórásnégyzet:

σ B 2 = n j * σ j 2 n = 20* 5,6 2 +30* 5,9 2 +25* 6,4 2 20+30+25 =35,94

A belső szórás:

σ B = σ B 2 = 35,94 =5,99 , Az egyes szakokon belül a hallgatók eredménye átlagosan 5,99 ponttal tér el az adott szakon elért átlagos pontszámtól.

A külső szórásnégyzet:

σ K 2 = Σ n j * ( x j ¯ x ¯ ) 2 n = 20* (6357,47) 2 +30* (6057,47) 2 +25* (5057,47) 2 20+30+25 =29,32

A külső szórás:

σ K = σ K 2 = 29,32 =5,41 , az egyes szakok átlagos vizsgaeredménye 5,41 ponttal tér el az összes hallgató által élért átlageredménytől.

A teljes szórásnégyzet:

σ T 2 = σ B 2 + σ K 2 =35,94+29,32=65,26

A teljes szórás:

σ= σ 2 = 65,26 =8,08 , A vizsgán megjelent hallgatók eredménye átlagosan 8,08 ponttal tér el az összes hallgató által élért átlageredménytől.

6.4. Relatív szórás (V, CV)

Sok esetben a szóródás vizsgálatára a szórás, mint átlagos szóródási paraméter nem elegendő. Továbbá bizonyos esetekben szükség lehet arra, hogy az ismérvértékek nagyságrendjétől illetve mértékegységétől elvonatkoztatott "tiszta szám" jellegű mérőszámmal mérjünk, és összehasonlíthatóvá tegyük a szórásokat. E célból bármelyik eddig bemutatott mérőszámot viszonyíthatjuk az átlaghoz. A legismertebb ilyen szóródási mérőszám a relatív szórás vagy variációs koefficiens, amely kifejezi, hogy a szórás az átlag hányad része. Általában százalékban kifejezve adjuk meg.

V= σ x

Kifejezi, hogy a sokaság egyes egyedeinek értéke átlagosan hány százalékkal tér el az átlagtól.

A relatív szórás százalékosan kifejezve a gazdasági gyakorlatban a változékonyságot az alábbiak szerint minősíthetjük:

0-10%: állandóságot (homogenitást)
10-20%: közepes változékonyságot,
20-30%: erős változékonyságot
30% felett szélsőséges ingadozást fejez ki.

6.5. Átlagos különbség (G)

Az átlagos eltérés ( δ) és a szórás ( σ) a számtani átlag alapján méri az ismérvértékek különbözőségét. A szóródás az ismérvértékek egymás közötti különbségei alapján is vizsgálható, illetve mérhető. E mutató bevezetését Corrado Gini, olasz statisztikus javasolta, ezért Gini-féle mérőszámnak is nevezik.

Az átlagos különbség (G) az ismérvértékek egymástól számított különbségei abszolút értékének számtani átlaga.

G= | x i - x j | n(n-1)         G= f i f j | x i - x j | n(n-1)

Az átlagos különbség azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el egymástól.

Számításához három munkatábla szükséges: | x i x j |

xj1xj2xjn
xi1
xi2
xin

fi*fj

fj1fj2fjn
fi1
fi2
xin

fi*fj* | x i x j |

Összesen
A két tábla megfelelő celláinak szorzata.
 
 
 
Bemutató feladat

Pl. 50 izzó élettartamát vizsgálva.

Élettartam (óra)fiOszt. Közép | x i x j | fi* | x i x j |
601-70056502101050
701-800117501101210
801-9001685010160
901-10001095090900
1001-1100810501901520
Összesen504840

R (Terjedelem): 1100-600= 500 óra
Átlag= 860 óra: egy villanyégő átlagos élettartama.
Átl. Eltérés: 96,8 óra: a villanyégők élettartama átlagosan 96,8 órával tér el a sokaság átlagától
Szórás 120,42 óra: a villanyégők élettartama átlagosan 120,42 órával tér el a sokaság átlagától
CV= 14%: villanyégők élettartama átlagosan 14%-kal tér el a sokaság átlagától

| x i x j |

Mivel a főátlóra szimmetrikus mátrixot kapunk, ezért a táblázatnak csak egy részét töltjük ki.

6507508509501050
6500100200300400
7500100200300
8500100200
9500100
10500

fi*fj

51116108
52555805040
1112117611088
16256160128
1010080
864

fi*fj* | x i x j |

0550016000150001600052500
017600220002640066000
0160002560041600
080008000
00
168100

Mivel a táblázatot nem teljesen töltöttük ki, ezért a kapott eredményt meg kell szorozni kettővel.

G= 2*168100/50*49= 137,22 óra Az egyes égők élettartama átlagosan 137,22 órával különböznek egymástól.

Önellenőrző feladatok
1. Jelölje meg az alábbiak közül a szóródásra jellemző meghatározást!
A leggyakrabban használt mutató
Nem azonos a szórással
Az átlagolandó értékek számtani átlagtól való eltérését mutatja meg.
2. Válassza ki a helyes állítást!
A szórás és az átlageltérés mindig egyenlő
A szórás mindig kisebb, mint az átlageltérés
A szórás mindig nagyobb, mint az átlageltérés
3. Válassza ki a szórás definícióját!
A szórás az ismérvértékek egymástól való eltérését mutatja meg.
A szórás az egyes ismérvértékek számtani átlagtól való eltérésének négyzetes átlaga
A szórás az egyes ismérvértékek számtani átlagtól való eltérésének átlaga
4. Jelölje meg az alábbiak közül a belső szórásra jellemző meghatározást!
A belső szórás az egyes ismérvértékeknek a csoportjuk átlagától való átlagos eltérését mutatja meg.
A belső szórás a részátlagok a főátlagtól való eltérését fejezi ki.
A belső szórás az egyes ismérvértékeknek a főátlagtól való eltérését fejezi ki.
5. Válassza ki a helyes állítást!
A Gini-féle mutató az átlagos eltérést fejezi ki.
A Gini-féle mutató az átlagos különbséget fejezi ki.
A Gini-féle mutató az adatok átlagtól való eltérését fejezi ki.

6. A megadott adatok alapján határozza meg a sokaság szórását, a relatív szórást és az átlageltérést! A számolás során csak a végeredményt kerekítse!

Egy évfolyamban az átlagos testmagasságot vizsgálva 200 hallgató testmagassága az alábbi volt.

Testmagasság (cm)Hallgatók száma (fő)
-16025
161-17080
171-18065
181-19020
191-10
Összesen:200

A sokaság átlaga: 170,5 cm

 

A sokaság szórása (2 tizedjegy pontossággal): cm.
A relatív szórás (2 tizedjegy pontossággal): %.
Az átlageltérés (3 tizedjegy pontossággal): cm.

7. Számítsa ki az átlagos különbség mutatószámát!

A hallgatók átlagos vizsgaeredménye az alábbi volt:

EredményA hallgatók száma (fő)
14
212
345
416
58
Összesen85

7/a. Írja be a táblázatba a hiányzó értékeket!

Mivel a főátlóra szimmetrikus mátrixot kapunk, ezért csak a táblázat egyik felét kell kitöltenie!

 
01234
0123
012
01
-0
fi*fj
41245168
4
12
45
16
8-
fi*fj* | x i x j |
1/42/123/454/165/8Összesen
1/4
2/12
3/45
4/16
5/8
Összesen-
7/b. Egészítse ki a mondatot! Az eredményt 2 tizedesjegy pontossággal adja meg!

Az egyes hallgatók érdemjegyei egymástól átlagosan -dal térnek el.

8. Írja be a táblázatba a hiányzó értékeket! Az eredményeket 3 tizedesjegy pontossággal számítsa ki!
A sokaság átlaga: 6,716
Egy állattenyésztő juhállományának megoszlása fajta és gyapjúhozam szerint
Gyapjúhozam (kg)Fésűs merinóNémet húsmerinó
Fajta (db)
-4,5108
4,6-5,53012
5,6-6,53020
6,6-7,5405
7,6-8,5703
8,6-202
Összesen20050
Átlag6,9505,780
Szórás
9/a. Az előző feladat adataiból számítsa ki a belső szórást, a külső szórást, és a teljes szórást, 3 tizedesjegy pontossággal.

A belső szórás:
A külső szórás:
A teljes szórás:

9/b. Válassza ki a helyes megfogalmazást.
Az egyes fajták átlagos gyapjúhozama átlagosan 0,468 kg-mal tér el a gazdaság átlagos gyapjúhozamától.
A juhok átlagos gyapjúhozama 0,468 kg-mal tér el a gazdaság átlagos gyapjúhozamától.
A juhok átlagos gyapjúhozama 0,468 kg-mal tér el a fésűs merinó fajta átlagos gyapjúhozamától.