KURZUS: Közlekedésstatisztika

MODUL: II. modul: Az empirikus eloszlások elemzése

6. lecke: A szóródás és mérése

Követelmények

Ön akkor sajátította el megfelelően a tananyagot, ha

  • felsorolásból ki tudja választani a szóródásra igaz állítást;
  • felsorolásból ki tudja választani a szórásra igaz állítást;
  • felsorolásból ki tudja választani a szórás definícióját;
  • felsorolásból ki tudja választani a belső szórásra igaz állítást;
  • önállóan meg tudja határozni az adatsor terjedelmét, szórását, relatív szórását, az abszolút és átlagos eltérést;
  • ki tudja számolni és értelmezni tudja a belső szórást, külső szórást és a teljes szórást;
  • meg tudja határozni az átlagos különbség mutatószámát, és értelmezni annak jelentését.
Tananyag

A középértékek csak egyetlen tulajdonságát rögzítik az eloszlásnak, ezért a statisztikai sokaság jellemzésére általában nem elegendőek. Egy sokaság eloszlása nagyon sokféle lehet, így az eloszlás formája is különböző lehet.

Az ismérvértékek szóródásának mérésére és mérőszámok képzésére különböző lehetőségek vannak.

Szóródáson azonos fajta számszerű adatok (általában egy mennyiségi ismérv értékének) különbözőségét értjük. A szóródás mérése az ismérvértékek valamely középértéktől vett eltérései vagy egymás közötti különbségei alapján történik.

Ezen eltérések, különbségek alapján számított mérőszámok a szóródás abszolút mutatói, amelyek mértékegysége megegyezik a megfigyelt ismérv mértékegységével.

A szóródás relatív mutatói elvonatkoztatnak az ismérvértékek mértékegységétől, nagyságrendjétől, a szóródás térbeli vagy időbeli összehasonlítására szolgálnak.

A szóródás legfontosabb mutatószámai:

  • terjedelem (R),
  • átlagos eltérés ( δ),
  • szórás ( σ, s),
  • relatív szórás (V, CV)
  • átlagos különbség (G).

Az egyes mutatószámokra az elmélet végén talál példát!

6.1. A szóródás terjedelme (R)

Azt mutatja meg, hogy a sokaság elemei milyen értékintervallumban helyezkednek el.

A szóródás terjedelme alatt az előforduló legkisebb és legnagyobb érték különbségét értjük:

R= x max x min

A szóródás terjedelme egy nagyon egyszerű és csak közelítő mérőszáma a szóródásnak. Az eloszlásnak csak a legkisebb és a legnagyobb értékét veszi figyelembe, és a két szélső érték közötti többi értéket nem. Arról, hogy a többi érték hol helyezkedik el, nem mond semmit.

6.2. Átlagos eltérés ( δ)

Az átlagos eltérés az ismérvértékek számtani átlagtól vett eltérésein alapul, azaz az egyes értékek számtani átlagtól vett eltérései abszolút értékének számtani átlaga:

δ= | x i x ¯ | n     δ= f i | x i x ¯ | f i

Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem a súlyok aránya befolyásolja ezért a relatív gyakoriságból is kiszámítható:

δ= g i | x i x ¯ |

Bemutató feladat

Pl. 50 izzó élettartamát vizsgálva.

Élettartam (óra)fiOszt. Közép | x i - x ¯ | gi g i | x i - x ¯ |
600-70056502100,121,0
700-800117501100,2224,2
800-90016850100,323,2
900-100010950900,218,0
1000-1100810501900,1630,4
Összesen5096,8

δ= 96,8

Ugyanezekkel az adatokkal dolgozva, csak a gyakoriságokat változtatjuk meg:

Élettartam (óra)fiOszt. Közép | x i - x ¯ | gi g i | x i - x ¯ |
600-700116502100,2246,2
700-80057501100,111,0
800-90010850100,22,0
9001-100016950900,3228,8
1000-1100810501900,1630,4
Összesen50118,4

δ= 118,4

6.3. A szórás

A legismertebb és a leggyakrabban használt mutató a szórás. A szórás az egyes értékek számtani átlagtól való eltéréseinek négyzetes átlaga, azaz megmutatja, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlagtól.

Tapasztalati szórás: az egész sokaságra vonatkozik.

σ= Σ ( x i x ) 2 n         σ= Σ f i ( x i x ) 2 Σ f i         σ= Σ g i ( x i x ) 2

elméleti szórás: a mintából számoljuk ki.

s= Σ ( x i x ) 2 n1           s= Σ f i ( x i x ) 2 Σ f i 1

Az eredeti táblázat (50 villanyégő) adataiból számítsuk ki a szórást

σ= Σ f i ( x i x ) 2 Σ f i = 5* (650860) 2 +11* (750860) 2 +...+8* (1050860) 2 50 =120,42

Tulajdonságai:

  • Ha az ismérvértékhez hozzáadunk egy állandót (A), a szórás értéke nem változik, mivel ilyenkor a számtani átlag is pont ezzel az állandóval lesz nagyobb.
  • Ha az ismérvértéket megszorozzuk egy állandóval (B), akkor a szórás (B(-szeresére változik, mivel ebben az esetben a számtani átlag értéke "B"-szer nagyobb lesz.

A szórás mindig nagyobb értékű, mint az átlagos eltérés!

6.3.1. Variancia

A variancia, vagy szórásnégyzet önálló mutatóként is használatos. Nagy jelentősége például a varianciaanalízisben van, amely több középérték összehasonlítására szolgál. Többféle jelölést találunk a szakirodalomban: s2, SS, MQ.

A szórásnégyzet, azaz a variancia a számtani és a négyzetes átlag ismeretében is kiszámolható:

σ 2 = x ¯ q 2 x ¯ 2

6.3.2. A szórásnégyzet és a szórás felbontása

Ha a sokaság részekre, azaz részsokaságokra bontható, akkor a szórásnégyzetet is fel lehet bontani két részre:

  • Belső szórásnégyzetre: σ B 2
  • Külső szórásnégyzetre σ K 2

A belső- és külső szórásnégyzet összege a teljes szórásnégyzet: σ T 2 = σ B 2 + σ K 2

A belső szórásnégyzet az egyes részsokaságok (csoporton belüli elemek és a csoport főátlaga között értelmezett különbségekből meghatározott) szórásnégyzeteinek az átlaga. Ebben a mérőszámban a csoportosító ismérven kívüli, egyéb tényezőknek a szóródó ismérve gyakorolt  hatása jelenik meg.

σ B 2 = Σ n j * σ j 2 n ,

ahol
j: a csoportosító ismérv változatainak a száma
σ j 2 : a j-edik részsokaság szórásnégyzete
nj: a j-edik részsokaság elemszáma
n: a sokaság elemszáma

A külső szórásnégyzet az egyes részsokaságok átlagai (részátlag) és a teljes sokasági átlag (főátlag) eltérés négyzetösszegének az átlaga (a részsokaságok nagyságával súlyozva). Ebben a mutatószámban fejeződik ki a csoportképző ismérvnek a vizsgált mennyiségi ismérvre gyakorolt hatása.

σ K 2 = Σ n j * ( x ¯ j x ¯ ) 2 n ,

ahol
x ¯ j : a részsokaságok átlaga
x ¯ : a teljes sokaság átlaga (főátlag)

A teljes szórás ( σ T ) azt fejezi ki, hogy a vizsgált sokaságban az egyes értékek átlagosan mennyivel térnek el a főátlagtól.

A belső szórás ( σ B ) azt fejezi ki, hogy a részsokaságok egyes értékei átlagosan mennyivel térnek el a saját részátlaguktól.

A külső szórás ( σ K ) azt fejezi ki, hogy a vizsgált sokaságban az egyes részsokaságok átlagai átlagosan mennyivel térnek el a sokasági főátlagtól.

Bemutató feladat

A hallgatók szakok szerinti csoportosításban az alábbi eredményt érték el egy vizsgán. A maximálisan elérhető pontszám 100 pont volt.

SzakHallgatók száma (fő)Az elért eredményük átlagpontszámaAz eredmények szórás
Közgazdász20635,6
Jogász30605,9
Mérnök25506,4

Számítsa ki az adatok alapján a belső, a külső és a teljes szórást, majd értelmezze azokat!

A vizsga átlagpontszáma, azaz a főátlag:

x = f i x i f i = 20*63+30*60+25*50 20+30+25 =57,47

A belső szórásnégyzet:

σ B 2 = n j * σ j 2 n = 20* 5,6 2 +30* 5,9 2 +25* 6,4 2 20+30+25 =35,94

A belső szórás:

σ B = σ B 2 = 35,94 =5,99 , Az egyes szakokon belül a hallgatók eredménye átlagosan 5,99 ponttal tér el az adott szakon elért átlagos pontszámtól.

A külső szórásnégyzet:

σ K 2 = Σ n j * ( x j ¯ x ¯ ) 2 n = 20* (6357,47) 2 +30* (6057,47) 2 +25* (5057,47) 2 20+30+25 =29,32

A külső szórás:

σ K = σ K 2 = 29,32 =5,41 , az egyes szakok átlagos vizsgaeredménye 5,41 ponttal tér el az összes hallgató által élért átlageredménytől.

A teljes szórásnégyzet:

A teljes szórás:

σ= σ 2 = 65,26 =8,08 , a vizsgán megjelent hallgatók eredménye átlagosan 8,08 ponttal tér el az összes hallgató által élért átlageredménytől.

6.3.3. A szóráshányados

A szórásnégyzet felbontásának segítségével meghatározhatjuk a szóráshányadost, amely a csoportképző ismérv (területi, minőségi, esetleg mennyiségi) és a vizsgált mennyiségi ismérv kapcsolatát jellemzi, kapcsolatának szorosságát fejezi ki:

H= σ K 2 σ 2 = 1 σ B 2 σ 2 = σ K σ

Értéke: 0 H 1 lehet.

6.4. Relatív szórás (V, CV)

Sok esetben a szóródás vizsgálatára a szórás, mint átlagos szóródási paraméter nem elegendő. Továbbá bizonyos esetekben szükség lehet arra, hogy az ismérvértékek nagyságrendjétől illetve mértékegységétől elvonatkoztatott "tiszta szám" jellegű mérőszámmal mérjünk, és összehasonlíthatóvá tegyük a szórásokat. E célból bármelyik eddig bemutatott mérőszámot viszonyíthatjuk az átlaghoz. A legismertebb ilyen szóródási mérőszám a relatív szórás vagy variációs koefficiens, amely kifejezi, hogy a szórás az átlag hányad része. Általában százalékban kifejezve adjuk meg.

V= σ x

Kifejezi, hogy a sokaság egyes egyedeinek értéke átlagosan hány százalékkal tér el az átlagtól.

A relatív szórás százalékosan kifejezve a gazdasági gyakorlatban a változékonyságot az alábbiak szerint minősíthetjük:

0-10%: állandóságot (homogenitást)
10-20%: közepes változékonyságot,
20-30%: erős változékonyságot
30% felett szélsőséges ingadozást fejez ki.

Önellenőrző feladatok
1. Jelölje meg az alábbiak közül a szóródásra jellemző meghatározást!
A leggyakrabban használt mutató
Nem azonos a szórással
Az átlagolandó értékek számtani átlagtól való eltérését mutatja meg.
2. Válassza ki a helyes állítást!
A szórás és az átlageltérés mindig egyenlő
A szórás mindig kisebb, mint az átlageltérés
A szórás mindig nagyobb, mint az átlageltérés
3. Válassza ki a szórás definícióját!
A szórás az ismérvértékek egymástól való eltérését mutatja meg.
A szórás az egyes ismérvértékek számtani átlagtól való eltérésének négyzetes átlaga
A szórás az egyes ismérvértékek számtani átlagtól való eltérésének átlaga
4. Jelölje meg az alábbiak közül a belső szórásra jellemző meghatározást!
A belső szórás az egyes ismérvértékeknek a csoportjuk átlagától való átlagos eltérését mutatja meg.
A belső szórás a részátlagok a főátlagtól való eltérését fejezi ki.
A belső szórás az egyes ismérvértékeknek a főátlagtól való eltérését fejezi ki.

5. A megadott adatok alapján határozza meg a sokaság szórását, a relatív szórást és az átlageltérést! A számolás során csak a végeredményt kerekítse!

Egy évfolyamban az átlagos testmagasságot vizsgálva 200 hallgató testmagassága az alábbi volt.

Testmagasság (cm)Hallgatók száma (fő)
-16025
161-17080
171-18065
181-19020
191-10
Összesen:200

A sokaság átlaga: 170,5 cm

 

A sokaság szórása (2 tizedjegy pontossággal): cm.
A relatív szórás (2 tizedjegy pontossággal): %.
Az átlageltérés (3 tizedjegy pontossággal): cm.

6. Írja be a táblázatba a hiányzó értékeket! Az eredményeket 3 tizedesjegy pontossággal számítsa ki!
Egy állattenyésztő juhállományának megoszlása fajta és gyapjúhozam szerint
Gyapjúhozam (kg)Fésűs merinóNémet húsmerinó
Fajta (db)
-4,5108
4,6-5,53012
5,6-6,53020
6,6-7,5405
7,6-8,5703
8,6-202
Összesen20050
Átlag6,9505,780
Szórás
A sokaság átlaga:6,716
6/a. Az előző feladat adataiból számítsa ki a belső szórást, a külső szórást, és a teljes szórást, 3 tizedesjegy pontossággal.

A belső szórás:
A külső szórás:
A teljes szórás:

6/b. Válassza ki a helyes megfogalmazást.
Az egyes fajták átlagos gyapjúhozama átlagosan 0,468 kg-mal tér el a gazdaság átlagos gyapjúhozamától.
A juhok átlagos gyapjúhozama 0,468 kg-mal tér el a gazdaság átlagos gyapjúhozamától.
A juhok átlagos gyapjúhozama 0,468 kg-mal tér el a fésűs merinó fajta átlagos gyapjúhozamától.