KURZUS: Közlekedésstatisztika

MODUL: I. modul: Csoportosítás, összehasonlítás

2. lecke: A statisztikai adatok rendezése

Követelmények

Ön akkor sajátította el megfelelően a tananyagot, ha

  • felsorolásból ki tudja választani az összegezhető statisztikai sorokat;
  • a megadott adatokról el kell tudni dönteni, hogy azok milyen statisztikai sorba rendezhetőek;
  • mennyiségi adatsorból ki tudja számítani a kumulált és a relatív gyakoriságot;
  • a keletkezés módja és az ismérv fajtája szerint csoportosítani tudja a statisztikai sorokat;
  • felsorolásból ki tudja választani a statisztikai táblák formai követelményeit;
  • adott statisztikai tábláról el tudja dönteni, hogy az milyen típusú (egyszerű, kombinációs, csoportosító).
Tananyag
2.1. Statisztikai sorok

A statisztikai sor a statisztikai adatok meghatározott összefüggésben történő felsorolása, egyetlen ismérv szerinti csoportosítása eredményeként jön létre. A csoportosítás lehetőséget nyújt a sokaság szerkezetének, struktúrájának tanulmányozására.

A statisztikai sorok felosztása:

Az adatok fajtája szerint:

  • valódi sorok: egy sokaságra vonatkoznak, azonos fajtájú adatokból keletkeznek
  • nem valódi sorok: valamilyen jelenség leírását adják többféle szempontból, több sokaságra vonatkoznak:
    • Leíró sor: A megfigyelés tárgyának különböző tulajdonságait írja le, az adatok között logikai kapcsolat van. Az intenzitási viszonyszámok forrásai.

A keletkezés módja szerint a valódi sorokat tovább bonthatjuk:

  • Összehasonlító sorokra,
  • Csoportosító sorokra.

Az ismérv fajtája szerint a valódi sorok az alábbiak lehetnek:

  • Idősor,
  • Területi sor,
  • Minőségi sor,
  • Mennyiségi sor.
2.1.1. Idősorok

Bizonyos időpontban vagy időpontban meglévő vagy bizonyos időtartam alatt bekövetkező jelenségek adatait sorolja fel.

  • Állapot idősor: az álló sokaságok időbeli változását mutatják be. Az adatok összegzésének nincs tárgyi értelme. Pl.: a személygépkocsi állomány éves bontásban.
  • Tartam idősor: egy időintervallum alatti mozgó sokaság időbeli alakulását mutatja. Dinamikus helyzetet tükröz. Az adatok összegzésének van tárgyi értelme, az összegzéssel egy hosszabb időtartamra jellemző adatot képezhetünk. Pl. turisták száma évente.
2.1.2. Területi sorok

Ha a csoportosítás a rendező elv, akkor egy nagyobb területi egység adatait az összetartozó kisebb területi egységeknek megfelelően osztályozzuk. Azonos időpontban rögzített statisztikai sokaság térbelileg bontott részsokaságait tartalmazza. Az ismérvváltozatok sorrendje kötetlen. A gyakoriságok összeadásának van tárgyi értelme. Pl.: népesség megyék szerinti megoszlása.

Ha azonban az összehasonlítás a rendező elv, akkor az adatok összegzésének nincs tárgyi értelme.

2.1.3. Minőségi sorok

A sokaságelemek minőségi tulajdonságainak formailag előre rögzített csoportosítása révén jön létre. Betekintést nyújt a sokaság összetételébe, szerkezetébe. Az ismérvváltozatok sorrendje kötetlen, a gyakoriságok (az előfordulások száma) összeadásának van tárgyi értelme. Pl. a külföldiek megoszlása az utazás jellege szerint 2010-ben: turista, kiránduló, átutazó.

2.1.4. Mennyiségi sorok

Mennyiségi ismérvek szerinti csoportosítással jön létre. Ha az ismérvértékek konkrét pontossággal megadott számok, akkor diszkrét mennyiségi sorról beszélünk. Általában számlálással kapjuk az ilyen sorokat. Ha az ismérvértékek adott intervallumban bármilyen értéket felvehetnek, akkor folytonos mennyiségi sorról beszélünk.

A mennyiségi sorok fajtái:

1. Gyakorisági sor: az ismérv előfordulásának gyakoriságát tüntetjük fel. A gyakoriság ( f i ) megmutatja, hogy az egyes ismérvváltozatok hányszor fordulnak elő a megfigyelt sokaságban. Ha az egyes gyakoriságokat azok összegéhez viszonyítjuk, akkor az adott ismérvérték relatív gyakoriságát ( g i ) kapjuk meg:

g i = f i Σ f i

ahol
g i : az i-edik ismérvérték relatív gyakorisága
f i : az i-edik ismérvérték gyakorisága
Σ f i : a sokaság elemeinek száma, azaz egyenlő n-nel.

Ha az ismérvváltozatok száma nagy, akkor az adatokat rangsoroljuk, és ez megkönnyíti a változó osztályozását. Az osztályozás sűríti az információt. A legnagyobb és legkisebb ismérvek által adott intervallumot úgy osztjuk osztályokba, hogy az egyes osztályközökön belül a gyakoriságok közel egyenlő eloszlásúak legyenek, így az osztályközép alkalmas lesz az osztály jellemzésére.

Az osztályok olyan adatcsoportok, ahol az egyes osztályok közötti mennyiségi változás minőségi változást takar.

Az osztályközök száma: 2k>N

Osztályköz hossza:

h= x max x min k

Ha a csoportosító ismérv folytonos jellegű, a mennyiségi sort osztályközös gyakorisági sornak nevezzük.

Bemutató feladat

Egy útszakaszon az átlagsebesség meghatározására 24 elemű mintát vettek. A mérések eredménye (km/h):

104,2100,293,498,6117,4100,888,2100,1
101,9116,8112,997,899,3111,5109,3100,7
118,096,489,498,9105,3112,499,5102,7

Feladat

Készítsen az adatokból rangsort!
Írja fel az optimálisnak tartott gyakorisági sort!

Megoldás

88,289,493,496,497,898,698,999,3
99,5100,1100,2100,7100,8101,9102,7104,2
105,3109,3111,5112,4112,9116,8117,4118,0

n=24, 25=32 > 24, ezért k=5

Az osztályköz hossza: h= (118,0-88,2)/5=5,96. Az osztályköz hossza kerekítve 6 lesz

Sebesség (km/h)személygépkocsik száma (db)Osztályközép
88,1-94,0391
94,1-100,0697
100,1-106,08103
106,1-112,02109
112,1-118,05115
Összesen:24-

2. Értékösszeg-sor: Ha a gyakorisági soroknál az ismérv előfordulási értékeinek összegét tüntetjük fel, akkor értékösszeg-sort kapunk.

Az értékösszeg jele: s i .

s i = f i x i

Bemutató feladat

Egy kereskedelmi egységben feljegyezték egy adott napon a tejet vásárlók megoszlását mennyiség szerint:

Vásárolt tej mennyisége (l)Vásárlók száma (db)
0-5,032
5,1-10,048
10,1-15,092
15,1-20,063
20,1-25,015
Összesen:250

Feladat

Állapítsa meg az egyes intervallumok osztályközepét!
Készítsen az adatokból értékösszeg-sort!

Megoldás

Vásárolt tej mennyisége (l)Vásárlók száma (db)Osztályközép (l)Eladott tej mennyisége (l) si
0-5,0322,580
5,1-10,0487,5360
10,1-15,09212,51150
15,1-20,06317,51102,5
20,1-25,01522,5337,5
Összesen:250-3030

3. Kumulált gyakorisági sor: A gyakorisági soroknál sajátos információkat nyerhetünk a gyakoriságuk kumulált képzésével. A kumulálás halmozott összeadást jelent, s arról kapunk képet, hogy egy adott értékhatárnál kisebb (alulról kumulált) vagy nagyobb (felülről kumulált) érték összesen hányszor fordul elő. A kumulált gyakoriság jele: f i .

Bemutató feladat

Az alábbi táblázat a gyermekvédelmi gondozásban részesülők számát mutatja be. Feladat a kumulált gyakoriság és a relatív gyakoriság kiszámítása.

Korcsoport (év)gyermekek száma (fő)
f i
f i g i
0-3184818480,11
4-512211848+1221=30690,07
6-930753069+3075=61440,18
10-1121646144+2164=83080,13
12-1438278308+3827=121350,22
15-17501012135+5010=171450,29
Összesen17145-1,00

Forrás: Magyar statisztikai zsebkönyv, 2009.

Pl.: g3=(3075/17145)=0,18

2.2. Statisztikai táblák

Több tulajdonság szerinti rendezéskor kapjuk. A statisztikai sorok összefüggő rendszere. Rendeltetés szerint lehet:

  • alap vagy gyűjtő tábla,
  • feldolgozási vagy munkatábla,
  • közlési vagy eredménytábla.

Az összefoglalt sorok típusa szerinti felosztás alapján:

  • egyszerű tábla: csoportosítást nem tartalmazó adatsorok összefüggő rendszere. Általában leíró és összehasonlító sorokat tartalmaz.
Megnevezés200020012002
Vállalkozások száma
Saját tőke
Idegen tőke
  • Csoportosító tábla: egy ismérv szerinti csoportosítást tartalmazó statisztikai sorok összefüggő rendszere.
Életkor200020012002
0-6
7-14
15-22
.
.
Összesen
  • Kombinációs tábla: A sokaság több ismérv szerinti kombinatív osztályozásának eredményeként kapott adatokat tartalmazza.
MegnevezésBudapestVárosKözségÖsszesen
Komfortos
Félkomfortos
Komfort nélküli
Összesen
Statisztikai táblák készítése

Formai és tartalmi követelményeknek kell érvényesülni, hogy megfeleljen a vizsgálat céljára.

Formai követelmény

  • táblázat címe,
  • megnevezések a fej- és oldalrovatban,
  • mértékegység feltüntetése,
  • forrás megjelölése.

Például:

A gyermekvédelmi gondozásban részesülők száma 2005-ben
Korcsoport (év)Gyermekek száma (fő)
0-31848
4-51221
6-93075
10-112164
12-143827
15-175010
Összesen17145

Forrás: Magyar statisztikai zsebkönyv, 2006.

Tartalmi követelmény

A tábla minden celláját információközlésre kell felhasználni, ezért a következő szokásos jelöléseket alkalmazzák:

  • konkrét adat: számszerű információ,
  • kihúzott rovat (-): nincs információ
  • ...: létezik adat, de nem áll rendelkezésre
  • +: az adat előzetes becslés eredménye
  • *: a táblázat alján lévő megjegyzésre utal
  • 0,0: van adat, de a többi adathoz képest túl kicsi.
Önellenőrző kérdések

Olvassa el figyelmesen az alábbi feladatokat, majd a lecke alapján oldja meg őket.

1. Jelölje be az összegezhető statisztikai sorokat!
minőségi sor
mennyiségi sor
állapot idősor
tartam idősor
területi sor
leíró sor
Forrás: Magyar statisztikai zsebkönyv, 2006.Vendéglátóhelyek száma üzletcsoportonként
Üzlettípus20052006
Étterem2153223628
Bár1161811712
Kávézó1213212831
Borozó89139628
2. Határozza meg a fenti táblázatban található statisztika sorok típusát!
minőségi sor
mennyiségi sor
idősor
területi sor
leíró sor
Forrás: Magyar statisztikai zsebkönyv, 2006.
3. Számítsa ki a következő mennyiségi sorból a kumulált- és a relatív gyakoriságot! A tizedes-törteket három tizedesjegy pontossággal adja meg. A számításokhoz használja az Excel táblázatkezelő programot. Ahova nem kerül adat, oda írjon "-" jelet!
Tudományos fokozattal rendelkezők száma 2006-ban
Tudományos fokozat f i f i g i
Akadémia rendes tagja246
Akadémia levelező tagja91
Tudomány doktora2650
Tudomány kandidátusa9508
Összesen
Forrás: Magyar statisztikai zsebkönyv, 2006.
4. Egészítse ki a következő mennyiségi sort tartalmazó táblázatot!  A tizedes-törteket három tizedes-jegy pontossággal adja meg. A számításokhoz használja az Excel táblázatkezelő programot.
Országos közúthálózat
Közutakközutak hossza (km) f i g i
Beton1021020,003
Aszfalt és bitumin28335
kő és keramit28463
makadám1517
kiépítetlen földút303070,011
Összesen-

5. Csoportosítsa a statisztikai sorokat:

  • keletkezés módja szerint: K
  • az ismérv fajtája szerint: I
Írja a megfelelő betűt a statisztika sor mellé!
SorokJel
Idősor
Minőségi sor
Csoportosító sor
Mennyiségi sor
Összehasonlító sor
6. Az alábbiak közül válassza ki a statisztikai táblák formai követelményeit!
Forrás megjelölése
Minden cellát információközlésre kell használni
Sorszám
Fejléc
Összesen rovat
Mértékegység
Lakás típusaBudapestVidéki nagyvárosKisvárosKözség
Komfort nélküli
Komfortos
Összkomfortos
Összesen
7. Határozza meg a fenti statisztikai tábla típusát!
Egyszerű tábla
Kombinációs tábla
Csoportosító tábla