KURZUS: Közlekedési statisztika I.

MODUL: "B" modul: Az empirikus eloszlások elemzése

6. lecke: Helyzeti középértékek

A lecke követelményei

A tantárgy feldolgozása során ez a lecke a következő követelmények teljesítését segíti:

  • kiválasztani a mediánt, a móduszt leíró helyes definíciót
  • megadni a kvantiliseknek megfelelő osztópontok és részek számát
  • adatok alapján kiszámítani a keresett kvantilis értéket
  • kiválasztani táblázat és diagram alapján a móduszt
  • osztályközös gyakorisági sorból meghatározni a mediánt és a móduszt

A helyzeti középértékek a sokaságban elfoglalt helyzetüknél fogva jellemzik a vizsgált jelenséget, vagy folyamatot.

Abban, hogy az egyedek sokaságon belüli elhelyezkedése jellemző legyen, nyilvánvalóan az egyedeket előbb valamilyen - előre rögzített - szabály szerint rendezni kell. Például növekvő sorrendbe rendezzük az ismérvértékeket, vagyis rangsort képzünk. A helyzeti középértékek előnye, hogy függetlenek a sokaság más tagjainak értékeitől, ezért például heterogén sokaság esetén jellemzőbbek, mint az átlagok.

6.1. A medián

A kvantilis értékek a sokaság mennyiségi ismérv szerinti eloszlásának tömör leírását adják. A kvantilisek meghatározásához a rangsorból kell kiindulni. A rangsorba rendezett sokaságot 2, 3, 4, ... általában k egyenlő részre osztjuk és megállapítjuk az osztópontnak megfelelő ismérvértéket.

k egyenlő részOsztópont
neveJelölése
2mediánMe
3tercilisTj
4kvartilisQj
5kvintilisKj
10decilisDj
100percentilisPj

Például:

mediánterciliskvartilis

A kvantilisek meghatározása általában:

s j =j n+1 k

ahol:
n= a sokaság tagszáma,
k= az egyenlő részek száma,
j= 1, 2, ... k-1 az adott kvantilis értéken belüli sorszám.

Természetesen: M e = Q 2 = D 5 = P 50 (lásd a következő ábrát)

A medián a sor középső, centrális helyzetű tagja, a mennyiségi ismérvnek az az értéke, amelynél ugyanannyi kisebb, mint amennyi nagyobb érték fordul elő.

A kvantilis értékek sorszámai többnyire nem egész számok (mert a sokaság elemszáma miatt maradék nélkül nem oszthatók k-val: lásd s j =j n+1 k ), ezért a megfelelő szomszédos ismérvértékekből becsléssel határozhatjuk meg a kvantilis értéket.

A medián esetén, ha a rangsor tagszáma páratlan, a középső értéket egyszerűen csak ki kell keresni. Ha a rangsor páros tagszámú, a sorszám törtszám lesz, s ebben az esetben a rangsor két középső tagjának az egyszerű számtani átlagát tekintjük mediánnak.

Például egy üzem dolgozóinak elmúlt havi teljesítményszázalékai az alábbiak:

Sorba rendezés előttSorba rendezés után
Dolgozó neveTeljesítmények
%-a
Dolgozó neveTeljesítmények
%-a
Sorszám
N.J.92N.J.921
K.L.98K.F.942
Y.H.110K.L.983
K.F.94B.F.1054
L.I.120S.I.1085
J.I.116Y.H.1106
B.F.105J.I.1167
S.I.108H.B.1188
H.B.118L.I.1209

M e =j n+1 k =1 9+1 2 =5 Arangsor 5. tagja: M e =108%

Q 1 ( alsó kvartilis )=j n+1 k =1 9+1 4 =2,5

Ha a rangsor 2. tagja: 94%, 3. tagja: 98%, akkor a "2,5-ik tagja": 94%+98% 2 =96%

Q 2 = M e =108%  (a szabályt lásd korábban)

Q 3 ( felső kvartilis )=j n+1 k =3 9+1 4 =7,5

Ha a rangsor 7. tagja: 116%, 8. tagja: 118%, akkor a "7,5-ik tagja": 116%+118% 2 =117%

A medián sorszámának megfelelő ismérvértékek "kikeresése", meghatározása osztályközös gyakorisági sor esetén, csak becsléssel lehetséges.

a)Ilyenkor is megállapíthatjuk a medián sorszámát.
b)Megkeressük a mediánt tartalmazó osztályközt (képezzük a kumulált gyakoriságokat, és ahol a kumulált gyakoriság értéke éppen nagyobb, mint a medián sorszáma, abban az osztályközben van a medián).
c)A medián sorszámából levonjuk a medián osztályközét megelőző osztályköz kumulált gyakoriságát (a különbség azt mutatja, hogy a medián a saját osztályközében hányadik).
d)Feltételezzük, hogy a medián osztályközében a gyakoriságok egyenletesen helyezkednek el (az osztályköz nagyságát felosztjuk a gyakoriságok arányában).
e)A mediánt tartalmazó osztályköznek annyiad részét adjuk az osztályköz alsó határához, ahányadik az osztályközben a medián.

Általában:

M e =a+ ba f M e j

ahol:
a = a mediánt tartalmazó osztályköz alsó határa,
b = a mediánt tartalmazó osztályköz felső határa,
f M e = a mediánt tartalmazó osztályköz gyakorisága,
j = a medián sorszámának és a medián osztályközét közvetlenül megelőző osztályköz kumulált gyakoriságának a különbsége.

Osztályköz
x i
Gyakoriság
f i
Kumulált gyakoriság
f k i
0-501818
51-1002745 Q 1
101-1501055
151-2001166 M e
201-250874
251-300882
301-350486
351-400591 Q 3
401-450192
451-500193
501-550295
551-600398
601-6503101
651-7003104
701-75010114
Együtt114-

M e sorszáma:  114+1 2 =57,5

M e értéke=a+ ba f M e j=150+ 200150 11 ( 57,555 )=161,36

Q 1 sorszáma:  114+1 4 =28,75

Q 1 értéke=50+ 10050 27 ( 28,7518 )=69,91

Q 3 sorszáma:3 114+1 4 =86,25

Q 3 értéke=350+ 400350 5 ( 86,2586 )=352,5

6.2. A módusz

A diszkrét értékekkel rendelkező mennyiségi ismérv módusza a leggyakrabban előforduló ismérvérték, melyet modális értéknek is nevezünk.

A módusz megállapításához nincs is szükség számításra, hiszen a gyakorisági sorból, vagy diagramból leolvasható, a legnagyobb értékű gyakoriság. Értékét a szélső értékek nem befolyásolják. Meghatározását többnyire ezen tulajdonsága teszi indokolttá.

Például a fenti ábra alapján megállapítható, hogy a 60 elemű diszkrét, 7 különféle ismérvértéket tartalmazó gyakorisági sor módusza Mo = 1 (mert az 1-es ismérvérték gyakorisága a legnagyobb).

Osztályközös gyakorisági sorból a móduszt is becsléssel tudjuk meghatározni:

a)Rátekintéssel megállapítjuk, hogy melyik a modális osztályköz (legnagyobb gyakoriságú osztályköz).
b)A kiválasztott osztályközön belül kell a módusz helyét kijelölnünk. A becslés arra épül, hogy a módusz azon szomszédos osztályközhöz esik közelebb, ahol nagyobb a gyakoriság. Ezért képezzük a szomszédos gyakoriságok és a modális osztályköz gyakoriságának a különbségét.
c)A szomszédos gyakoriságok különbségei alapján (megoszlási viszonyszámokkal) felosztjuk a modális osztályközt.
d)A megfelelő hányadot (az alsó szomszédtól számított különbség arányában) a modális osztályköz alsó határához hozzáadjuk. (A felső szomszédtól számított különbség arányában a modális osztályköz felső határából levonjuk!)

Általában:

Mo=a+ ( f Mo f Mo1 ) ( f Mo f Mo1 )+( f Mo f Mo+1 ) ( ba )

ahol:
a = a legnagyobb gyakoriságú osztályköz alsó határa,
b = a legnagyobb gyakoriságú osztályköz felső határa,
f Mo = a modális osztályköz gyakorisága,
f Mo1 = a modális osztályközt megelőző osztályköz gyakorisága,
f Mo+1 = a modális osztályközt követő osztályköz gyakorisága.

A medián becslésénél közölt példánkban, legnagyobb gyakoriságú (27) az 50-100-as osztályköz:

Osztályköz
x i
Gyakoriság
f i
0-5018
51-10027Mo
101-15010
151-20011
201-2508
251-3008
301-3504
351-4005
401-4501
451-5001
501-5502
551-6003
601-6503
651-7003
701-75010
Összesen114
Mo=a+ ( f Mo f Mo1 ) ( f Mo f Mo1 )+( f Mo f Mo+1 ) ( ba )= =50+ ( 2718 ) ( 2718 )+( 2710 ) ( 10050 )=67,31

Azt a tényt, hogy az osztályközök nem egyenlő hosszúságúak a medián becslésénél elhanyagolhatjuk (hiszen az osztályköz nagyságát a benne helyet foglaló gyakoriságok egyenletes eloszlásának feltételezésével osztjuk fel), de a módusz becslésénél ilyen esetben arányos osztályközökre kell korrigálnunk a gyakoriságokat (ismét feltételezve azok egyenletes eloszlását).

Önellenőrző kérdések

Olvassa el figyelmesen az alábbi feladatokat, majd a lecke tartalma alapján oldja meg őket!

1. Válassza ki a medián definícióját!
A medián a mennyiségi ismérvnek az az értéke, amelynél kétszer annyi kisebb, mint amennyi nagyobb érték fordul elő.
A medián a sor középső, centrális helyzetű tagja, a mennyiségi ismérvnek az az értéke, amelynél ugyanannyi kisebb, mint amennyi nagyobb érték fordul elő.
A medián a leggyakrabban előforduló ismérvérték.
A medián a legritkábban előforduló ismérvérték.
A medián a mennyiségi ismérvnek az az értéke, amelynél négyszer annyi kisebb, mint amennyi nagyobb érték fordul elő.
2. Válassza ki a módusz definícióját!
A módusz a mennyiségi ismérvnek az az értéke, amelynél háromszor annyi kisebb, mint amennyi nagyobb érték fordul elő.
A módusz a sor középső, centrális helyzetű tagja, a mennyiségi ismérvnek az az értéke, amelynél ugyanannyi kisebb, mint amennyi nagyobb érték fordul elő.
A módusz a leggyakrabban előforduló ismérvérték.
A módusz a legritkábban előforduló ismérvérték.
A módusz a mennyiségi ismérvnek az az értéke, amelynél kilencszer annyi kisebb, mint amennyi nagyobb érték fordul elő.
3. Az alábbi kvantilisek esetében adja meg a kialakuló egyenlő részek és osztópontok számát!
Egészítse ki a táblázatot a megfelelő egész számok beírásával!
Kvantilisekegyenlő részekosztópontok száma
medián
tercilis
kvintilis
percentilis
4. Határozza meg az alábbi sokaság móduszát!
Írja be a kettőspont után a módusz értékét!



A módusz értéke:

5. Határozza meg az alábbi sokaság esetében a medián értékét!

Adatok
910756433411150
Írja be a kettőspont után a medián értékét!

A medián értéke: