KURZUS: Statisztika I.

MODUL: II. modul: Az empirikus eloszlások elemzése

5. lecke: Helyzeti középértékek

Követelmények

Ön akkor sajátította el megfelelően a tananyagot, ha

  • felsorolásból ki tudja választani a mediánt, móduszt meghatározó helyes definíciót;
  • számított értékről el tudja dönteni, hogy az módusz, medián, vagy egyik sem;
  • önállóan ki tudja számítani a móduszt diszkrét és folytonos ismérvváltozó esetén;
  • önállóan kiszámítani a mediánt diszkrét és folytonos ismérvváltozó esetén;
  • a megadott adatok alapján kiszámolni a keresett kvartilisértékeket.
Tananyag

A helyzeti középértékek a sokaságban elfoglalt helyzetüknél fogva jellemzik a vizsgált jelenséget vagy folyamatot. Ahhoz, hogy az egyedek sokaságon belüli elhelyezkedése jellemezhető legyen, az egyedeket valamilyen előre rögzített szabály szerint sorba kell rendezni. Általában növekvő sorrendbe rendezzük az ismérvértékeket, azaz rangsort képezünk.

5.1. Módusz

A legegyszerűbb helyzeti mutató a leggyakoribb érték, amely egyben a "legsűrűbb" érték, és módusznak nevezzük. A módusz egy gyakorisági eloszlásnak az az ismérvváltozata, amely a leggyakrabban fordul elő, azaz a legnagyobb gyakorisággal. Egy eloszlásnak több módusza is lehet.

Pl. 927 férfit megkérdeztek a nyakkendőjük számáról:

Ny. száma01234567899>Össz.
Gyak.12820212984162022354393119927

Diagramon ábrázolva:

Mo=1 és Mo=5
Azaz ennek a gyakorisági sornak két módusza van.

Folytonos gyakorisági sor esetén már nehezebb megállapítani a módusz konkrét értékét. Az osztályközös gyakorisággal megadott adatok esetében a statisztikai gyakorlat nem egységes. Kevés ismérvértéket felvehető diszkrét jelenségnél adott osztályköz felső határát meghaladja a következő osztályköz alsó határa, és ekkor az osztályközepeknél az osztályközök tényleges és megadott határai megegyeznek egymással, és az osztályba sorolás egyértelmű. Ekkor az osztályközök megadott alsó és felső határaival kell számolni. Folytonos ismérvértékeknél vagy sok ismérvértékkel rendelkező diszkrét ismérvértékeknél az osztályköz-határok kétféle megadása lehetséges. Első esetben az adott osztályköz felső határa és a következő osztályköz alsó határa megegyezik egymással, és az osztályköz-határral megegyező értékű elemeket az alacsonyabb osztályközbe soroljuk be. Második esetben közölt osztályköz-határokat adunk meg, amelyek csak arról tájékoztatnak, hogy az osztályköz-határokkal megegyező értékű elemeket az alacsonyabb osztályközbe soroljuk. Ekkor az osztályközepek kiszámításához és a módusz és medián becsléséhez az előző osztályköz felső határával számolunk.

M o = m 0 + f m o - f m o-1 ( f m o - f m o-1 ) +( f m o - f m o+1 ) *h

mo: a modális osztályköz alsó határa,
fmo: a modális osztályköz gyakorisága
fmo-1: a modális osztályközt megelőző osztályköz gyakorisága,
fmo+1: a modális osztályközt követő osztályköz gyakorisága
h: az osztályköz hossza

Pl. egy kiskereskedőnél az egyik hétvégén megvizsgálták az egyes vásárlások összegét.

Vásárláskor fizetett összeg (Ft)Vásárlók száma (fő)
1-25029
251-50034
501-75054
751-100039
1001-125020
1251-150018
1501-175012
Összesen206

A táblázatban jól látható, hogy a legtöbb adat 501-750 között van, azaz a leggyakoribb érték itt található.

Mo=500+ 5434 (5434)+(5439) *250643

A vásárlások 643 Ft körül sűrűsödtek.

5.2. Medián

A másik leggyakrabban alkalmazott helyzeti középérték a medián. A nagyság szerint sorba rendezett értékek közül a középső. A medián az az érték, amelynél kisebb értékek gyakorisága azonos a nálánál nagyobb értékek gyakoriságával, azaz a medián a megfigyelt értékek rangsorát két egyenlő részre osztja.

Páratlan számú adat esetén: Me= n+1 2 -edik elem a medián.

Pl.: Egy vizsgán 17 hallgató az alábbi pontszámokat érte el: 8, 8, 9, 10, 10, 10, 11, 11, 12, 12, 13, 13, 13, 14, 14, 14, 14.

A medián a 9. elem, így Me=12

Páros számú adat esetén: a medián sorszámát (sMe) az alábbiak alapján számítjuk ki s Me = n+1 2 0,5és n+1 2 +0,5 -edik elem lesz a medián, a hozzátartozó értékeket átlagolni kell.

pl.: 8 rúdugró az alábbi magasságokat ugrotta át: 4,6  4,8  4,8  4,9  5,0  5,0  5,1  5,3 (m)

A medián a 4. és 5. elem átlaga lesz: Me= 1 2 *(4,9+5,0)=4,95 m

Folytonos gyakorisági sor esetén hasonlóan a móduszhoz, nehezebb megállapítani a középső értéket.

Me= m e + n 2 f m e1 ' f m e *h

n/2: a medián sorszáma (középső érték)
me: a mediánt tartalmazó osztályköz alsó határa
f'me-1: a mediánt tartalmazó osztályközt megelőző osztályköz kumulált gyakorisága
fme: a mediánt tartalmazó osztályköz gyakorisága
h: az osztályköz hossza

pl. 200 diák testmagasságát mérték meg:

Testmagasság (cm)fif'i
151-1603030
161-17080110
171-18070180
181-19010190
190-20010200
Összesen200-

A kumulált gyakoriságból lehet megállapítani,hogy melyik osztályközben található a medián.200 eleműnk van, így a medián elvileg a 100. és a 201. elem átlaga lenne, ha nem osztályközös gyakorisági sorból állapítanánk meg, így azonban csak azt kell meghatározni, hogy melyik osztályközben találhatóak ezek az elemek. A táblázatból leolvasható, hogy a mediánt a második osztályközben kell keresni, ugyanis itt található a nagyság szerint sorba rendezett adatok közül a 100. és 101. elem.

Me=160+ 200 2 30 80 *10=168,75cm

a diákok fele 168,75 cm-nél alacsonyabb, fele pedig magasabb.

5.3. Kvantilisek

A középértékek mellett fontos helyzeti mutatók a kvantilisek. Ha a rangsorba rendezett sokaságot egy X-ismérvérték q:(1-q) arányban osztja ketté, akkor ezt az ismérvértéket q-ad rendű vagy q-adik kvantikisnek nevezzük. A kvantilisek meghatározása egyúttal a sokaság egy osztályozását jelenti. Ezen osztályozás során egyenlő gyakoriságú osztályközöket kapunk.

5.3.1. Kvartilisek

A sokaságot négy egyenlő elemszámú részsokaságra bontjuk.

  • Az alsó kvartilis: Q1, amely megmutatja, hogy a sokaság 1/4-része mely értéknél kisebb.
  • A középső kvartilis: Q2, amely megegyezik a mediánnal.
  • A felső kvartilis: Q3, amely megmutatja, hogy a sokaság 3/4-része mely értéknél kisebb, illetve 1/4 része mely értéknél nagyobb.

Az alsó kvartilis sorszáma: s= n+1 4

A felső kvartilis sorszáma pedig: s=3* n+1 4

A képletek megegyeznek a medián képletével, természetesen a megfelelő fogalmak cseréje esetén.

Pl. a felső kvartilis kiszámítása: Q 3 = q 3 + 3* n 4 f q 31 ' f q 3 *h

3*n/4: a felső kvartilis sorszáma
q3 a felső kvartilist tartalmazó osztályköz alsó határa
f'q3-1: a felső kvartilist tartalmazó osztályközt megelőző osztályköz kumulált gyakorisága
fq3: a felső kvartilist tartalmazó osztályköz gyakorisága
h: az osztályköz hossza

5.3.2. Tercilisek

Ha két osztópont segítségével három egyenlő részre osztjuk a sokaságot, akkor terciliseket kapunk (T1 és T2). Az alsó tercilis (T1) a sokaság alső harmadolópontja, amely megmutatja, hogy mely értéknél kisebb a sokaság 1/3-ad része, illetve mely értéknél nagyobb a sokaság 2/3-ad része. A felső tercilis (T2) a sokaság felső harmadolópontja, amely megmutatja, hogy mely értéknél kisebb a sokaság 2/3-ad része, illetve mely értéknél nagyobb a sokaság 1/3-ad része.

Kiszámításuk a mediánhoz hasonló.

Az alsó tercilis képletet: T 1 = t 1 + n 3 f t 11 ' f t 1 *h

A felső tercilis képlete: T 2 = t 2 + 2* n 3 f t 31 ' f t3 *h

5.3.3. Decilisek

A decilisek számítása során 9 osztópont segítségével tíz egyenlő részre bontjuk a sokaságot, azaz tíz egyenlő gyakoriságú osztályközt hozunk létre. Az első decilis (D1) megmutatja, hogy a sokaság 1/10-d része mely értéknél kisebb.

Kiszámítása a kvartilisekhez hasonló, természetesen a megfelelő jelölések változtatásával. Például a 7. decilis értéke az alábbi képlettel számítható ki:

D 7 = d 7 + 7* n 10 f d 71 ' f d 7 *h

Bemutató feladat

Kétszáz diák testmagasságát mérték meg:

Testmagasság (cm)fif'i
151-1603030
161-17080110
171-18070180
181-19010190
190-20010200
Összesen200-

A felső kvartilis az adatok 3/4-t jelenti, azaz a 150. és 151. elem átlaga lenne (3*200/4), de osztályközös gyakorisági sornál a kumulált gyakoriság alapján az osztályközt kell először meghatározni. A táblázatból kiolvasható, hogy a felső kvartilis a 3. osztályközben található, értéke:

Q 3 = q 3 + 3* n 4 f q 31 ' f q 3 *h=170+ 3* 200 4 110 70 *10=175,71cm , azaz a diákok 3/4-ed része alacsonyabb 175,71 cm-nél 1/4-ed része pedig ennél magasabb.

Az alsó tercilis (hasonlóan kell meghatározni, mint a mediánt vagy a kvartilist):

T 1 = t 1 + n 3 f t 11 ' f t 1 *h=160+ 200 3 30 80 *10=164,58cm , azaz a diákok 1/3-ad része alacsonyabb 164,58 cm-nél 2/3-ad része pedig ennél magasabb.

A 8. decilis (hasonlóan kell meghatározni, mint a mediánt vagy a kvartilist):

D 8 = d 8 + 8* n 10 f d 81 ' f d 8 *h=170+ 8* 200 10 110 70 *10=177,14cm azaz a diákok 8/10-ed (80%) része alacsonyabb 177,14 cm-nél 2/10-ed (20%) része pedig ennél magasabb.

Önellenőrző kérdések

Figyelem! Az itt kiszámított értékek a következő Modulokban szükségesek.

1. Válassza ki a helyes definíciót!
A medián a leggyakrabban előforduló érték
A medián a sor középső tagja, a mennyiségi ismérvnek az az értéke, amelynél ugyanannyi kisebb elem van, mint nagyobb.
A medián a mennyiségi ismérvnek az az értéke, amelynél kétszer annyi kisebb elem van, mint amennyi nagyobb érték fordul elő.
A medián a legritkábban előforduló ismérvérték
2. Válassza ki a módusz definícióját!
A módusz a leggyakrabban előforduló érték
A módusz a sor középső tagja, a mennyiségi ismérvnek az az értéke, amelynél ugyanannyi kisebb elem van, mint nagyobb.
A módusz a mennyiségi ismérvnek az az értéke, amelynél háromszor annyi kisebb elem van, mint amennyi nagyobb érték fordul elő.
A módusz a legritkábban előforduló ismérvérték

3. Egy vizsgán a hallgatók az alábbi eredményt érték el:

Osztályzatfi
229
347
419
55
Összesen100
Döntse el, hogy az alábbi mondatok a mediánra vagy a móduszra vonatkoznak.

A válaszok mellé írja a megfelelő számot az alábbiak szerint:
Medián: 1
Módusz:2
Egyiksem:3

A hallgatók átlagosan közepes osztályzatot kaptak. :
A hallgatók közül legtöbben közepes osztályzatot kaptak.:
A hallgatók egyik fele közepes osztályzatnál rosszabb, a másik fele pedig közepes osztályzatnál jobb jegyet kapott:
A hallgatók egyik fele közepest vagy közepes osztályzatnál rosszabb, a másik fele pedig közepes vagy közepes osztályzatnál jobb jegyet kapott:

4. Állapítsa meg a következő statisztikai sor móduszát és mediánját!

Egy településes a családok megoszlása a családban élő gyermekek száma szerint
Gyermekek száma (fő)Családok száma (db)
0992
1954
2761
3148
440
515
65
Összesen

Forrás: Magyar statisztikai zsebkönyv, 2006.

4/a. Adja meg a módusz értékét!

Módusz:

4/b. Adja meg a medián értékét:

Medián:

Forrás: Magyar statisztikai zsebkönyv, 2006.
5. Számítsa ki a kumulált gyakoriságot, és számítsa ki a statisztikai sor mediánját és móduszát! Az eredményt kerekítse egész számokra!
A nyugdíjban részesülők megoszlása 2007. januárban
A teljes ellátás havi összege (Ft)Öregségi nyugdíjasok megoszlása (%(Kumulált gyakoriság
-200000,4
20001-300000,7
30001-400002,9
40001-500008,7
50001-6000013,9
60001-7000017,3
70001-8000017,9
80001-9000010,9
90001-1000008,1
100001-1100005,7
110001-1200004,3
120001-1500006,8
150001-2,4
Összesen100,0
5/a. Adja meg a medián értékét!

Medián: Ft

5/b. Adja meg a módusz értékét!

Módusz: Ft

6. Számítsa ki az alsó és felső kvartilis értékét. Az eredményt a kvartilisnél 3 tizedesjegy pontossággal, a decilis esetében egészszámokra kerekítve adja meg!
Közgazdász hallgatók teljesítménye statisztika írásbeli vizsgán
Teljesítmény (pont)KözgazdászKumulált gyakoriság
-5020
51-6040
61-7060
71-8030
81-9010
91-10
Összesen170
6/a. Adja meg az alsó kvartilis értékét!

Az alsó kvartilis értéke:

6/b. Adja meg a felső kvartilis értékét!

Az felső kvartilis értéke:

6/c. Az előző adatokból számolja ki az alábbi deciliseket!

D4:
D9: