KURZUS: Statisztika I.

MODUL: III. modul: Mennyiségi sorok további elemzési eszközei

7. lecke: Aszimmetria, koncentráció

Követelmények

Ön akkor sajátította el megfelelően a tananyagot, ha

  • el tudja dönteni, hogy aszimmetria esetén milyen összefüggés van a módusz és a medián között;
  • felsorolásból ki tudja választani ferdeségi mutató értékére vonatkozó igaz állítást;
  • ki tudja számolni az aszimmetria mutatószámait;
  • felsorolásból ki tudja választani a kiszámolt mutatószámokat helyes értelmezését;
  • felsorolásból ki tudja választani a Lorenz-görbe ábrázolásához szükséges adatokat;
  • az eredmények alapján ki tudja választani az aszimmetria mérőszámainak jelentését;
  • ki tudja számolni egy adott gyakorisági eloszlás koncentrációját.
Tananyag
7.1. Aszimmetria

A statisztikai sorokat ábrázolva nagyon változatos görbéket kapunk, de nagy többségük szabályszerűséget mutat. Az eloszlások típusától függ a görbe lefutása. Az eloszlások az alábbiak lehetnek:

  • egy móduszú,
    • Szimmetrikus: az adatok átlaga, módusza és mediánja azonos.
    • Aszimmetrikus: az adatok átlaga, módusza és mediánja nem azonos.
  • több móduszú.

Az eloszlások ábrázolásánál a vízszintes tengelyen az ismérvváltozatok értékeit tüntetjük fel, a függőleges tengelyen az ismérvváltozatokhoz tartozó megfigyelt adatokat.

Az egy móduszú gyakorisági soroknak egy helyi maximuma van. 3 típusát különböztetjük meg.

Egy móduszú eloszlásoknál az aszimmetria (vagy ferdeség) fokának jellemzésére több mutatószám is használható. A mutatószámokkal szemben támasztott főbb követelmények:

  • A mérőszám dimenzió nélküli legyen,
  • Szimmetrikus eloszlás esetén a nulla értéket vegye fel.
7.1.1. Pearson-féle mutatószám

Az aszimmetria egyik általános úgynevezett "A mérőszámának" kidolgozása K. Person nevéhez fűződik. A mérőszám képzése abból indul ki, hogy szimmetrikus eloszlásnál a számtani átlag és a módusz megegyezik, míg aszimmetrikus eloszlásnál eltérnek egymástól.

A= x M 0 σ

Ha 0,5| A| , akkor már erős aszimmetriáról beszélünk. Szélsőséges esetben 1-nél nagyobb érték is előfordulhat. Ha A>0, akkor bal oldali, ha A<0, akkor jobb oldali aszimmetriáról beszélünk. Mivel a módusz osztályközös gyakorisági sorból lett meghatározva, nem eléggé megbízható, ezért a mediánból is kiszámolható az aszimmetria egy másik Pearson-féle mutatószámmal.

Bemutató feladat

Egy kiskereskedőnél az egyik hétvégén megvizsgálták az egyes vásárlások összegét.

Vásárláskor fizetett összeg (Ft)Vásárlók száma (fő)OsztályközépKumulált gyakoriság
1-2502912529
251-5003437563
501-75054625117
751-100039875156
1001-1250201125176
1251-1500181375194
1501-1750121625206
Összesen206

Mo=500+ 5434 (5434)+(5439) *250643

x ¯ =733 σ=421 A= 733643 421 =0,214

Az adatsorra gyenge bal oldali aszimmetria jellemező.

7.1.2. Pearson-féle mutatószám2

Ez azon gyakorlati megfigyelésen alapul, hogy a mérsékelten aszimmetrikus eloszlások esetében a medián az átlagtól az átlag és a módusz közötti teljes távolság mintegy egyharmadával balra vagy jobbra esik

P= 3( x M e ) σ

A mutató értéke -3 és +3 közé esik. A 0-hoz közeli érték gyenge aszimmetriát jelent. Normális eloszlás esetén P=0. Ha P>0, akkor bal oldali, ha P<0, akkor pedig jobb oldali aszimmetriáról beszélünk. Ha P<-0,5, illetve P>0,5 esetében erős ferdeség jellemzi az eloszlást.

Bemutató feladat

Az előző feladatból: Me=685 P= 3(733685) 421 =0,342

Hasonló eredményt kaptunk, azaz gyenge bal oldali aszimmetria.

7.1.3 Ferdeségi mutató

A ferdeségi mutató az alsó és a felső kvartilis mediántól való eltérésének egymáshoz viszonyított nagyságán alapul.

F= ( Q 3 Me)(Me Q 1 ) ( Q 3 Me)+(Me Q 1 )

A mutató megoszlási viszonyszám jellegű, tehát értéke -1 és +1 között mozog. Ha F=0, akkor normális az eloszlás. Ha F>0, akkor bal oldali, ha F<0, akkor pedig jobb oldali aszimmetriáról beszélünk.

Bal oldali aszimmetria esetén a medián az alsó kvartilishez (Q1), jobb oldali aszimmetria esetén pedig a felső (Q3) kvartilishez esik közelebb. A 0-hoz közeli érték az aszimmetria hiányát mutatja, de 0,2-nél nagyobb érték esetén már nagyfokú aszimmetriáról beszélünk.

Bemutató feladat

Az előző feladatból: Q 1 =415 Q 3 =990 F= (990685)(685415) (990685)+(685415) =0,061

7.2. Koncentráció

Koncentrációnak nevezzük azt a jelenséget, hogy a sokasághoz tartozó teljes értékösszeg (az ismérv előfordulási értékeinek összege) jelentős része a sokaság kevés egységére összpontosul. Az értékösszeg jele: Si

Ha a sokaság elemszáma (n) kicsi, akkor már önmagában is koncentrációt jelent, hiszen a teljes értékösszeg kevés egységre összpontosít. A koncentráció kiszámításához:

  • a relatív gyakoriság, és
    g i = f i n
  • a relatív értékösszeg meghatározása szükséges:
    z i = s i Σ s i

A koncentráció vizsgálatának egyik legfontosabb és legelterjedtebb eszköze a Lorenz-görbe. Ez egy egységnyi oldalú négyzetben elhelyezett vonaldiagram, amely a kumulált relatív gyakoriság (gi') függvényében ábrázolja a kumulált relatív értékösszegeket (zi').

Ha az ábrázolt görbe az átlón fut, akkor a sokaságban nem figyelhető meg koncentráció, ha átlóhoz közel, akkor pedig gyenge koncentráció jellemzi a sokaságot. Minél nagyobb az átló és a görbe közötti terület, annál nagyobb a koncentráció mértéke.

A koncentrációs együttható egy megoszlási viszonyszám is egyben. A területekhez integrálszámításra van szükség, de a mutató a Gini-féle mutató segítségével is kiszámítható.

Koncentrációs együttható: K= T k T b = G 2 x

ahol
Tk: a koncentrációs terület nagysága ( a két görbe által bezárt terület).
Tb: az átló alatti terület

A K=0, a koncentráció teljes hiányát mutatja. A K=1 pedig a teljes koncentráltságot.
Minél kisebb a koncentráltság, annál kevésbé szóródnak az adatok.

Bemutató feladat

A Gini-féle mutatónál található feladat folytatása.

Pl. 50 izzó élettartamát vizsgálva.

Élettartam (óra)fiOszt. Közép
601-7005650
701-80011750
801-90016850
901-100010950
1001-110081050
Összesen50

Átlag= 860 óra
G= 2*160900/(50*49)= 137,22 óra

K= G 2 x = 137,22 2*860 =0,080 , azaz gyenge koncentráció jellemzi az adatsort.

Önellenőrző feladatok

Válassza ki a helyes meghatározást!

1. Bal oldali aszimmetria esetén...
a módusz nagyobb, mint a medián.
a módusz kisebb, mint a medián.
a módusz egyenlő a mediánnal.
2. A ferdeségi mutató értéke:
egynél nagyobb,
csak egynél kisebb.
Mindig -1 és +1 közé esik.

3. Az alábbi adatok egy évfolyam testmagasságának vizsgálatából származnak. Az évfolyam átlagos testmagassága 170,5 cm, 9,99 cm szórással. A medián értéke 170,4 cm. A leggyakoribb érték pedig 169,6 cm.

Határozza meg az aszimmetria fokát az "A"-mutató alapján, és értelmezze azt! Az eredményt 2 tizedesjegy pontossággal adja meg!

3/a

Az aszimmetria mérőszáma 'A'=

3/b. Válassza ki a helyes megállapítást!
aszimmetria mérőszáma jobb oldali aszimmetriát jelez.
aszimmetria mérőszáma bal oldali aszimmetriát jelez.
aszimmetria mérőszáma szimmetriát jelez.

4. Az alábbi adatok egy évfolyam vizsgaeredményeinek teljesítményét bemutató statisztikai sorból származnak. Az évfolyam átlagos teljesítménye 65 pont. A medián értéke 63,5 pont.. Az alsó kvartilis értéke 56,625 pont, a felső kvartilisé pedig 73,5 pont.

Határozza meg a ferdeségi mutató értékét, és értelmezze azt! Az eredményt 3 tizedesjegy pontossággal adja meg!

4/a

A ferdeségi mutató:

4/b. Válassza ki a helyes megállapítást!
A ferdeségi mutató mérőszáma jobb oldali aszimmetriát jelez.
A ferdeségi mutató mérőszáma bal oldali aszimmetriát jelez.
A ferdeségi mutató mérőszáma szimmetriát jelez.
5. Írja be a táblázatba a hiányzó értékeket! Az értékösszeg esetén egész számokkal dolgozzon, a gyakoriság, a kumulált gyakoriság, az értékösszeg-gyakoriság és a kumulált értékösszeg gyakoriság esetében 4 tizedesjegy pontossággal!
Közgazdász hallgató statisztika eredménye
Teljesítmény (pont)Közgazdászgigi'sizizi'
-5020
51-6040
61-7060
71-8030
81-9010
91-10
Összesen1701,0000-110501,0000-
5/a. Az előzőekben kiszámolt adatok közül melyek szükségesek a Lorenz-görbe ábrázolásához?
A hallgatók száma
A relatív gyakoriság
A kumulált relatív gyakoriság
Az értékösszeg