KURZUS: Statisztika II.

MODUL: IV. modul: Idősorok elemzése

11. lecke: Analitikus trendszámítás

Követelmények

Ön akkor sajátította el megfelelően a tananyagot, ha

  • tudja, hogy mit jelent a trendszámítás,
  • ki tudja választani a lineáris és az exponenciális trend jellemzőjét,
  • tudja a lineáris és az exponenciális trend paramétereinek jelentését,
  • tudja milyen esetekben végezhetünk extrapolációt,
  • az adatok alapján meg tudja határozni a lineáris és az exponenciális trendfüggvény paramétereit,
  • el tudja dönteni, hogy milyen függvény írja le jobban az adatokat.
Tananyag

Ha a vizsgált jelenség tartós irányzatát az idő függvényében valamilyen regressziós függvénnyel határozzuk meg, akkor analitikus trendszámításról beszélünk. Az analitikus trendszámítás tehát a regresszió-számítás egy speciális esete, amennyiben az idősorban bekövetkezett változásokat az időtényező (t) függvényében vizsgáljuk.

Hasonlóan a regresszió-számításhoz, a trendszámításnál is először ábrázolni kell az adatokat, és kiválasztani a függvény típusát.

11.1. Lineáris trend

Ha az adatokra az egyenletes változás jellemző, akkor lineáris trenddel határozzuk meg az alapirányzat értékeit.

y = β 0 + β 1 *t

Hasonlóan a regresszió-számításhoz, itt is a legkisebb négyzetek módszerét alkalmazzuk, a normálegyenletek a következők:

y i =n* β 0 + β 1 * t i t i * y i = β 0 * t i + β 1 * t i 2

A megoldáshoz kódolnunk kell az idősor adatait. Ez többféleképpen lehetségesféleképpen történhet:

  • Ha az idősort t=1,2,3,...n kódoljuk:
évti
19991
20002
20013
20024
20035
20046
20057
20068

A normálegyenleteket átalakítva megkapjuk a trendfüggvény együtthatóit:

β 1 = t i * y i ( t i )*( y i ) n t i 2 ( t i ) 2 n

β 0 = y ¯ β 1 * t i n

  • Ha az idősort Σt=0 módon kódoljuk, akkor különbség van a páros és páratlan számú idősor esetében.
    • Páratlan tagszámú időssor:
évt
1999-3
2000-2
2001-1
20020
20031
20042
20053
    • Páros tagszámú idősor esetén:
évtt
1999-3,5-7
2000-2,5-5
2001-1,5-3
2002-0,5-1
20030,51
20041,53
20052,55
20063,57

Ebben az esetben a normálegyenletek egyszerűbbek, és a trendfüggvény együtthatóit az alábbi képletekkel kapjuk meg:

y i =n* β 0 t i *y = β 1 * t i 2 β 0 = y i n = y ¯ β 1 = t i * y i t i 2

A β 1 paraméter az időegységenkénti átlagos abszolút változás mértéke, előjelétől függően növekedést vagy csökkenést jelez.

Ha Σt=0, és az időpontok száma páros, akkor 2* β 1 1 az időegységenkénti átlagos abszolút változás mértéke.

A β 1 paraméter az alapirányzat értéke a t=0 időpontban:

  • ha t=1, ...n, akkor a vizsgálatba bevont időpontot megelőző időpont trend szerinti értéke.
  • Ha Σt=0, és páratlan az idősornál választott tagszám, akkor a középső időpont alapirányzata és egyben a vizsgált idősor adatainak számtani átlaga.
  • Ha Σt=0, és páros az idősornál választott tagszám, és nincs t=0, akkor az idősor adatainak számtani átlaga.

Ezután a regresszió számításhoz hasonlóan, kiszámoljuk a reziduális szórásnégyzetet.

s e 2 = ( y i y i ) 2 n ,

és a reziduális szórás mutatószámát:

V e = s e y _ *100

Ez a valós értékektől való átlagos eltérését mutatja a trendértékeknek.

Bemutató feladat

A villamosenergia-termelés Magyarországon.

millió kWhtit2t*yyt(y-yt)2
198929580-525-14790028451,181274234,59
199028365-416-11346029461,201201650,06
199129932-39-8979630471,22290753,89
199231238-24-6247631481,2359162,78
199332630-11-3263032491,2519251,01
19943392800033501,27182098,49
199534978113497834511,29217820,09
199635305247061035521,3146788,29
1997370233911106936531,32241745,29
19983696841614787237541,34328721,05
19993856752519283538551,36244,61
Összesen3685140110111102368513,973862470,15
átlag33501,27

β 1 = 1010,018

β 1 = 33501,27

Az yt-értékeket úgy kapjuk meg, hogy a trendegyenletbe rendre behelyettesítjük a t-értékeket.
yt=33501,27+1010,018*(-5)=28451,18
yt=33501,27+1010,018*(-4)=29461,20
stb.

s e 2 = ( y i y i ) 2 n = 3862470,15 11 =351133,65 s e =592,565

V e = s e y _ *100= 592,565 33501,27 *100=1,77%

A függvény szerinti villamosenergia-temelés 1,77%-os hibával illeszkednek a tényleges adatokhoz.

Nézzük meg, ha másmódon kódoljuk az időt, mi lesz a trendegyenlet!

millió kWhtt2t*yyty-yt(y-yt)2
198929580112958028451,171128,831274257,17
199028365245673029461,19-1096,191201632,52
199129932398979630471,21-539,21290747,424
19923123841612495231481,23-243,2359160,8329
19933263052516315032491,25138,7519251,5625
19943392863620356833501,27426,73182098,493
19953497874924484634511,29466,71217818,224
19963530586428244035521,31-216,3146790,0161
19973702398133320736531,33491,67241739,389
1998369681010036968037541,35-573,35328730,223
1999385671112142423738551,3715,63244,2969
Összesen368514665062322186368513,97 3862470,15
átlag33501,27

y t =n* b 0 + b 1 * t t* y t = b 0 * t + b 1 * t 2 368514=11* b 0 + b 1 *66 2322186= b 0 *66+ b 1 *506

b1=1010,02
b0=27441,15
yt=27441,15+1010,02*t

11.2. Exponenciális trend

A társadalmi-gazdasági folyamatok változó környezetben nem mindig mutatnak lineáris tendenciát. Ha az időegységenkénti relatív változás ingadozik egy állandó körül, akkor a tartós irányzatot exponenciális trenddel fejezzük ki. Az exponenciális trendegyenletet logaritmus segítségével visszavezetjük lineárisra:

y = β 0 * β 1 t lg y =lg β 0 +t* β 1 Y= B 0 +t* B 1

A normálegyenlet:

Y i =n* B 0 + B 1 * t i t i * Y i = B 0 * t i + B 1 * t i 2

A Σt=0 esetében a normálegyenletek leegyszerűsödnek:

Y i =n* B 0 t i *Y = B 1 * t i 2 B 0 = Y i n B 1 = t i * Y i t i 2 β 0 = 10 B 0 β 1 = 10 B 1

A β 1 paraméter az időegységenkénti relatív változást mutatja.

Bemutató feladat

Exponenciális trend esetében először logaritmizálni kell az yiértékeket. A továbbiakban ezekkel az értékekkel számolunk.

Egy üdülőövezet vendégeinek száma:
efőtlgyt*lgyt2yty-yt(y-yt)2
1992136-52,133539-10,667725119,7789-16,2211263,1228
1993152-42,181844-8,7273716134,9909-17,0091289,3107
1994157-32,1959-6,58779152,1347-4,8652923,67109
1995166-22,220108-4,440224171,45585,45581329,76589
1996183-12,262451-2,262451193,230710,2307104,6672
199718802,27415800217,77129,771886,3124
199818512,2671722,2671721245,427960,427923651,533
199922522,3521834,7043654276,597351,597262662,277
200034132,5327547,5982639311,7251-29,2749857,0189
200144042,64345310,5738116351,3142-88,68587865,17
200245052,65321313,2660625395,9311-54,06892923,445
2623025,716775,72423811019556,3
238,454502,337888

B 0 = Y i n = 25,71677 11 =2,338 B 1 = t i * Y i t i 2 = 5,724238 110 =0,052039 β 0 = 10 B 0 = 10 2,338 =217,771 β 1 = 10 B 1 = 10 0,052039 =1,127

s e 2 = ( y i y i ) 2 n = 19556,3 11 =1777,8455 s e =42,16

V e = s e y _ *100= 42,16 238,4545 *100=17,68%

A függvény szerinti létszámok 17,68%-os hibával illeszkednek a tényleges adatokhoz.

11.3. Választás a trendegyenletek közül

Hasonlóan a regresszióanalízishez (III. Modul, 2.3.fejezet) a trendszámításnál is sok esetben nehéz eldönteni, hogyan melyik függvényt használjuk az elemzéshez. A kiválasztáshoz a legkisebb négyzetek módszerét használjuk. Az a függvény illeszkedik a legjobban az idősor adataihoz, amelyiknél ( y i y i ) 2 a legkisebb.

11.4. Extrapoláció

A trendegyenlet meghatározásával előrejelzést (extrepoláció) végezhetünk. Fontos, hogy előrejelzést csak abban az esetben végezhetünk, ha:

  • Kellően hosszú idősorból határoztuk meg a trendegyenletet.
  • Illetve, ha várhatóan nem következik be olyan változás, amely a vizsgált jelenséget nagymértékben megváltoztatja.
Önellenőrző feladatok

Jelölje be a helyes állítást!

1/a. Trendszámításról beszélünk, ha...
az idősor adataira valamilyen függvényt illesztünk.
ha a vizsgált jelenség tartós irányzatát az idő függvényében valamilyen regressziós függvénnyel határozzuk meg.
1/b. Ha az adatokra az egyenletes változás jellemző, akkor
lineáris trenddel határozzuk meg az alapirányzat értékeit.
exponenciális trenddel határozzuk meg az alapirányzat értékeit.
1/c. A β 1 paraméter lineáris trend esetében...
az időegységenkénti átlagos abszolút változás mértéke.
az időegységenkénti relatív változást mutatja.
vizsgált idősor adatainak számtani átlaga.
1/d. Ha az adatokra időegységenkénti relatív változás jellemző, akkor...
lineáris trenddel határozzuk meg az alapirányzat értékeit.
exponenciális trenddel határozzuk meg az alapirányzat értékeit.
1/e. A β 1 paraméter az exponenciális trend esetében...
az időegységenkénti relatív változást mutatja.
az időegységenkénti átlagos abszolút változás mértéke.
vizsgált idősor adatainak számtani átlaga.
1/f. Extrtapolációt végezhetünk...
bármilyen hosszúságú idősorból meghatározott trendegyenlet esetében.
ha kellően hosszú idősorból határoztuk meg a trendegyenletet
2. Egy áruház forgalmának éves alakulása (millió Ft) a következő trendfüggvénnyel írható le: y t =20* 1,2 t , (t=1,2,3..,n). Válassza ki a helyes megállapítást!
A forgalom évente átlagosan 1,2%kal nő.
A forgalom évente átlagosan 20%kal emelkedik.
A forgalom évente átlagosan 20 millió Ft-tal nő.
A forgalom évente átlagosan 1,2 millió Ft-tal emelkedik.

3. A gabonatermesztés alakulása Magyarországon (millió tonna) 1994-2002 között

évTermés mennyisége (millió tonna)
199411,7
199511,3
199611,3
199714,1
199813,0
199911,4
200010,0
200115,0
200211,7
3/a. Határozza meg a lineáris trendfüggvény paramétereit! Írja be a mezőkbe a megfelelő értékeket 3 tizedesjegy pontossággal! (t=1,2,3,...n)

A β 0 -paraméter értéke:
A β 1 -paraméter értéke:

3/b. Határozza meg a reziduális szórást és a trend becslés relatív hibáját! Írja be a mezőkbe a megfelelő értékeket 3 tizedesjegy pontossággal!

A reziduális szórás értéke: millió tonna
A trendbecslés relatív hibája: %

3/c. Határozza meg az exponenciális trendfüggvény paramétereit! Írja be a mezőkbe a megfelelő értékeket 3 tizedesjegy pontossággal! (t=1,2,3,...n)

A β 0 -paraméter értéke:
A β 1 -paraméter értéke:

3/d. Határozza meg a reziduális szórást és a trend becslés relatív hibáját! Írja be a mezőkbe a megfelelő értékeket 3 tizedesjegy pontossággal!

A reziduális szórás értéke: millió tonna
A trendbecslés relatív hibája: %

3/e. Jelölje meg, melyik trendfüggvény illeszkedik jobban az adatokra!
Lineáris trendfüggvény
exponenciális trendfüggvény

4. Egy egész évben nyitva tartó fagylaltárus negyedéves forgalmának alakulása

ÉvForgalom (ezer gombóc)
I.II.III.IV.
negyedév
200395152255118
2004102146248124
200597156245122
4/a Határozza meg a lineáris trendfüggvény paramétereit! Írja be a mezőkbe a megfelelő értékeket: a β 0 -paraméterét egész számban, β 1 -paraméterét a 3 tizedesjegy pontossággal! ( Σt=0)

A β 0 -paraméter értéke:
A β 1 -paraméter értéke:

5. Egy áruház lineáris trend szerinti árbevétele 2000-ben 1440 millió Ft. A trend az 1993 és 2000 közötti időszakot jellemzi. Az árbevételnek a trend alapján 1992-re becsült értéke 1120 millió Ft.

5/a. Határozza meg a lineáris trendfüggvény paramétereit! Írja be a mezőkbe a megfelelő értékeket egész számra kerekítve! (t=1, 2, 3, ..n)

A β 0 -paraméter értéke:
A β 1 -paraméter értéke:

5/b. Határozza meg a lineáris trendfüggvény paramétereit! Írja be a mezőkbe a megfelelő értékeket egész számra kerekítve! ( Σt=0)

A β 0 -paraméter értéke:
A β 1 -paraméter értéke: