2017-02-09 21:32
Užsiėmimų metu reikės atsiskaityti 4 lygiavertes užduotis iš šių temų:
- Duomenų nuskaitymas ir tvarkymas
- Duomenų pradinė analizė
- Duomenų grafinis vaizdavimas
- Hipotezių tikrinimas
Kiekviena užduotis yra verta 1 taško, surinkus 4 taškus, bus 2 balai prie galutinio įvertinimo (surinkus mažiau, bus proporcingai).
Užduotis bus galima atsiskaityti tik iš eilės. Per vieną užsiėmimą galima (mėginti) atsiskaityti tik vieną užduotį.
Savo užduotis studentai turės atlikti su savo duomenimis. Duomenis imti iš Eurostato. Eurostato duomenų bazėje yra 9 pagrindinės skiltys:
- 1. General & regional statistics
- 2. Economy & finance
- ….
- 9. Science & technology
Kiekvienam studentui reikia rinktis iš tam tikros skilties, kuri skaičiuojama pagal formulę SPN2 mod 9 (čia SPN2 – studento pažymėjimo numerio 2 paskutiniai skaitmenys). Jei gaunamas 0, reiktų rinktis 9 kategoriją. Duomenis reiktų man persiųsti el. paštu, ir po to, atsižvelgdama į duomenų struktūrą, suformuosiu ir atsiųsiu individualias užduotis.
Pagrindinė literatūra:
- Lapinskas. Įvadas į statistiką su R. 2007.
- Lapinskas. Pats trumpiausias taikomosios statistikos kursas su R. 2010
- Trumpas R sakinių(komandų) sąrašas.
- Kurso puslapis Ututi tinkle.
2017-02-08 18:30
Užduoties tikslas – ištirti turimą laiko eilutę ir sukonstruoti adekvatų modelį jai prognozuoti.
Kiekvienas studentas (ar dviejų studentų grupė) turi pasirinkti duomenis taip, kad pasirinktų rodiklių rūšys nesikartotų.
Siūlomos rodiklių rūšys/sritys:
- Makroekonominiai rodikliai (produkcija, investicijos, …)
- Kainos (naftos, elektros, nekilnojamojo turto, …)
- Darbo rodikliai (nedarbo lygis, vidutinis darbo užmokestis, …)
- Labai sezoniški, pvz.: turizmo, duomenys
- Transporto duomenys (pvz.: keleivių/krovinių pervežimas, transporto priemonių, eismo įvykių statistika, …)
- Duomenys apie gamtą/aplinkosaugą (oro tarša, saulės dėmės, geizerių aktyvumas, …)
- Mikroekonominiai duomenys (vienos įmonės pardavimų apimtys, įmonių pelningumas, …)
- Kokio nors produkto ar produktų grupės pardavimų duomenys
- Sociologiniai/gyventojų duomenys (migracija, nusikaltimų skaičiai, …)
- Finansiniai duomenys (pvz.: palūkanų normos, investavimo fondų statistika, …)
- Elektros suvartojimas
- Ryšių duomenys (skambučiai, duomenų srautai/pralaidumas, vartotojų prisijungimai, …)
- Fiskaliniai duomenys (biudžetų dydžiai, mokesčių statistika, …)
- Sveikatos apsaugos duomenys (lovadienių skaičius, skiepų statistika, alkoholio vartojimas, …)
- Žemės ūkio statistika (bendra ž.ū. produkcija, konkrečių kultūrų derlius, pasėlių plotas, …)
- Statybų statistika (pastatytų butų plotas, statybos darbų apimtys, …)
Užduotis:
Susiraskite laiko eilutę, kuri apimtų bent 10 metų laikotarpį. Duomenys turi būti ketvirtiniai arba didesnio dažnio (jei duomenys itin didelio dažnio, apimamas laikotarpis gali būti ir mažesnis).
- Pavaizduokite duomenis grafiškai. Apibūdinkite, kokie duomenys vaizduojami (dažnis, apimamas laikotarpis).
- Kokie veiksniai galėtų daryti poveikį tiriamam rodikliui? Kokie rodikliai galėtų atspindėti šiuos veiksnius? Suraskite keletą tokių rodiklių.
- Ištirkite šios eilutės sezoniškumą, stacionarumą. Ar šiai laiko eilutei reikalingos kokios nors transformacijos, palengvinančios modelio sudarymą?
- Sudarykite tiesinės regresijos modelį, įtraukdami papildomus duomenis (rodikliai iš (2) dalies). Ar modelis turi struktūrinių lūžių?
- Ištirkite modelio likučius. Ar likučiai sudaro baltąjį triukšmą? Jei ne, pakoreguokite modelį, parinkdami likučiams ARMA(p,q) modelį, ir pervertinkite regresiją iš naujo su ARMA paklaidomis. Pakartotinai atlikite likučių analizę.
- Patikrinkite savo modelį kryžminės patikros būdu, suskaičiuokite prognozės tikslumą kokiu nors kriterijumi (MAPE, MAE, RMSE). Palyginkite savo modelio tikslumą su modelio, gauto auto.arima() funkcija.
2016-11-07 15:52
2 užduotis:
Pasirinkite finansinę laiko eilutę (akcijų ar obligacijų kainos, metalų, žaliavų kainos, valiutų kursai, išvestiniai indeksai). Duomenys turėtų būti dieniniai ir apimti bent 3 metų laikotarpį.
- Nubrėžkite ir apibūdinkite duomenis. Susikonstruokite dienines grąžas. Patikrinkite, ar gauta eilutė turi nulinį vidurkį, ar jos dispersija yra pastovi. (1 tšk.)
- Pademonstruokite, kad jūsų turimai grąžų eilutei būdingi bent 3 stilizuoti faktai (3 tšk.)
- Parinkite tiriamai eilutei ARMA-ARCH/GARCH modelį. (2 tšk.)
- Patikrinkite, ar jūsų modelis gerai vertina riziką:
- Atsitiktinai parinktam 1 metų laikotarpiui įvertinkite ARMA-ARCH/GARCH modelį (specifikaciją imkite iš 3 dalies)
- Padarykite 1 žingsnio prognozę ir suskaičiuokite sekančios dienos 95% ir 99% VaR, t.y. 0,05 ir 0,01 kvantilius.
- Pakartokite i-ii žingsnius 1000 kartų ir suskaičiuokite, kelis kartus tikroji grąža buvo mažesnė nei suprognozuotos 95% ir 99% VaR reikšmės.
Apibendrinkite, ar jūsų modelis tinkamai įvertino riziką. (4 tšk.)
2016-10-17 09:54
Tiriant modelį dėl struktūrinių lužių, patogiausia yra naudoti funkcijas iš R paketo strucchange
Pirma reikia sudaryti modelį, o paskui jam pritaikyti testą (pvz.: efp(), sctest()).
Apie kryžminę patikrą galima glaustai paskaityti čia
2016-09-06 09:38
Pasirinkite (geriausia ekonominę) laiko eilutę, kuri apimtų bent 10 metų laikotarpį.
- Pavaizduokite duomenis grafiškai. Apibūdinkite, kokie duomenys vaizduojami (dažnis, apimamas laikotarpis, metodologiniai komentarai).
- Kokie veiksniai galėtų daryti poveikį tiriamam rodikliui? Kokie rodikliai galėtų atspindėti šiuos veiksnius? Suraskite keletą tokių rodiklių.
- Ištirkite šios eilutės sezoniškumą, stacionarumą. Ar šiai laiko eilutei reikalingos kokios nors transformacijos, palengvinančios modelio sudarymą?
- Sudarykite tiesinės regresijos modelį, įtraukdami papildomus duomenis (rodikliai iš (2) dalies). Ar modelis turi struktūrinių lūžių?
- Ištirkite modelio likučius. Ar likučiai sudaro baltąjį triukšmą? Jei ne, pakoreguokite modelį, parinkdami likučiams ARMA(p,q) modelį, ir pervertinkite regresiją iš naujo su ARMA paklaidomis. Pakartotinai atlikite likučių analizę.
- Patikrinkite savo modelį kryžminės patikros būdu, suskaičiuokite prognozės tikslumą kokiu nors kriterijumi (MAPE, MAE, RMSE). Palyginkite savo modelio tikslumą su modelio, gauto auto.arima() funkcija.
2016-09-06 09:22
Atsiskaitymo tvarka
Semestro eigoje reikės padaryti 2 lygiavertes užduotis. Užduotims reikės paruošti ataskaitas, o vėliau tuos darbus apsiginti paskaitos metu. Rekomenduojama atsiskaitymo metu būti pasiruošus visą darbo aplinką, t.y. sutvarkytus duomenis ir kodą.
Darbus galima daryti poromis.
Ataskaitas atsiųsti iki:
- 1 užduoties – iki 2016-11-01 24:00
- 2 užduoties – iki 2016-12-13 24:00
Ataskaitų gynimas numatomas šiomis datomis laboratorinių užsiėmimų metu:
- 1 užduoties lapkričio 9 d.
- 2 užduoties gruodžio 21 d.
Literatūra
R. Lapinskas. Ekonometrija su kompiuteriu 2. Laikinės sekos. 2008.
R. Leipus. Finansinės laiko eilutės.
R Reference card
2015-10-28 12:22
Jei su funkcija forecast nepavyksta sukonstruoti prognozių arima modeliui, gautam su funkcija arima iš stats paketo, reiktų modelį pervertinti su funkcija Arima (iš forecast paketo) ir tada prognozuoti. Klaida atsiranda dėl to, kad naujesnės forecast paketo versijos nesuderintos su arima funkcija.
2015-10-20 14:47
Tie studentai, kurie antros užduoties ataskaitas atsiųs iki 2015-12-09, turės galimybę atsiskaityti 2015-12-16.
2015-12-23 numatomas atsiskaitymas visiems likusiems studentams.
2015-09-13 13:45
Pirma užduotis
Pasirinkite sezonišką laiko eilutę, kurioje būtų bent 50 stebėjimų (jei ketvirtiniai; jei mėnesiniai – bent 100 stebėjimų).
- Pavaizduokite duomenis grafiškai. Ar tai stacionari laiko eilutė? Jei nestacionari, tai kokio tipo nestacionarumas matomas? Pagrįskite. Koks modelis taikytinas šiai eilutei modeliuoti: multiplikatyvus ar adityvus? Ar reikalingos kokios nors transformacijos? Į kokius komponentus būtų prasminga išskaidyti laiko eilutę?
- Išskirkite trendą ir sezoninę dalį keliais būdais, rezultatus pavaizduokite grafiškai; patikrinkite, ar gerai išskyrėte sezoną (pvz.: su auto.arima funkcija). Palyginkite gautą rezultatą (nepamirškite funkcijoje parinkti tinkamų parametrų), ir išrinktite geriausią variantą ir jį naudokite tolimesnėse užduoties dalyse:
- stl()
- filter()
- decompose()
- HoltWinters()
- diff() (tik trendo pašalinimui)
- Naudodami regresiją (nuo laiko ar kitos laiko eilutės) įvertinkite trendą. Išbrėžkite likučių (t.y. tai, kas lieka atėmus trendo įvertinį ir sezoninę dalį) autokoreliaciją, ir dalinę autokoreliaciją. Ar panašu į baltąjį triukšmą? Parinkite likučiams ARMA(p, q) modelį.
- Sukonstruokite tiriamai nusezonintai laiko eilutei prognozę metams į priekį.
- Patikrinkite savo modelį kryžminės patikros būdu (angl. out of sample), suskaičiuokite prognozės tikslumą kuriuo nors kritetijumi (pvz.: MAPE, MAE, RMSE…), ir pagrįskite, kodėl tokį pasirinkote.
- Atlikite paklaidų analizę.
- Palyginkite savo modelio prognozių tikslumą, su modelio, gauto naudojant funkciją auto.arima(), prognozėmis.
Antra užduotis
Pasirinkite kokią nors finansinę laiko eilutę (duomenys turi būti dieniniai arba savaitiniai), kuri apimtų bent 5 metų laikotarpį.
- Susidarykite grąžų laiko eilutę. Patikrinkite hipotezę, ar grąžų vidurkis lygus nuliui. Patikrinkite, ar pastovi jų dispersija.
- Kokie stilizuoti faktai būdingi jūsų tiriamiems duomenims?
- Sudarykite grąžoms ARMA-ARCH/GARCH modelį.
2015-09-13 13:42
Atsiskaitymo tvarka
Semestro eigoje reikės padaryti 2 lygiavertes užduotis. Užduotims reikės paruošti ataskaitas, o vėliau tuos darbus apsiginti paskaitos metu. Rekomenduojama atsiskaitymo metu būti pasiruošus visą darbo aplinką, t.y. sutvarkytus duomenis ir kodą.
Darbus galima daryti poromis.
Ataskaitas atsiųsti iki:
- 1 užduoties – iki 2015-10-28 24:00
- 2 užduoties – iki 2015-12-16 24:00
Ataskaitų gynimas numatomas šiomis datomis laboratorinių užsiėmimų metu:
- 1 užduoties lapkričio 4 d.
- 2 užduoties gruodžio 23 d.
Literatūra
R. Lapinskas. Ekonometrija su kompiuteriu 2. Laikinės sekos. 2008.
R. Leipus. Finansinės laiko eilutės.
R Reference card