Laiko eilučių laboratorinių darbų užduotis

2017-02-08 18:30

Užduoties tikslas – ištirti turimą laiko eilutę ir sukonstruoti adekvatų modelį jai prognozuoti.

Kiekvienas studentas (ar dviejų studentų grupė) turi pasirinkti duomenis taip, kad pasirinktų rodiklių rūšys nesikartotų.

Siūlomos rodiklių rūšys/sritys:

  1. Makroekonominiai rodikliai (produkcija, investicijos, …)
  2. Kainos (naftos, elektros, nekilnojamojo turto, …)
  3. Darbo rodikliai (nedarbo lygis, vidutinis darbo užmokestis, …)
  4. Labai sezoniški, pvz.: turizmo, duomenys
  5. Transporto duomenys (pvz.: keleivių/krovinių pervežimas, transporto priemonių, eismo įvykių statistika, …)
  6. Duomenys apie gamtą/aplinkosaugą (oro tarša, saulės dėmės, geizerių aktyvumas, …)
  7. Mikroekonominiai duomenys (vienos įmonės pardavimų apimtys, įmonių pelningumas, …)
  8. Kokio nors produkto ar produktų grupės pardavimų duomenys
  9. Sociologiniai/gyventojų duomenys (migracija, nusikaltimų skaičiai, …)
  10. Finansiniai duomenys (pvz.: palūkanų normos, investavimo fondų statistika, …)
  11. Elektros suvartojimas
  12. Ryšių duomenys (skambučiai, duomenų srautai/pralaidumas, vartotojų prisijungimai, …)
  13. Fiskaliniai duomenys (biudžetų dydžiai, mokesčių statistika, …)
  14. Sveikatos apsaugos duomenys (lovadienių skaičius, skiepų statistika, alkoholio vartojimas, …)
  15. Žemės ūkio statistika (bendra ž.ū. produkcija, konkrečių kultūrų derlius, pasėlių plotas, …)
  16. Statybų statistika (pastatytų butų plotas, statybos darbų apimtys, …)

 Užduotis:

Susiraskite laiko eilutę, kuri apimtų bent 10 metų laikotarpį. Duomenys turi būti ketvirtiniai arba didesnio dažnio (jei duomenys itin didelio dažnio, apimamas laikotarpis gali būti ir mažesnis).

  1. Pavaizduokite duomenis grafiškai. Apibūdinkite, kokie duomenys vaizduojami (dažnis, apimamas laikotarpis).
  2. Kokie veiksniai galėtų daryti poveikį tiriamam rodikliui? Kokie rodikliai galėtų atspindėti šiuos veiksnius? Suraskite keletą tokių rodiklių.
  3. Ištirkite šios eilutės sezoniškumą, stacionarumą. Ar šiai laiko eilutei reikalingos kokios nors transformacijos, palengvinančios modelio sudarymą?
  4. Sudarykite tiesinės regresijos modelį, įtraukdami papildomus duomenis (rodikliai iš (2) dalies). Ar modelis turi struktūrinių lūžių?
  5. Ištirkite modelio likučius. Ar likučiai sudaro baltąjį triukšmą? Jei ne, pakoreguokite modelį, parinkdami likučiams ARMA(p,q) modelį, ir pervertinkite regresiją iš naujo su ARMA paklaidomis. Pakartotinai atlikite likučių analizę.
  6. Patikrinkite savo modelį kryžminės patikros būdu, suskaičiuokite prognozės tikslumą kokiu nors kriterijumi (MAPE, MAE, RMSE). Palyginkite savo modelio tikslumą su modelio, gauto auto.arima() funkcija.