2017-02
2017-02-28 12:10
Tarpinis atsiskaitymas (bent 1-2 užduoties dalys): 03.10 ir 03.24
Galutinis atsiskaitymas: 05.12 ir 05.26.
Pavyzdžių nagrinėjimas:
04.07 – ARMA modelio eilės parinkimas, trendo vertinimas, stacionarumo testai, likučių testai
04.28 – modelio kryžminė patikra
2017-02-28 11:56
Nauja informacija pateikiama ir pavyzdžiai bus nagrinėjimi tokiomis datomis:
03.10 – 2 užd.
03.17 – 2 užd.
04.07 – 3 užd.
05.05 – 4 užd.
Likę užsiėmimai bus skirti atsiskaitymams ir konsultacijoms.
2017-02-09 21:32
Užsiėmimų metu reikės atsiskaityti 4 lygiavertes užduotis iš šių temų:
- Duomenų nuskaitymas ir tvarkymas
- Duomenų pradinė analizė
- Duomenų grafinis vaizdavimas
- Hipotezių tikrinimas
Kiekviena užduotis yra verta 1 taško, surinkus 4 taškus, bus 2 balai prie galutinio įvertinimo (surinkus mažiau, bus proporcingai).
Užduotis bus galima atsiskaityti tik iš eilės. Per vieną užsiėmimą galima (mėginti) atsiskaityti tik vieną užduotį.
Savo užduotis studentai turės atlikti su savo duomenimis. Duomenis imti iš Eurostato. Eurostato duomenų bazėje yra 9 pagrindinės skiltys:
- 1. General & regional statistics
- 2. Economy & finance
- ….
- 9. Science & technology
Kiekvienam studentui reikia rinktis iš tam tikros skilties, kuri skaičiuojama pagal formulę SPN2 mod 9 (čia SPN2 – studento pažymėjimo numerio 2 paskutiniai skaitmenys). Jei gaunamas 0, reiktų rinktis 9 kategoriją. Duomenis reiktų man persiųsti el. paštu, ir po to, atsižvelgdama į duomenų struktūrą, suformuosiu ir atsiųsiu individualias užduotis.
Pagrindinė literatūra:
- Lapinskas. Įvadas į statistiką su R. 2007.
- Lapinskas. Pats trumpiausias taikomosios statistikos kursas su R. 2010
- Trumpas R sakinių(komandų) sąrašas.
- Kurso puslapis Ututi tinkle.
2017-02-08 18:30
Užduoties tikslas – ištirti turimą laiko eilutę ir sukonstruoti adekvatų modelį jai prognozuoti.
Kiekvienas studentas (ar dviejų studentų grupė) turi pasirinkti duomenis taip, kad pasirinktų rodiklių rūšys nesikartotų.
Siūlomos rodiklių rūšys/sritys:
- Makroekonominiai rodikliai (produkcija, investicijos, …)
- Kainos (naftos, elektros, nekilnojamojo turto, …)
- Darbo rodikliai (nedarbo lygis, vidutinis darbo užmokestis, …)
- Labai sezoniški, pvz.: turizmo, duomenys
- Transporto duomenys (pvz.: keleivių/krovinių pervežimas, transporto priemonių, eismo įvykių statistika, …)
- Duomenys apie gamtą/aplinkosaugą (oro tarša, saulės dėmės, geizerių aktyvumas, …)
- Mikroekonominiai duomenys (vienos įmonės pardavimų apimtys, įmonių pelningumas, …)
- Kokio nors produkto ar produktų grupės pardavimų duomenys
- Sociologiniai/gyventojų duomenys (migracija, nusikaltimų skaičiai, …)
- Finansiniai duomenys (pvz.: palūkanų normos, investavimo fondų statistika, …)
- Elektros suvartojimas
- Ryšių duomenys (skambučiai, duomenų srautai/pralaidumas, vartotojų prisijungimai, …)
- Fiskaliniai duomenys (biudžetų dydžiai, mokesčių statistika, …)
- Sveikatos apsaugos duomenys (lovadienių skaičius, skiepų statistika, alkoholio vartojimas, …)
- Žemės ūkio statistika (bendra ž.ū. produkcija, konkrečių kultūrų derlius, pasėlių plotas, …)
- Statybų statistika (pastatytų butų plotas, statybos darbų apimtys, …)
Užduotis:
Susiraskite laiko eilutę, kuri apimtų bent 10 metų laikotarpį. Duomenys turi būti ketvirtiniai arba didesnio dažnio (jei duomenys itin didelio dažnio, apimamas laikotarpis gali būti ir mažesnis).
- Pavaizduokite duomenis grafiškai. Apibūdinkite, kokie duomenys vaizduojami (dažnis, apimamas laikotarpis).
- Kokie veiksniai galėtų daryti poveikį tiriamam rodikliui? Kokie rodikliai galėtų atspindėti šiuos veiksnius? Suraskite keletą tokių rodiklių.
- Ištirkite šios eilutės sezoniškumą, stacionarumą. Ar šiai laiko eilutei reikalingos kokios nors transformacijos, palengvinančios modelio sudarymą?
- Sudarykite tiesinės regresijos modelį, įtraukdami papildomus duomenis (rodikliai iš (2) dalies). Ar modelis turi struktūrinių lūžių?
- Ištirkite modelio likučius. Ar likučiai sudaro baltąjį triukšmą? Jei ne, pakoreguokite modelį, parinkdami likučiams ARMA(p,q) modelį, ir pervertinkite regresiją iš naujo su ARMA paklaidomis. Pakartotinai atlikite likučių analizę.
- Patikrinkite savo modelį kryžminės patikros būdu, suskaičiuokite prognozės tikslumą kokiu nors kriterijumi (MAPE, MAE, RMSE). Palyginkite savo modelio tikslumą su modelio, gauto auto.arima() funkcija.