Duomenų vizualizavimas (Pavasario semestre)

Tvarkaraštis

  • Paskaitos: Penktadieniais (2 sav., VU studijų kalendorius) 14:00-16:00 308 (MIF Didl.).
  • Laboratoriniai darbai: Penktadieniais 14:00-17:00 308 (MIF Didl.).

Laboratoriniai darbai

  • Pirmoji užduotis: Pasirinkite daugiamačių duomenų rinkinį - iš magistro tyrimų, darbo, pomėgių ar Interneto (pvz. UCI Machine Learning Repository). Aprašykite duomenų rinkinį: prasmė, objektų ir parametrų skaičius bei savybės.
  • Antroji užduotis: Vizualizuokite skaitinius daugiamačių duomenų parametrus tiesioginio vizualizavimo metodais. Galima naudoti Matlab (Statistical Toolbox), Orange, Visulab, Xmdv, Pandas ar kitas programas.
  • Trečioji užduotis: Atlikite pagrindinių komponenčių analizę daugiamačiams duomenims. Nustatykite, kokia procentinė dalis nuo visos dispersijos tenka kiekvienai komponentei, kiek tenka dviem pagrindinėm. Vizualizuokite dvi pagrindines komponentes. Galima naudoti Orange, Matlab, octave ar kitas programas.
  • Ketvirtoji užduotis: Vizualizuokite daugiamačius duomenis pasirinktu daugiamačių skalių algoritmu. Ištirkite, kaip keičiasi vaizdai pasirinkus skirtingą pradinį sprendinį. Galima naudoti Orange, Matlab (drtoolbox, Sammon), SMACOF, Smooth 4.0 ar kitas programas bei algoritmus.

Literatūra

  • G. Dzemyda, O. Kurasova, J. Žilinskas (2008) Daugiamačių duomenų vizualizavimo metodai. Matematikos ir informatikos institutas. ISBN 978-9986-680-42-0. PDF versija, VU bibliotekoje.