Jedním z důsledků růstu výkonnosti počítačů i kvality jejich periferií je
neustálý růst významu vizualizace při analýze dat. Vizualizace umožňuje
zprostředkovat větší množství informací současně, a to intuitivním způsobem
nevyžadujícím porozuměmí abstraktním konceptům. Většinou je však vizualizace
dat pouze přípravnou fází pro modelování zákonitostí, kterými se data řídí, a
procesů, které je generovaly. V případě dat, které jsou hodnotami
spojitých proměnných, se k tomu obvykle používají regresní modely. Přitom
i tyto modely lze vizualizovat, metodami vizualizace spojitých funkcí, které
mají podstatně delší tradici než metody vizualizace dat. Dosud však nebyly
studovány vztahy mezi metodami používanými pro vizualizaci dat a metodami
používanými pro vizualizaci z nich zkonstruovaných regresních modelů, přestože
právě tyto vztahy ovlivňují to, zda obě vizualizace působí synergisticky nebo
zda se naopak při zprostředkování informací navzájem oslabují. Navržená
diplomová práce by měla být pokusem o takovou studii.
Student se nejdříve seznámí s metodami vizualizace dat, zejména s metodami vizualizace mnohorozměrných dat. Současně se také seznámí s hlavními regresními metodami a s metodami vizualizace regresních modelů. Na základě studia obou těchto oblastí navrhne několik strategií kombinování metod vizualizace dat a použitých regresních metod, včetně metod vizualizace získaného regresního modelu. Navržené strategie rozpracuje do podoby implementovatelných algoritmů, implementuje je ve vývojovém prostředí Matlab a otestuje na souborech reálných dat poskytnutých vedoucím práce.
· R.D. Cook, S. Weisberg. An Itroduction to Regression Graphics. Wiley, 1994.
· M.C. Minnotte, S.R. Sain, D.W. Scott. Multivariate visualization by density estimation. In Handbook of Data Visualization. Springer, 2008, 389–413.
· B. Schölkopf, A. Smola. Learning with Kernels, kapitoly 1–6, 9, 10. MIT Press, 2002.
· M. Theus. High-dimensional data visulaization. In Handbook of Data Visualization. Springer, 2008, 151–178.