Jedním z důsledků růstu výkonnosti počítačů i kvality jejich periferií je
neustálý růst významu vizualizace při analýze dat. Vizualizace umožňuje
zprostředkovat větší množství informací současně, a to intuitivním způsobem
nevyžadujícím porozuměmí abstraktním konceptům. To je zvláště přínosné
v případě mnohodimenzionálních dat, a právě pro ně se vizualizační metody
nejvíce rozvíjejí. Většinou je však vizualizace dat pouze přípravnou fází pro
modelování zákonitostí, kterými se data řídí, a procesů, které je generovaly.
Jednou z důmyslných metod pro zjišťování takových zákonitostí je analýza
rozptylu. Napojení vizualizace dat na analýzu rozptylu, zvláště pak na její
variantu pro mnohodimenzionální data, tzv. vícecestné třídění, však byla dosud
věnována pouze velmi malá pozornost. Navržená diplomová práce by měla být
pokusem o nápravu tohoto stavu.
Student se nejdříve seznámí s metodami vizualizace dat, zejména s metodami vizualizace mnohodimenzionálních dat. Současně se také seznámí s principy a praktickým prováděním analýzy rozptylu, zejména vícecestného třídění. Na základě studia obou těchto oblastí navrhne několik strategií napojení vícecestného třídění na vizualizaci dat. Navržené strategie rozpracuje do podoby implementovatelných algoritmů, implementuje je ve vývojovém prostředí Matlab a otestuje na souborech reálných dat poskytnutých vedoucím práce.
· R.M. Heiberger, B. Holland. Structured sets of graphs. In Handbook of Data Visualization. Springer, 2008, 415–445.
· A. Inselberg. Parallel coordinates: visualization, exploration and classification of high-dimensional data. In Handbook of Data Visualization. Springer, 2008, 643–680.
· R.M. Mickey. Applied Statistics: Analysis of Varince and Regression. Viley, 2004.
· M. Theus. High-dimensional data visulaization. In Handbook of Data Visualization. Springer, 2008, 151–178.
· H.M. Wu, S.L. Tzeng, C.H. Chen. Matrix Visualization. In Handbook of Data Visualization. Springer, 2008, 681–708.