Klasifikační
metody jsou metody třídění empirických dat do konečného počtu tříd pomocí
funkcí z předem vymezených funkčních systémů. Výběr klasifikační funkce
z daného funkčního systému se provádí na základě omezeného počtu dat se
známou příslušností do tříd postupem, který se obecně označuje jako učení a který
může mít rozmanitou podobu, od poměrně triviálních jednokrokových výpočtů až po
velmi složité iterační algoritmy. Protože zpracování empirických dat bylo
původně doménou statistiky, spočívají tradiční klasifikační metody na
statistických principech. Nástup počítačů a neustálý růst jejich výkonu však
vedl ke vzniku a rychlému rozvoji klasifikačních metod založených na principech
strojového učení – např. klasifikace pomocí umělých neuronových sítí, pomocí
klasifikačních stromů, či tzv. SVM klasifikátory (support vector machines),
spočívající na jádrových funkcích. Díky tomu jsme při řešení klasifikačních
problémů často v situaci, že máme k dispozici několik přibližně
stejně přesných klasifikátorů spočívajících na různých principech. V takovém
případě buď stojíme před nelehkou volbou, který z nich použít, nebo
nejdříve provedeme klasifikaci pomocí všech a potom se snažíme získané výsledky
nějak zkombinovat. Druhá z těchto možností může v ideálním případě
případě vést ke spojení předností kombinaovaných klasifikátorů, takže výsledný
klasifikátor je přesnější než kterýkoliv z nich. Metod kombinování
klasifikátorů existuje několik desítek, od prosté volby té klasifikace, kterou
navrhuje nejvíce z nich, až po velmi důmyslné agregační metody založené na
teorii míry. Velmi obecný teoretický rámec agregačních metod představuje fuzzy
matematika. A právě v tomto rámci by se kombinováním klasifikátorů měla
zabývat navrhovaná diplomová práce.
Diplomant se nejdříve v rešeršní práci důkladně seznámí s teoretickými
základy nejdůležitějších moderních
klasifikačních metod i metod fuzzy agregace. Poté se při výzkumném úkolu
seznámí s existujícími implementacemi některých z těchto metod ve
vývojovém prostředí Matlab, a tyto implementace doplní implementací několika
dalších metod, které v prostředí Matlab dosud k dispozici nejsou.
V rámci vlastní diplomové práce pak bude implementovat některé
z fuzzy metod kombinování klasifikátorů a testovat je na řadě mezinárodně
používaných testovacích souborů a souborů dat z reálných aplikací.
·
M. Grabisch, H.T. Nguyen, E.A. Walker. Fundamentals
of Uncertainty Calculi with Applications to Fuzzy Inference. Kluwer,
Boston, 1995.
·
J.M. Keller, P. Gader, H. Tahani, J.H. Chiang, M.
Mohamed. Advances in fuzzy integration for pattern recognition. Fuzzy Sets
and Systems, 65 (1994) 273-283.
·
L.I. Kuncheva, J.C. Bezdek, R.P.W. Duin. Decision
templates for multiple classifier fusion: an experimental comparison. Pattern
Recognition, 34 (2001) 299-314.
·
B.
Schölkopf, A. Smola. Learning with Kernels. MIT Press, Cambridge, 2002,
kapitoly 1–7.