Zadání diplomové práce
Online trénování hlubokých neuronových sítí pro klasifikaci
Online trénování označuje trénování modelů strojového učení
když jsou jejich trénovací data online aktualizována. V takových situacích
pravděpodobnostní rozdělení trénovacích dat typicky bývá
nestacionární a vyvíjí se. Online trénování se používá s oběma
hlavními typy strojového učení s učitelem – klasifikací a
regresí, stejně tak jako v kontextu učení bez učitele.
Kvůli online aktualizaci a vývoji trénovacích dat se online učení
musí vypořádávat s několika specifickými problémy, jako
např. s možností posunu pojmů, s vlivem časového
horizontu, s možností zapomínání a s vlivem jeho rychlosti.
V tomto desetiletí jsou pravděpodobně nejpopulárnějším
a nejrychleji se rozvíjejícím druhem modelů strojového učení hluboké
neuronové sítě. Pro ně je však výzkum zabývající se online
učením, zvláště pak online učením s učitelem, a výše
zmíněnými problémy teprve v začátcích. To činí navržené
téma velmi aktuálním, zvláště v oblastech, které poskytují vyvíjející
se data ve velkých množstvích potřebných pro hluboké učení, jako je
analýza obsahu webu, detekce proniknutí do sítě či detekce malware.
Poslední zmíněná oblast je zamýšlenou oblastí aplikace navrženého výzkumu.
Online training of deep neural networks for
classification
Online training refers to the training of machine learning models when
their training data is online updated. In such situations, the probability
distribution of the training data is typically non-stationary and evolving.
Online training has been used with both main kinds of supervised machine
learning – classifiecation and regression, as well as in the context of
unsuperviesed learning. Due to online updating and evolution of training data,
online training has to tackle several specific problems, such as the
possibility of concept shift, the influence of time horizon, the possibilty of
forgetting and the influence of its speed.
In this decade, deep neural networks are the
probably most popular and most quickly developing kind of machine learning
models. For them, however, research into online learning, especially supervised
online learning, and into dealing with the above mentioned problems, is only
starting. This makes the proposed topic very timely, particularly in areas
providing evolving data in large amounts needed for deep learning, such as web
content analysis, network intrusion detection, or malware detection. The last
mentioned area is the intended application domain of the proposed research.
Doporučená
literatura
·
R.
Calandra, T. Raiko, M.P. Deisenroth, F.M. Pouzols. Learning Deep Belief
Networks from Non-stationary Streams, ICANN
2012, 379–386.
·
G.
Chen, R. Xu, S.H. Srihari. Sequential Labeling with Online Deep Learning.
arXiv: 1612.01072v1, 2016.
·
Y.
Fu, J.L. Zhou, Y. Wu. Online Reactive Anomaly Detection over Stream Data. ICACIA 2008, 291–294.
·
K.
Kurach, K. Pawlowski. Detecting Hazardous Events from Sequential Data with
Multilayer Architectures. CEUR Workshop
Proceedings 1492, 1–10.
·
H.
Wandabwa, M.A. Naeem, F. Mirza. Document Level Semantic Comprehension of Noisy
Text Streams via Convolutional Neural Networks. IEEE 21st IC CSCW in Design, 2017, 475–479.