Ontologie jsou grafové, nejčastěji stromové
reprezentace konceptů a vztahů mezi nimi v konkrétních předmětných
oblastech. Nejrozsáhlejší a nejdéle používané jsou odborné ontologie
z různých oblastí přírodních věd. Ontologie umožňují formální analýzu
sémantiky uvažované předmětné oblasti a usnadňují práci s daty z této
oblasti. Vytváření ontologie se neobejde bez účasti odborníků z její
předmětné oblasti. Každý odborník se však při svých úvahách omezuje jen na
nějakou podmnožinu konceptů a vztahů, takže při vytváření rozsáhlé ontologie
jich musí spolupracovat velký počet. Shromáždění dostatečně velkého týmu
odborníků a vytvoření ontologie tímto týmem je však časově náročné a také
nákladné. Proto se zejména rozsáhlé ontologie stále častěji vytvářejí
poloautomaticky pomocí extrakce z odborné literatury, přičemž odborník
z předmětné oblasti pouze kontroluje smysluplnost vytvořené ontologie. A
právě při tomto přístupu se s úspěchem používají umělé neuronové sítě, což
bude náplní navrhované diplomové práce. Neuronové sítě se v ní budou
používat obdobně jako při zpracování textů v přirozeném jazyce, např. pro
rozpoznávání pojmenovaných entit nebo pro transformaci posloupnosti slov
přirozeného jazyka do posloupnosti konceptů, podobné transformacím sekvenci
používaným při strojovém překladu.
Doporučená
literatura
· M.R. Boguslav, N.D. Hailu, M. Bada,
W.A. Baumgartner Jr., L.E. Hunter. Concept Recognition as a Machine Translation Problem,
bioRxiv, 2020.
· A.C. Khadir, A. Guessoum, A.
Hassina. Ontological Relation Classification Using WordNet, Word Embeddings and
Deep Neural Networks. International Symposium on Modelling and Implementation
of Complex Systems, 136-148.
· G. Petrucci, M. Rospocher, C.
Ghidini. Expressive ontology learning as neural machine translation. Web
Semantics: Science, Services and Agents on the World Wide Web, 52-53: 66-82,
2021.
· D. Xu,S. Bethard. Triplet-Trained
Vector Space and Sieve-Based Search Improve Biomedical Concept Normalization,
BioNLP workshop 2021, 11-22.
· X. Zheng, B. Wing, Y. Zhao, S. Mao,
Y. Tang. Web Semantics: Science, Neurocomputing, 430: 104-111, 2021.