ALL libraries (COBIB.SI union bibliographic/catalogue database)
  • Do razdvoumljanja besednih pomenov v slovenščini s prenosom znanja [Elektronski vir] = Towards Slovene word sense disambiguation through transfer learning : magistrsko delo
    Fijavž, Zoran
    Razdvoumljanje besednih pomenov na področju računalniškega jezikoslovja določa, kateri od možnih pomenov besede je uporabljen v besedilu. Uporabno je za informacijsko poizvedovanje, strojno ... prevajanje, rudarjenje besedil in računalniško leksikografijo. Razdvoumljanje besednih pomenov ostaja odprto raziskovalno vprašanje kljub nedavnim izboljšavam zaradi splošnega napredka področij obdelave naravnega jezika in umetne inteligence. Razvoj modelov za razdvoumljanje v slovenščini je do nedavnega omejevalo pomanjkanje obsežnejših pomensko označenih podatkovnih zbirk. To je spremenila nova slovenska podatkovna množica in večjezikovni modeli, ki omogočajo učenje z medjezikovnim prenosom. Delo zajema interdisciplinarni pregled pomenskega razdvoumljanja in razvoj modela za razdvoumljanje v slovenščini. Pregled izpostavi konceptualne razlike v razumevanju večpomenskosti in razdvoumljanja med različnimi disciplinami. V primerjavi s standardnimi postopki in podatkovnimi množicami na področju obdelave naravnega jezika psiholingvistika nudi bogatejšo in preciznejšo tipologijo večpomenskosti, jezikovna pragmatika pa prevprašuje predpostavko, da je razdvoumljanje primarno semantični proces. Učno nalogo za razvoj napovednega modela za razdvoumljanje smo zastavili kot napoved ujemanja stavčnih parov z isto- ali raznopomensko oznako za tarčno lemo. Na podlagi pomensko označenih slovenskih in angleških množic smo zgradili sedem učnih množic, ki so se razlikovale po velikosti (številu vključenih primerov na besedni pomen) in po vključenih jezikih; za vsako učno množico smo prilagodili večjezikovni transformerski model CroSloEngual BERT. Najvišjo testno oceno F1 je dosegel model z uporabo združene angleško-slovenske učne množice (81,6). Alternativno testiranje je pokazalo, da je imela klasifikacijska arhitektura pomembno vlogo pri uspehu modela, saj so drugi modeli za napovedi neposredno iz transformerskih plasti dosegli višje ali primerljive rezultate. Dodatno testiranje na besedišču izven učne množice je pokazalo negativno povezanost med številom vključenih učnih primerov in uspehom napovedi ujemanja na novem besedišču, ocenjenim z Matthewsovim koeficientom korelacije. To je veljalo za vse modele, pri čemer je le model z večjezikovnimi učnimi podatki dobil visoko oceno F1 na testni množici in hkrati visok koeficient korelacije na izvenbesediščni množici.
    Type of material - master's thesis ; adult, serious
    Publication and manufacture - Ljubljana : [Z. Fijavž], 2023
    Language - slovenian
    COBISS.SI-ID - 162459139