-
Do razdvoumljanja besednih pomenov v slovenščini s prenosom znanja [Elektronski vir] = Towards Slovene word sense disambiguation through transfer learning : magistrsko deloFijavž, ZoranRazdvoumljanje besednih pomenov na področju računalniškega jezikoslovja določa, kateri od možnih pomenov besede je uporabljen v besedilu. Uporabno je za informacijsko poizvedovanje, strojno ... prevajanje, rudarjenje besedil in računalniško leksikografijo. Razdvoumljanje besednih pomenov ostaja odprto raziskovalno vprašanje kljub nedavnim izboljšavam zaradi splošnega napredka področij obdelave naravnega jezika in umetne inteligence. Razvoj modelov za razdvoumljanje v slovenščini je do nedavnega omejevalo pomanjkanje obsežnejših pomensko označenih podatkovnih zbirk. To je spremenila nova slovenska podatkovna množica in večjezikovni modeli, ki omogočajo učenje z medjezikovnim prenosom. Delo zajema interdisciplinarni pregled pomenskega razdvoumljanja in razvoj modela za razdvoumljanje v slovenščini. Pregled izpostavi konceptualne razlike v razumevanju večpomenskosti in razdvoumljanja med različnimi disciplinami. V primerjavi s standardnimi postopki in podatkovnimi množicami na področju obdelave naravnega jezika psiholingvistika nudi bogatejšo in preciznejšo tipologijo večpomenskosti, jezikovna pragmatika pa prevprašuje predpostavko, da je razdvoumljanje primarno semantični proces. Učno nalogo za razvoj napovednega modela za razdvoumljanje smo zastavili kot napoved ujemanja stavčnih parov z isto- ali raznopomensko oznako za tarčno lemo. Na podlagi pomensko označenih slovenskih in angleških množic smo zgradili sedem učnih množic, ki so se razlikovale po velikosti (številu vključenih primerov na besedni pomen) in po vključenih jezikih; za vsako učno množico smo prilagodili večjezikovni transformerski model CroSloEngual BERT. Najvišjo testno oceno F1 je dosegel model z uporabo združene angleško-slovenske učne množice (81,6). Alternativno testiranje je pokazalo, da je imela klasifikacijska arhitektura pomembno vlogo pri uspehu modela, saj so drugi modeli za napovedi neposredno iz transformerskih plasti dosegli višje ali primerljive rezultate. Dodatno testiranje na besedišču izven učne množice je pokazalo negativno povezanost med številom vključenih učnih primerov in uspehom napovedi ujemanja na novem besedišču, ocenjenim z Matthewsovim koeficientom korelacije. To je veljalo za vse modele, pri čemer je le model z večjezikovnimi učnimi podatki dobil visoko oceno F1 na testni množici in hkrati visok koeficient korelacije na izvenbesediščni množici.Type of material - master's thesis ; adult, seriousPublication and manufacture - Ljubljana : [Z. Fijavž], 2023Language - slovenianCOBISS.SI-ID - 162459139
Author
Fijavž, Zoran
Other authors
Robnik Šikonja, Marko
Topics
Kognitivna znanost |
Univerzitetna in visokošolska dela |
razdvoumljanje besednih pomenov |
procesiranje naravnega jezika |
polisemija |
psiholingvistika |
pragmatika |
veliki jezikovni modeli |
medjezikovni prenos |
word sense disambiguation |
natural language processing |
polysemy |
psycholinguistics |
pragmatics |
large language models |
cross-lingual transfer
Shelf entry
Permalink
- URL:
Impact factor
Access to the JCR database is permitted only to users from Slovenia. Your current IP address is not on the list of IP addresses with access permission, and authentication with the relevant AAI accout is required.
Year | Impact factor | Edition | Category | Classification | ||||
---|---|---|---|---|---|---|---|---|
JCR | SNIP | JCR | SNIP | JCR | SNIP | JCR | SNIP |
Select the library membership card:
DRS, in which the journal is indexed
Database name | Field | Year |
---|
Links to authors' personal bibliographies | Links to information on researchers in the SICRIS system |
---|---|
Fijavž, Zoran | |
Robnik Šikonja, Marko | 15295 |
Select pickup location:
Material pickup by post
Notification
Subject headings in COBISS General List of Subject Headings
Select pickup location
Pickup location | Material status | Reservation |
---|
Please wait a moment.