Do razdvoumljanja besednih pomenov v slovenščini s prenosom znanja; Elektronski vir; Towards Slovene word sense disambiguation through transfer learning : magistrsko delo

ALL libraries (COBIB.SI union bibliographic/catalogue database)

Do razdvoumljanja besednih pomenov v slovenščini s prenosom znanja [Elektronski vir] = Towards Slovene word sense disambiguation through transfer learning : magistrsko delo

Fijavž, Zoran

Razdvoumljanje besednih pomenov na področju računalniškega jezikoslovja določa, kateri od možnih pomenov besede je uporabljen v besedilu. Uporabno je za informacijsko poizvedovanje, strojno ... prevajanje, rudarjenje besedil in računalniško leksikografijo. Razdvoumljanje besednih pomenov ostaja odprto raziskovalno vprašanje kljub nedavnim izboljšavam zaradi splošnega napredka področij obdelave naravnega jezika in umetne inteligence. Razvoj modelov za razdvoumljanje v slovenščini je do nedavnega omejevalo pomanjkanje obsežnejših pomensko označenih podatkovnih zbirk. To je spremenila nova slovenska podatkovna množica in večjezikovni modeli, ki omogočajo učenje z medjezikovnim prenosom. Delo zajema interdisciplinarni pregled pomenskega razdvoumljanja in razvoj modela za razdvoumljanje v slovenščini. Pregled izpostavi konceptualne razlike v razumevanju večpomenskosti in razdvoumljanja med različnimi disciplinami. V primerjavi s standardnimi postopki in podatkovnimi množicami na področju obdelave naravnega jezika psiholingvistika nudi bogatejšo in preciznejšo tipologijo večpomenskosti, jezikovna pragmatika pa prevprašuje predpostavko, da je razdvoumljanje primarno semantični proces. Učno nalogo za razvoj napovednega modela za razdvoumljanje smo zastavili kot napoved ujemanja stavčnih parov z isto- ali raznopomensko oznako za tarčno lemo. Na podlagi pomensko označenih slovenskih in angleških množic smo zgradili sedem učnih množic, ki so se razlikovale po velikosti (številu vključenih primerov na besedni pomen) in po vključenih jezikih; za vsako učno množico smo prilagodili večjezikovni transformerski model CroSloEngual BERT. Najvišjo testno oceno F1 je dosegel model z uporabo združene angleško-slovenske učne množice (81,6). Alternativno testiranje je pokazalo, da je imela klasifikacijska arhitektura pomembno vlogo pri uspehu modela, saj so drugi modeli za napovedi neposredno iz transformerskih plasti dosegli višje ali primerljive rezultate. Dodatno testiranje na besedišču izven učne množice je pokazalo negativno povezanost med številom vključenih učnih primerov in uspehom napovedi ujemanja na novem besedišču, ocenjenim z Matthewsovim koeficientom korelacije. To je veljalo za vse modele, pri čemer je le model z večjezikovnimi učnimi podatki dobil visoko oceno F1 na testni množici in hkrati visok koeficient korelacije na izvenbesediščni množici.

Type of material - master's thesis ; adult, serious

Publication and manufacture - Ljubljana : [Z. Fijavž], 2023

Language - slovenian

COBISS.SI-ID - 162459139

Link(s):
Repository of the University of Ljubljana – RUL
DOI

Keep searching

Access to the JCR database is permitted only to users from Slovenia. Your current IP address is not on the list of IP addresses with access permission, and authentication with the relevant AAI accout is required.

Year	Impact factor		Edition		Category		Classification
Year	JCR	SNIP	JCR	SNIP	JCR	SNIP	JCR	SNIP

Links to authors' personal bibliographies	Links to information on researchers in the SICRIS system
Fijavž, Zoran
Robnik Šikonja, Marko	15295

Source: Personal bibliographies and: SICRIS

The material from the parent unit is free. If the material is delivered to the pickup location from another unit, the library may charge you for this service.

Pickup location	Material status	Reservation

Upload image

Shelf entry

Adding material to shelf was successful.

Adding material to shelf failed.

It was not necessary to add the material to the shelf.

Permalink

E-mail

Impact factor

Select the library membership card:

DRS, in which the journal is indexed

Select pickup location:

Material pickup by post

Notification

Citations

Subject headings in COBISS General List of Subject Headings

Select pickup location

Reservation was successful.

Reservation failed.

Reservation...

Bibliographic data

Number of loans

Loan was successful

Loan failed

Loan was successful

Loan failed

Loan was successful

Loan failed

Loan was successful

Loan failed

Theme