DIKUL - logo
(UL)
  • Orodja za procesiranje nestandardne slovenščine
    Ljubešić, Nikola, 1979- ; Erjavec, Tomaž, 1960- ; Fišer, Darja, 1978-
    Poglavje je posvečeno težavam, povezanim z avtomatskim procesiranjem nestan-dardnega jezika, in orodjem, ki smo jih razvili za reševanje teh težav. V poglavju obravnavamo merjenje standardnosti ... besedil, stavčno segmentacijo, normal-izacijo, rediakritizacijo, oblikoskladenjsko označevanje in razpoznavanje imen-skih entitet. Pokažemo, da se število napak, ki jih povzročijo orodja, naučena na standardnem jeziku, pri uporabi za nestandardni jezik sicer močno poveča, vendar predhodna normalizacija nestandardnih besedil ali prilagoditev orodij za-nje bistveno povečata kvaliteto procesiranja nestandardnega jezika. Za ta namen potrebujemo dovolj ročno označenih nestandardnih besedil, ki jih nato upora-bimo za učenje ali posodabljanje modelov za nadzorovano strojno učenje.
    Vrsta gradiva - članek, sestavni del
    Leto - 2018
    Jezik - slovenski
    COBISS.SI-ID - 66912354