DIKUL - logo
(UL)
  • Regionalne jezikovne različice v slovenski računalniško posredovani komunikaciji : korpusni pristop z ročno označenim korpusom Janes-Geo
    Čibej, Jaka, prevodoslovje, računalništvo
    V poglavju predstavljamo gradnjo in analizo ročno označenega korpusa Ja-nes-Geo, ki predstavlja prvi korak h korpusnemu proučevanju slovenskih re-gionalnih jezikovnih različic v spletni slovenščini. ... Korpus Janes-Geo vsebuje približno 64.000 pojavnic, ki jih je prispevalo približno 270 uporabnikov Twi-tterja, ki glede na avtomatsko pripisane metapodatke o regionalni pripadnosti spadajo v eno od devetih regij (primorska, gorenjska, rovtarska, ljubljanska, dolenjska, štajerska, koroška, mariborska in panonska). V korpusu so bile roč-no označene nestandardne jezikovne prvine v skladu z izdelano tipologijo. Na-men korpusa Janes-Geo je dvojni: ugotoviti, v kakšnih oblikah se (najpogoste-je) izraža jezikovna nestandardnost v spletni slovenščini, in primerjati razlike v rabi nestandardnih jezikovnih prvin med uporabniki iz različnih regij. Poleg postopka avtomatskega pripisovanja metapodatkov o regionalni pripadnosti uporabnikov opišemo tudi označevanje korpusa, njegovo sestavo in nekate-re poglavitne razlike med njegovimi regionalnimi podkorpusi, npr. pogostost izpustov soglasnikov in samoglasnikov, različne nestandardne oblikoslovne prvine, najpogostejše nestandardno besedje in najpogostejše transformacije grafemov.
    Type of material - article, component part
    Publish date - 2018
    Language - slovenian
    COBISS.SI-ID - 67128930