VSE knjižnice (vzajemna bibliografsko-kataložna baza podatkov COBIB.SI)
  • Natančnost uvrščanja slovenskih besedil
    Hölbl, Marko ...
    v članku predstavljamo meritve natančnosti strojnega uvrščanja slovenskih besedil. Sorodne raziskave na tem področju so bile izvedene predvsem na angleško govorečem področju in na angleških ... besedilih, prav tako jih je bilo moč zaslediti tudi na ostalih govornih področjih, na primer na nemškem in kitajskem. Na slovenskem govornem področju pa podobnih raziskav ni bilo možno zaslediti. Namen raziskave je ugotavljanje učinkovitosti tujih orodij pri uvrščanju slovenskih besedil. V ta namen smo izbrali 18M-ovo orodje za uvrščanje besedil, imenovano "IBM Intelligent Miner for Text" [7]. Raziskava je potekala v 3 fazah. Najprej smo zbrali množico 270 slovenskih besedil iz dnevnega časopisja in jih razvrstili v 3 kategorije: politika, gospodarstvo in sport. Množico smo razdelili na učni del na testni del. Nato je sledila izgradnja uvrščevalnega modela s pomočjo učne mnozice. V tretji fazi smo testirali natančnost izgrajenega modela na podlagi testnega dela. Rezultati uvrščanja slovenskih besedil so se izkazali za presenetljivo dobre (natančnost nad 87 %, kljub temu, da smo uporabili orodje, ki ni namenjeno slovenskem govornem območju.
    Vir: Uporabna informatika. - ISSN 1318-1882 (Let. 12, št. 1, 2004, str. 42-46)
    Vrsta gradiva - članek, sestavni del
    Leto - 2004
    Jezik - slovenski
    COBISS.SI-ID - 8654358

vir: Uporabna informatika. - ISSN 1318-1882 (Let. 12, št. 1, 2004, str. 42-46)
loading ...
loading ...
loading ...