UNI-MB - logo
UMNIK - logo
 
(UM)
  • Modeliranje slovenskega naravnega jezika
    Sepesy Maučec, Mirjam
    Naravni jezik je zelo zapleten fenomen. Razvijal se je počasi in spontano skozi dolga stoletja. Njegov namen je bil optimirati človekovo verbalno komunikacijo. Ker je ta način komuniciranja človeku ... najbolj naraven, se je pojavila težnja uporabiti ga tudi pri sporazumevanju človeka s strojem. Govorimo o avtomatskem razpoznavanju in sintezi tekočega govora. V članku smo se omejili na razpoznavanje govora. Pri avtomatskem razpoznavanju govora želimo tekoč govor samodejno pretvoriti v besedilo. V članku je predstavljena shema razpoznavalnika govora, katerega osnovna gradnika sta akustični in jezikovni model. Akustični model opisuje akustične značilnosti jezika. V jezikovnem modelu pa je predstavljeno znanje o strukturi jezika na nivoju besed in stavkov. Podrobneje smo opisali statistično modeliranje jezika, ki izhaja iz teorije verjetnosti. Problem določanja verjetnosti iz razpršenih podatkov smo omilili z avtomatsko generiranimi razredi, ki združujejo besede s sorodnimi značilnostmi. Na ta način smo zmanjšali število parametrov, ki jih je v modelu potrebno ovrednotiti. Opisane metode smo uporabili pri izgradnji modela slovenskega jezika. Učinkovitost jezikovnih modelov bomo preizkusili tudi v sistemu avtomatskega razpoznavanja slovenskega jezika. Vključevanje jezikovnih modelov v strukturo razpoznavalnika je v teku. Prepričani smo, da bo rezultat prepoznavanja boljši.
    Vrsta gradiva - prispevek na konferenci
    Leto - 1998
    Jezik - slovenski
    COBISS.SI-ID - 3986454