UNI-MB - logo
UMNIK - logo
 
(UM)
  • Zasnova sistema za avtomatsko razpoznavanje govora [Elektronski vir]
    Rotovnik, Tomaž, telekomunikacije
    V prispevku obravnavamo zasnovo strukture sistema za avtomatsko razpoznavanje govora (ARG), ki vključuje tudi podporo za ovrednotenje razpoznane hipoteze (mera zaupanja). Sama arhitektura je ... zasnovana na objektno-orientirani tehnologiji programiranja (OOP - Object Oriented Programing). Modularnost zasnove omogoča preprosto razširljivost z dodajanjem novih modulov. Nad moduli je uporabljena tehnologija nitenja (vsi moduli izvajajo svoje naloge hkrati). Podali smo primerjavo procesorske obremenitve posameznih modulov pri različnem razmerju vhodnega signala (govor-negovor). Preučili smo tudi vpliv mere zaupanja na uspešnost razpoznavanja. Uporabili smo več mer zaupanj in s pomočjo le-teh ter nelinearnega klasifikatorja izboljšali uspešnost izločanja besed, ki jih ni v slovarju. Mero zaupanja smo ovrednotili z napako CER (Confusion Error Rate) in s krivuljo ROC (Receiver Operating Characteristic). Pri uporabi samo akustične mere zaupanja smo pri slovenski govorni bazi Speechdat11 dosegli CER 12,5%. Z uporabo klasifikatorja na osnovi nevronske mreže smo dodatno zmanjšali napako CER za 2,2%.
    Vrsta gradiva - e-članek
    Leto - 2004
    Jezik - slovenski
    COBISS.SI-ID - 9466646