UNI-MB - logo
UMNIK - logo
 
(UM)
  • Določanje jezikovno neodvisnega nabora trifonskih akustičnih modelov za večjezično avtomatsko razpoznavanje govora : doktorska disertacija
    Imperl, Bojan
    Naloga zadeva večjezično avtomatsko razpoznavanje govora. Predstavili smo osnovne probleme pri večjezičnem avtomatskem razpoznavanju govora in opisali različne pristope v gradnji večjezičnih ... razpoznavalnikov. Jedro naloge predstavlja raziskovanje metod za izboljšanje delovanja večjezičnih razpoznavalnikov. Definirali smo metodo za določanje večjezičnega nabora trifonskih govornih enot, ki omogoča bistveno izboljšanje delovanja današnjih večjezičnih razpoznavalnikov. Definirali smo metodo za določanje večjezičnega nabora trifonskih govornih enot, ki omogoča bistveno izboljšnje delovanja današnjih večjezičnih sistemov zasnovanih na trifonskih modelih. Določanje večjezičnega nabora trifonskih govornih enot predstavlja problem, ki v svetu do sedaj še nibil rešen. Metoda zajma definicijo merila za ocenjevanje podobnosti med posameznimi trifoni in postopka za združevanje podobnih trifonov. Definicijo merila za ocenjevanje podobnosti med posameznimi trifoni smo zasnovali na osnovi eksplicitnega ocenjevanja podobnosti kontekstov in centralnih fonov, medtem ko smo bili pri oblikovanju postopka za zdrževanje podobnih trifonov uporabili princip iterativnega optimiranja začetne določitve skupin podobnih trifonov. Definirano metodo smo, integrirano v večjezični sistem za avtomastko razpoznavanje govora s prikritimi modeli Markova, preizkusili na primeru razpoznavanja osamljeno izgovorjenih besed s srednje velikim slovarjem. Učinkovitost metode določanja večjezičnega nabora trifonskih govornih enot smo ocenili s primerjavo uspešnosti razpoznavanja sistema z večjezičnim naborom trifonskih modelov s sistemom s paralelno vezavo enojezičnih razpoznavalnikov. Za učenje in testiranje sistemov smo uporabili baze SpeechDat II in sicer za slovenski, španski in nemški jezik. Eksperimenti so pokazali, da metoda ob pravilni nastavitvi parametrov daje zelo dobre rezultate. Omogoča zmanjšanje števila trifonskih govornih enot in s tem zmanjšanje števila trifonskih akustičnih modelov za več kot 40%, pri tem pa je uspešnost razpoznavanja večjezičnega sistema zmanjšana le za približno poldrugi odstotek. Poleg tega se je izkazalo, da je v določenih primerih večjezične nabore trifonskih modelov mogoče uporabiti tudi kot metodo za izboljšanje delovanja enojezičnih razpoznavalnikov.
    Vrsta gradiva - disertacija ; neleposlovje za odrasle
    Založništvo in izdelava - Maribor : [B. Imperl], 1999
    Jezik - slovenski
    COBISS.SI-ID - 107326720

Knjižnica Signatura – lokacija, inventarna št. ... Status izvoda
Knjižnica tehniških fakultet, Maribor pisarna A-003 (FERI) DD IMPERL B. DOLOČANJE prosto - za čitalnico
Univerzitetna knjižnica Maribor Skladišče II 49442 prosto - za čitalnico
loading ...
loading ...
loading ...