Akademska digitalna zbirka SLovenije - logo
(UM)
  • Napovedovanje prozodičnih parametrov za samodejno tvorjenje slovenskega govora : doktorska disertacija
    Stergar, Janez, 1968-
    V nalogi je predlagan koncept modeliranja prozodije (nadsegmentnih prozodičnih parametrov) za slovenski jezik v sistemu samodejnega tvorjenja govora iz besedil (TIS) s simboli. Predlagan koncept je ... zasnovan na podatkovno vodenem pristopu. Podatkovno vodeni pristopi temeljijo na obsežnih, ustrezno označenih besedilnih zbirkah. Označevanje besedilnih zbirk je zapleteno in časovno obsežno. Postopek označevanja zahteva ustrezno usposobljeno ekspertno osebje, za označevanje besedilne zbirke je potrebno zasnovati ustrezen inventar (nabor) simbolov. Simboli morajo biti čim bolj enoumno (nedvoumno) definirani, pravila označevanja dogovorjena. Posledica časovne obsežnosti označevanja, ki je pogojena s samim procesom označevanja in obsežnostjo besedilnih zbirk (v veliko primerih označuje eno samo besedilno zbirko več usposobljenih ekspertov) so pogosto večja odstopanja (25% in več). S ciljem izboljšanja postopka označevanja besedilnih zbirk s simboli, smo zasnovali grafično orodje, ki omogoča hitrejše in konsistentnejše označevanje. Orodje temelji na grafično akustičnem vmesniku, ki označevalcu pomaga pri postopku označevanja. Hkrati smo predlagali postopek za samodejno selektivno označevanje simbolne prozodije, ki dodatno pospeši proces ročnega označevanja. Postopek temelji na statističnem določanju besed na osnovi akustičnih parametrov s predprocesiranjem besedilne zbirke. Kot najpomembnejše prozodične parametre, ki smo jih označevali s simboli, smo izpostavili meje s katerimi členimo besedilo na besedilne sklope (prozodične meje) in poudarjenost besed, ki podajajo relacije o pomembnosti besed v posameznih besedilnih sklopih. Definirali smo mednarodno primerljiv nabor simbolov, s ciljem podpore večjezičnosti. Predlagani koncept označevanja prozodije besedilnih zbirk s simboli, smo dopolnili z modulom za napovedovanje prozodičnih mej in poudarjenosti besed. Modul smo zasnovali na arhitekturi nevronskih omrežjih, ki temeljijo na predvidevanju vzorcev z asociacijo - kot vhodni podatek v omrežje smo uporabili zgolj ustrezno zakodirano besedovrstno analizo besedil. Strukture samodejnih asociatorjev z razvrščanjem občutno izboljšajo rezultat napovedovanja različnih kategorij iz inventarja prozodičnih simbolov v primerjavi z ostalimi arhitekturami nevronskih omrežij. Modul za stohastično določanje različnih kategorij simbolov smo uspešno implementirali v večjezični TIS. Preliminarni akustični preskusi potrjujejo, da uporaba modula občutno prispeva k naravnosti sintetiziranega govora, kar potrjuje ustreznost zasnovanega koncepta.
    Type of material - dissertation ; adult, serious
    Publication and manufacture - Maribor : [J. Stergar], 2003
    Language - slovenian
    COBISS.SI-ID - 8085526

Library Call number – location, accession no. ... Copy status
Library of Technical Faculties, Maribor pisarna A-003 (FERI) DD STERGAR J. NAPOVED. available - reading room
University of Maribor Library Skladišče II 56522 available - reading room
loading ...
loading ...
loading ...