DIKUL - logo
Library of Technical Faculties, Maribor (KTFMB)
  • Robustna parametrizacija govornega signala z združeno uporabo valčne paketne dekompozicije in avtoregresivnega modeliranja : doktorska disertacija
    Kotnik, Bojan
    V doktorski nalogi obravnavamo problematiko avtomatskega razpoznavanja govora v šumno intenzivnih okoljih. Cilj predstavljenega znanstveno-raziskovalnega dela je definiranje, implementacija in ... vrednotenje uspešnosti novega algoritma za robustno parametrizacijo govorne ga signala. Algoritem temelji na osnovi časovno-frekvenčne predstavitve govomega signala s pomočjo valčne paketne dekompozicije. Za zmanjšanje nivoja aditivnega šuma v domeni valčne paketne dekompozicije smo razvili nov postopek modificirane pragovne funkcije,s časovno-frekvenčno adaptivnim postopkom za določitev vrednosti pragu. Za detekcijo govornih oziroma šumnih okvirov vhodnega signala ter za detekcijo zvočnostinezvočnosti smo razvili dvostopenjski statistični klasifikator s pripadajočima definicijama energijsko neodvisnih značilk. Razvili smo adaptivno strukturo drevesa valčne paketne dekompozicije, ki upošteva lastnosti analiziranega govorne ga signala in v okviru definiranih meril omogoča optimalno predstavitev govorne ga signala v časovno-frekvenčni ravnini. Glavni vektor značilk je zgrajen na osnovi kombinacije logaritemsko-eksponentno komprimiranih parametrov valčne paketne dekompozicije in parametrov avtoregresivnega modeliranja govorne ga signala. V fazi postprocesiranja in izgradnje izhodnega, končnega vektorja značilk smo predlagali postopek statističnega zmanjšanja akustične ga neujemanja med učnim in testnim okoljem ter razvili orodje za izvedbo linearne diskriminančne analize. Uspešnost avtomatskega razpoznavanja govora, doseženo s pomočjo definiranega algoritma za robustno parametrizacijo govorne ga signala, smo vrednotili s pomočjo standardiziranih eksperimentalnih okolij Aurora 2 in Aurora 3 ter jo primerjali z uspešnostjo prav tako standardiziranega postopka ETSI ES 201 108 za izločanje mel frekvenčnih kepstralnih koeficientov (MFCC). V okviru baze izgovarjav Aurora 2 smo dosegli 47.02 % relativno povprečno izboljšanje rezultata avtomatskega razpoznavanja govora, v primeru baze Aurora3 pa 50.05 % relativno povprečno izboljšanje rezultata avtomatskega razpoznavanja govora glede na referenčni standardizirani postopek za izločanje MFCC značilk.
    Type of material - dissertation ; adult, serious
    Publication and manufacture - Maribor : [B. Kotnik], 2004
    Language - slovenian
    COBISS.SI-ID - 218843392

Call number – location, accession no. ... Copy status Reservation
pisarna A-003 (FERI) DD KOTNIK B. ROBUSTNA pisarna A-003 (FERI) DD KOTNIK B. ROBUSTNA available - reading room
loading ...
loading ...
loading ...