Podatkovno vodena metoda prenosa večjezičnih akustičnih modelov razpoznavalnika govora na nov jezik : doktorska disertacija

(UM)

Podatkovno vodena metoda prenosa večjezičnih akustičnih modelov razpoznavalnika govora na nov jezik : doktorska disertacija

Žgank, Andrej

V doktorski disertaciji smo se posvetili razpoznavanju govora s križnojezičnimi akustičnimi modeli. Glavna prednost takšnega pristopa je, da lahko izdelamo akustične modele za jezik, za katerega ... imamo na voljo zelo omejen nabor posnetkov, ki je premajhen, da bi ga uporabili za klasično učenje prikritih modelov Markova. Najprej smo definirali podatkovno voden pristop za generiranje fonetičnih razredov, ki jih uporabljamo v fonetičnem odločitvenem drevesu pri vezavi stanj kontekstno odvisnih akustičnih modelov. Podobnost fonemov izračunamo na osnovi matrike zamenjav fonemov, ki jo dobimo z razpoznavalnikom fonemov. Takšen podatkovno voden princip generiranja fonetičnih razredov je še posebej primeren za večjezično razpoznavanje govora, možno pa ga je uporabiti tudi v enojezičnem razpoznavalniku govora. Nato smo definirali podatkovno voden pristop križnojezičnega razpoznavanja govora, kjer smo podobnost med izvornimi jeziki in ciljnim jezikom ugotavljali na subfonemskem nivoju. Pri prenosu na ciljni jezik smo uporabljali večjezične kontekstno odvisne akustične modele, ki imajo zmožnost generaliziranja akustičnega prostora. Za izračun podobnosti med izvornimi akustičnimi modeli in ciljnim jezikom smo uporabili pristop na osnovi matrike zamenjav subfonemov, ki jo izračunamo na majhnem razvojnem naboru posnetkov v ciljnem jeziku. Definirali smo kriterij za izločitev redkih izvornih kandidatov, ki dodatno prečisti nabor izvornih akustičnih modelov. Na takšen način zmanjšamo vpliv tistih akustičnih modelov, ki so se v naboru izvornih kandidatov pojavili zaradi napak pri razpoznavanju subfonemov, in ne zaradi podobnosti s ciljnim jezikom. Definirane podatkovno vodene pristope smo ovrednotili z razpoznavanjem govora na telefonskih bazah SpeechDat(II). V naboru smo imeli vključene slovenski, nemški in španski jezik s 1000 govorci za posamičen jezik. Metodo za podatkovno vodeno generiranje fonetičnih razredov smo najprej analizirali za primer slovenskega jezika. Doseženi rezultati so bili delno boljši, delno pa primerljivi z rezultati na osnovi ekspertnih fonetičnih razredov. Tudi v večjezičnem okolju daje podatkovno vodeno generiranje fonetičnih rezultatov bistveno boljše rezultate kot ekspertno tvorjeni fonetični razredi. Križnojezični razpoznavalnik govora na osnovi večjezičnih konteksno odvisnih akustičnih modelov smo tvorili z definiranim postopkom na osnovi subfonemske matrike zamenjav. Dobljene rezultate smo primerjali z dvema klasičnima postopkoma za križnojezično razpoznavanje govora - s postopkom na osnovi tabele IPA in s postopkom na osnovi matrike zamenjav fonemov. Rezultati eksperimentov kažejo, da s križnojezičnim postopkom na osnovi subfonemske matrike zamenjav dosežemo izboljšanje razpoznavanja govora za ciljni jezik. Z vključitvijo kriterija za izločitev redkih izvornih kandidatov smo dosegli nadaljnje izboljšanje rezultatov razpoznavanja govora.

Type of material - dissertation ; adult, serious

Publication and manufacture - Maribor : [A. Žgank], 2003

Language - slovenian

COBISS.SI-ID - 128273664

Keep searching

Other authors
Horvat, Bogomir, 1936-

Holdings
Availability in other libraries

Library	Call number – location, accession no. ...	Copy status
Library of Technical Faculties, Maribor	pisarna A-003 (FERI) DD ŽGANK A. PODATKOVNO	available - reading room
University of Maribor Library	Skladišče II 57688	available - reading room

Access to the JCR database is permitted only to users from Slovenia. Your current IP address is not on the list of IP addresses with access permission, and authentication with the relevant AAI accout is required.

Year	Impact factor		Edition		Category		Classification
Year	JCR	SNIP	JCR	SNIP	JCR	SNIP	JCR	SNIP

Links to authors' personal bibliographies	Links to information on researchers in the SICRIS system
Žgank, Andrej	20032
Horvat, Bogomir, 1936-	03015

Source: Personal bibliographies and: SICRIS

The material from the parent unit is free. If the material is delivered to the pickup location from another unit, the library may charge you for this service.

Pickup location	Material status	Reservation

Upload image

Shelf entry

Adding material to shelf was successful.

Adding material to shelf failed.

It was not necessary to add the material to the shelf.

Permalink

E-mail

Impact factor

Select the library membership card:

DRS, in which the journal is indexed

Select pickup location:

Material pickup by post

Notification

Citations

Subject headings in COBISS General List of Subject Headings

Select pickup location

Reservation was successful.

Reservation failed.

Reservation...

Bibliographic data

Number of loans

Loan was successful

Loan failed

Loan was successful

Loan failed

Loan was successful

Loan failed

Loan was successful

Loan failed

Theme