Narodna in univerzitetna knjižnica, Ljubljana (NUK)
Naročanje gradiva za izposojo na dom
Naročanje gradiva za izposojo v čitalnice
Naročanje kopij člankov
Urnik dostave gradiva z oznako DS v signaturi
  • Slovenska baza BNSI broadcast news za razpoznavanje tekočega govora = The Slovenian BNSI broadcast news database for continuous speech recognition
    Žgank, Andrej ; Verdonik, Darinka ; Kačič, Zdravko
    V članku bomo predstavili nov slovenski jezikovni vir, bazo BNSI Broadcast News, ki vsebuje posnetke televizijskih dnevnoinformativnih oddaj. Vir je namenjen razvoju razpoznavalnikov tekočega govora ... z velikim slovarjem besed za neomejeno domeno. Sestavljajo ga govorna baza z ročno tvorjenimi transkripcijami v obsegu 36 ur in tekstovni korpus, ki vsebuje 11 mio besed. Govorna baza je namenjena učenju akustičnih modelov, tekstovni korpus pa bo uporabljen za izdelavo jezikovnih modelov. Novi jezikovni vir je plod sodelovanja med Univerzo v Mariboru, FERI in IZ'FV Slovenija. V članku bomo najprej predstavili postopek zajemanja gradiva in karakteristike baze. Opisali bomo potek ročnega zapisovanja govornega korpusa. Sledila bo podrobna analiza govornega in tekstovnega dela baze, ki je namenjena predstavitvi vseh lastnosti jezikovnega vira, ki vplivajo na razvoj razpoznavalnikov govora.
    Vir: Elektrotehniški vestnik. - ISSN 0013-5852 (Letn. 75, št. 3, 2008, str. 85-90)
    Vrsta gradiva - članek, sestavni del ; neleposlovje za odrasle
    Leto - 2008
    Jezik - slovenski
    COBISS.SI-ID - 6739796

vir: Elektrotehniški vestnik. - ISSN 0013-5852 (Letn. 75, št. 3, 2008, str. 85-90)

loading ...
loading ...
loading ...