-
Gold-standard datasets for annotation of Slovene computer-mediated communication [Elektronski vir]Erjavec, Tomaž, 1960- ...This paper presents the first publicly available, manually annotated gold-standard datasets for the annotation of Slovene ComputerMediated Communication. In this type of language, diacritics, ... punctuation and spaces are often omitted, and phonetic spelling and slang words frequently used, which considerably deteriorates the performance of text processing tools that were trained on standard Slovene. Janes-Norm, which contains 7,816 texts or 184,766 tokens, is a gold-standard dataset for tokenisation, sentence segmentation and word normalisation, whereas Janes-Tag, comprising 2,958 texts or 75,276 tokens, was created for training and evaluating morphosyntactic tagging and lemmatisation tools for non-standard Slovene.Vir: RASLAN 2016 [Elektronski vir] : Recent Advances in Slavonic Natural Language Processing : proceedings (Str. 29-40)Vrsta gradiva - prispevek na konferenciLeto - 2016Jezik - angleškiCOBISS.SI-ID - 62994530
Avtor
Erjavec, Tomaž, 1960- |
Čibej, Jaka, prevodoslovje, računalništvo |
Arhar Holdt, Špela |
Ljubešić, Nikola, 1979- |
Fišer, Darja, 1978-
Teme
slovenščina |
računalniško posredovana komunikacija |
normalizacija besed |
oblikoskladenjsko označevanje |
lematizacija |
Slovenian language |
Computer-Mediated Communication |
Word Normalisation |
Morphosyntactic Tagging |
Lemmatisation
Vnos na polico
Trajna povezava
- URL:
Faktor vpliva
Dostop do baze podatkov JCR je dovoljen samo uporabnikom iz Slovenije. Vaš trenutni IP-naslov ni na seznamu dovoljenih za dostop, zato je potrebna avtentikacija z ustreznim računom AAI.
Leto | Faktor vpliva | Izdaja | Kategorija | Razvrstitev | ||||
---|---|---|---|---|---|---|---|---|
JCR | SNIP | JCR | SNIP | JCR | SNIP | JCR | SNIP |
Baze podatkov, v katerih je revija indeksirana
Ime baze podatkov | Področje | Leto |
---|
Povezave do osebnih bibliografij avtorjev | Povezave do podatkov o raziskovalcih v sistemu SICRIS |
---|---|
Erjavec, Tomaž, 1960- | 05023 |
Čibej, Jaka, prevodoslovje, računalništvo | 36914 |
Arhar Holdt, Špela | 27674 |
Ljubešić, Nikola, 1979- | 36871 |
Fišer, Darja, 1978- | 26294 |
Izberite prevzemno mesto:
Prevzem gradiva po pošti
Obvestilo
Gesla v Splošnem geslovniku COBISS
Izbira mesta prevzema
Mesto prevzema | Status gradiva | Rezervacija |
---|
Prosimo, počakajte trenutek.