Tviterasi, tviteraši or twitteraši?; Elektronski vir : producing and analysing a normalised dataset of Croatian and Serbian tweets

Narodna in univerzitetna knjižnica, Ljubljana (NUK)

Naročanje gradiva za izposojo na dom
Naročanje gradiva za izposojo v čitalnice
Naročanje kopij člankov
Urnik dostave gradiva z oznako DS v signaturi

Tviterasi, tviteraši or twitteraši? [Elektronski vir] : producing and analysing a normalised dataset of Croatian and Serbian tweets

Miličević, Maja ; Ljubešić, Nikola, 1979-

In this paper we discuss the parallel manual normalisation of samples extracted from Croatian and Serbian Twitter corpora. We describe the datasets, outline the unified guidelines provided to ... annotators, and present a series of analyses of standard-to-non-standard transformations found in the Twitter data. The results show that closed part-of-speech classes are transformed more frequently than the open classes, that the most frequently transformed lemmas are auxiliary and modal verbs, interjections, particles and pronouns, that character deletions are more frequent than insertions and replacements, and that more transformations occur at the word end than in other positions. Croatian and Serbian are found to share many, but not all transformation patterns; while some of the discrepancies can be ascribed to the structural differences between the two languages, others appear to be better explained by looking at extralinguistic factors. The produced datasets and their initial analyses can be used for studying the properties of non-standard language, as well as for developing language technologies for non-standard data.

Vir: Računalniško posredovana komunikacija [Elektronski vir] (Letn. 4, št. 2, 2016, str. 156-188)

Vrsta gradiva - e-članek

Leto - 2016

Jezik - angleški

COBISS.SI-ID - 62290530

Povezava(-e):
http://slovenscina2.0.trojina.si/arhiv/2016/2/Slo2.0_2016_2_08.pdf
Digitalna knjižnica Slovenije - dLib.si
DOI

Išči dalje

Avtor
Miličević, Maja | Ljubešić, Nikola, 1979-

Teme
hrvaščina | srbščina | Twitter (družabno omrežje) | korpusi (jezikoslovje) | računalniško posredovana komunikacija

Dostop do baze podatkov JCR je dovoljen samo uporabnikom iz Slovenije. Vaš trenutni IP-naslov ni na seznamu dovoljenih za dostop, zato je potrebna avtentikacija z ustreznim računom AAI.

Leto	Faktor vpliva		Izdaja		Kategorija		Razvrstitev
Leto	JCR	SNIP	JCR	SNIP	JCR	SNIP	JCR	SNIP

Povezave do osebnih bibliografij avtorjev	Povezave do podatkov o raziskovalcih v sistemu SICRIS
Miličević, Maja
Ljubešić, Nikola, 1979-	36871

Vir: Osebne bibliografije in: SICRIS

Gradivo iz matične enote je brezplačno. Če je gradivo na mesto prevzema dostavljeno iz drugih enot, lahko knjižnica to storitev zaračuna.

Mesto prevzema	Status gradiva	Rezervacija

Naloži sliko

Vnos na polico

Dodajanje gradiva na polico je uspelo.

Dodajanje gradiva na polico je spodletelo.

Dodajanje gradiva na polico ni bilo potrebno.

Trajna povezava

E-pošta

Faktor vpliva

Izberite knjižnično izkaznico:

Baze podatkov, v katerih je revija indeksirana

Izberite prevzemno mesto:

Prevzem gradiva po pošti

Obvestilo

Citiranje

Gesla v Splošnem geslovniku COBISS

Izbira mesta prevzema

Rezervacija je uspela.

Rezervacija ni uspela.

Rezervacija...

Bibliografski podatki

Število izposoj

Izposoja uspešna

Izposoja ni uspela

Izposoja uspešna

Izposoja ni uspela

Izposoja uspešna

Izposoja ni uspela

Izposoja uspešna

Izposoja ni uspela

Tema