U članku se opisuju ciljevi i načela uspostave korpusa, metodologija izrade i dosadašnji rezultati u okviru projekta izgradnje dijakronijskoga korpusa hrvatskoga jezika, koji su za potrebe ...jezičnopovijesnih istraživanja pokrenuli njemački slavisti Roland Meyer (Humboldt-Universität zu Berlin) i Björn Hansen (Universität Regensburg) u suradnji s Institutom za hrvatski jezik i jezikoslovlje. Regensburški dijakronijski korpus hrvatskoga jezika u vrijeme pisanja ovoga rada još nije mrežno dostupan za javnost.
Lyons (1994.) povezuje značenje i komunikaciju i drži da se značenje ne može teorijski objasniti, niti empirijski ovjeriti bez oslonca na jezik u uporabi. Što su naredbe prema Lyonsu i kakvo značenje ...prenose? To su izričaji koji nameću, predlažu neki tijek radnje ili obrazac ponašanja i indiciraju da bi se ono trebalo ostvariti. Odlika je dobre zapovijedi da je kratka i potpuno razumljiva svakome kome je namijenjena. K tome mora biti jednoznačna i precizna. Razumijevanje i izvršavanje naredaba vrlo je važno u pomorstvu. Kontrastivno (engleski izvorni jezik, hrvatski ciljni jezik) analizirano je 57 uzvičnih rečenica naredaba na brodu iz korpusa američkoga popularnog romana 19. stoljeća (Dragojević, 2007.). Naime, u romanu Moby Dick (autor Herman Melville) istraživale su se onodobne zapovijedi na engleskome i pripadajući prijevodi na hrvatski jezik (prevoditelji Zlatko Gorjan i Josip Tabak, 1985.). Zapovijedi su klasificirane po značenjskim skupinama. Književni prevoditelji bave se duhom obaju jezika (engleskoga i hrvatskog), pa se njihovim prijevodima može koristiti u komparativnoj lingvističkoj stilistici. Time se u izvornom tekstu uočavaju one stilske osobitosti koje se ne mogu postići u tekstu ciljnoga jezika, zato što najjače očituju vlastitost jednoga jezika (Bonačić, 1999.). Tehnološki napredak u pomorstvu vidljiv je u jeziku naredaba. U doba jedrenjaka kapetan broda morao je izdati jasnu zapovijed svojemu podređenom časniku koje uže pritegnuti ili otpustiti (Stolac, 1998.). Pogreške su mogle biti kobne. Danas Međunarodna pomorska organizacija propisuje standardne naredbe za kormilarenje i upravljanje strojem, i to na engleskom jeziku. Rad daje pregled naredaba originala i prijevoda romana Moby Dick te ih uspoređuje s onima na engleskome i hrvatskome propisanima za današnju upotrebu.
Cilj je ovog rada ispitati značenje riječi musliman ili njemačkog Muslim i odgovoriti na pitanje može
li se značenje te riječi u rječnicima mapirati s pomoću klasične distribucijske analize te mogu ...li se tom
metodom odrediti i još neka značenja. K tomu, donosi se i jednostavna metoda distribucijske značenjske
analize. Istraživanje kreće od česte pretpostavke u korpusno utemeljenoj semantici i leksikografiji da se
značenje riječi razumijeva iz konteksta te se na taj način mogu prepoznati polisemija i sinonimija. Članak
proučava četiri mrežna korpusa za bosanski, hrvatski, njemački i srpski jezik. Prvo se analizira kontekst, uz
pretpostavku da sintaktičke strukture imaju inherentno značenje u određenom okružju. Tako se pridjevski
atributi koriste za analizu obilježja ključne riječi, koordinandi se koriste kao pokazatelji relevantnih
kategorija, a glagoli uz koje ključna riječ ima funkciju subjekta ili izravnog objekta koriste se kao pokazatelji
tipičnih radnji koje izvršava ili trpi ključna riječ. U drugom se koraku grupiraju leksemi koji se pojavljuju u
ta četiri okružja te se određuju značenjske dimenzije ključne riječi.
Rezultati sugeriraju da distribucijska metoda u načelu može prilično dobro mapirati rječničke definicije,
no samo kada je riječ o okružju koje uključuje strukture s atributima i koordinaciju, a ne i kada se radi o
sintaktičkim konfiguracijama usko vezanima uz radnju, odnosno glagol. Gledano u cjelini, najistaknutije
su značenjske dimenzije leksema one koje se tiču članova vjerske zajednice, članova regionalne etničke
skupine te iskušene ili potaknute agresije. Po tom se pitanju četiri korpusa značajno razlikuju: uporaba
u njemačkome gotovo se isključivo odnosi na vjerske vidove pojma dok preostali korpusi sadrže etničku,
odnosno regionalnu komponentu te diskurs o agresiji, koja je u njemačkome uglavnom verbalna, a u
drugim korpusima fizička. Neutralne značenjske komponente riječi musliman prisutne su samo u korpusu
bosanskog jezika.
U ovome radu predstavljamo dijakronijsku i sinkronijsku analizu konstrukcija s uzdižućim predikatima (engl. raising predicates) i konstrukcija s ekstrapozicijom u povijesnoj bazi Brown Corpus i ...suvremenijoj English Web Corpus 2015. Počinjemo utvrđivanjem dviju dijakronijskih činjenica: 1. uzdižuće (engl. raising) konstrukcije koriste se puno češće od semantički ekvivalentnih inačica s ekstrapozicijom, i 2. distribucija uzdižućih konstrukcija i ekstrapozicije – prilično iznimno u usporedbi s drugim strukturama koje dopuštaju varijaciju finitno/nefinitno – dijakronijski je dosljedna od početka 20. stoljeća sve do 2015. godine. Ovu jedinstvenu dijakronijsku distribuciju potom dopunjavamo analizom suvremenijega korpusa koja pokazuje da izborom između ovih dviju semantički ekvivalentnih konstrukcija upravljaju različiti strukturalni čimbenici svojstveni svakoj od njih. Konkretno, pokazujemo da se uzdižuća konstrukcija često koristi kao relativna rečenica, dok se inačica s ekstrapozicijom u toj sintaktičkoj ulozi rijetko javlja. Nasuprot tomu pokazujemo da se istaknut čimbenik u korist ekstrapozicije odnosi na oznaku niječnosti koja se podjednako često smješta i u glavnu i u uklopljenu rečenicu u slučaju konstrukcije s ekstrapozicijom, nasuprot uzdižuće inčice u kojoj se oznaka niječnosti javlja gotovo isključivo u glavnoj rečenici. Konačno, pokazujemo da konstrukcije s ekstrapozicijom češće sadrže modalne glagole u glavnoj rečenici nego li uzdižuće inačice te tu opservaciju povezujemo s idejom da je rečenična struktura konstrukcija s ekstrapozicijom strukturalno prikladnija za izražavanje nesigurnosti/uvjetnosti.
Korpusna lingvistika zauzela je nezamjenjivo mjesto u suvremenoj leksikografskoj praksi. U ovome radu riječ je o korpusima, posebice računalnim korpusima, jezičnim tehnologijama i alatima, te o ...primjeni korpusne lingvistike, osobito u suvremenoj leksikografiji. Posebno je poglavlje posvećeno korpusnoj lingvistici u Hrvatskoj, njezinim početcima, ali i suvremenim projektima i postignućima.
U ovom su radu prikazani izazovi pri stvaranju usporedivoga korpusa govornog jezika. Predstavljeni su jezični kodovi iz Trentina i Južnog Tirola, gdje je višejezičnost (de jure) pravilo. Na ovom ...području sjeverne Italije koegzistira više od dva jezika i više od dvije kulture koje su međusobno u dodiru. Korpus uključuje glavne jezike, talijanski i njemački te manjinske jezike i dijalekte koji pripadaju romanskoj skupini, poput ladinskog i trentinskih dijalekata, kao i one iz njemačke skupine, poput cimbrijskog i južnotirolskih dijalekata. U radu se raspravlja o metodologiji koja se koristi za prikupljanje spontanih govornih podataka u manjinskim jezicima i dijalektima, usredotočujući se na zadatak karte (Anderson i sur. 1991). Zadatak karte pokazao se učinkovitom tehnikom za dobivanje djelomično spontanih dijaloga, ali i reprezentativnoga uzorka pragmatičkog, tekstnog i sintaktičkog konteksta, koji je barem djelomično očekivan, a shodno tome i usporediv (Cerrato 2007: 9). Ova tehnika omogućuje govornicima da se usredotoče na izvanjezični kontekst i na zadatak rješavanja problema, umanjujući time i promatrački paradoks i nadgledanje vlastite govorne produkcije u ispitanika
U radu su prikazana dosadašnja istraživanja u području statističke analize teksta, s posebnim naglaskom na razvoj formula čitkosti. Pored teorijskog objašnjenja čitanja, razumijevanja i čitkosti, ...prikazani su rezultati analize korpusa tekstova na engleskom i hrvatskom jeziku. Na kraju, preporučuje se formula čitkosti za hrvatski jezik, modificirana prema Fleschovoj formuli za engleski jezik, koja se može koristiti kao objektivni pokazatelj za grubu procjenu težine teksta na hrvatskom jeziku.
Pro ana je zajednica koja gotovo isključivo postoji na internetskim stranicama te koja tvrdi da
poremećaji prehrane nisu bolest, već životni stil. Ovo istraživanje pruža uvid u načine stvaranja
pro ...ana ideologije na primjeru mikro i makro razine kritičke analize diskursa (CDA) 19
blogova čiji su autori samoprozvani proanoreksičari. Lingvistička analiza pro ana blogova
nedovoljno je zastupljena u dosadašnjim istraživanjima te je ovo istraživanje prvo u korištenju
kritičke analize diskursa u analizi sadržaja internetskih pro ana stranica. Glavni zaključak rada
jest da proanoreksičari stvaraju ideologiju svoje zajednice demedikaliziranim odnosom
prema bolesti. Istraživanje također ukazuje na to da proanoreksičari imaju negativan stav
prema autsajderima i mainstream kulturi koji pridonosi njihovom samoodređenju. Pronalaskom ključnih riječi u korpusu prepoznate su glavne teme unutar diskursa koje ukazuju na povezanost
diskursa mjerenja, snage volje i ideologije pro ana zajednice.
Ovaj je rad nastao na temelju naše doktorske disertacije, u kojoj smo uspoređivali član
u francuskom i rumunjskom, te njegove hrvatske ekvivalente u računalnom usporednom
korpusu. Nakon ...predstavljanja tih elemenata prikazujemo rezultate istraživanja korpusa,
sastavljenog od romana iz 20. stoljeća, s podjednako zastupljenim tekstovima na izvornim
jezicima i njihovim prijevodima. Rezultati pokazuju, osim nekih zanimljivih ekvivalencija,
važnost razlikovanja između vrijednosti i oblika imenice koji se ne poklapaju uvijek, i to
ne samo u rumunjskom i u manjoj mjeri u francuskom, nego posebice u hrvatskom jeziku.
U članku se daje cjelovit pregled radova iz područja strojnog obilježavanja hrvatskih tekstova.
Pregled obuhvaća opojavničenje, segmentaciju na rečenice, lematizaciju, POS i MSD označ
avanje, ...prepoznavanje naziva i problematiku leksikona. Osim izloženih gotovih radova
za svaku cjelinu posebno, upućuje se na slične radove i dodatne izvore, te se daju ideje i
smjernice za buduće korake. U zaključku se ističe nužnost poštivanja međunarodnih standarda
za obilježavanje tekstova u razvoju jezičnih resursa i računalnojezikoslovnih alata za
hrvatski jezik.