U članku se opisuju ciljevi i načela uspostave korpusa, metodologija izrade i dosadašnji rezultati u okviru projekta izgradnje dijakronijskoga korpusa hrvatskoga jezika, koji su za potrebe ...jezičnopovijesnih istraživanja pokrenuli njemački slavisti Roland Meyer (Humboldt-Universität zu Berlin) i Björn Hansen (Universität Regensburg) u suradnji s Institutom za hrvatski jezik i jezikoslovlje. Regensburški dijakronijski korpus hrvatskoga jezika u vrijeme pisanja ovoga rada još nije mrežno dostupan za javnost.
Vprasanje frazeologije v govorni komunikaciji je pomembno, ker obsega v vsakdanji komunikaciji znatno vecji delez kot pisna, jezikoslovje pa je govorne vire dolgo casa zanemarjalo (Cermak 2005: ...19-21). Cermák je preprican, da bodo to vlogo v prihodnosti prevzeli govorni korpusi, ki pa so zaenkrat se dokaj majhni. Najprej si moramo zastaviti vprasanje smotrnosti raziskovanja PE v govornem korpusu v velikosti, ki nam je na voljo. V korpusu GOS, ki obsega 120 ur posnetkov, lahko pricakujemo relativno malo zgledov PE. Zato je smiselno, da se v prvi tovrstni raziskavi posvetimo dovolj obsezni mnozici PE, ki v sodobni slovenscini predstavljajo aktivno paremiolosko jedro. Ce bi se lotili iskanja poljubnih PE z opiranjem na jezikovno intuicijo, bi se morda takemu jedru priblizali, vendar bi slo za subjektivno oceno enega govorca. Ocenjujemo, da tako jedro predstavlja slovenski paremioloski minimum, ki smo ga delno ze predstavili (Durco, Meterc 2013). Minimum 300 najbolj poznanih slovenskih PE, ki izvira iz Permjakovovega koncepta (1988: 143-44), smo ustvarili s sociolingvisticno raziskavo s spletnim vprasalnikom po Durcevi (2002) metodologiji na naslovu vprasalnik.tisina. net (Meterc 2015). V izhodiscnem korpusu za raziskavo je 918 PE, izpisanih iz SSKJ-ja in Frazeoloskega slovarja v petih jezikih (Pavlica 1960), med katerimi prevladujejo pregovori in reki, nekaj pa je tudi drugih paremioloskih zanrov (krilatic in wellerizmov). V prispevku uporabljamo minimum 1.0, ki je nastal oktobra 2012 po tem, ko je vprasalnik v celoti izpolnilo 316 anketirancev iz vse Slovenije, rojenih med letom 1929 in 2000.3 V okviru doktorskega studija (Meterc 2014a) smo minimum po Durcevem konceptu (2006: 3) nadgradili v paremioloski optimum, v katerem vrstni red PE dolocata tako poznanost PE kakor njihova pogostnost v korpusu pisnih besedil FidaPLUS. O enotah paremioloskega minimuma si lahko zastavimo naslednja vprasanja: Ena izmed tezenj sodobnega razvoja korpusnega jezikoslovja je izpopolnjevanje taktik iskanja stavcnih in vecstavcnih enot v korpusih (Cermák, 2005a: 158), ki se ga lotevajo nekateri frazeologi (prim. Gantar 2004, Durco 2006, Cermák 2007). PE iz minimuma smo vecinoma iskali z enostavnimi iskalnimi pogoji po standardiziranem zapisu.4 Enote smo skusali razdeliti na cim vec sestavnih delov, ki bi jih lahko se uporabili za iskalne pogoje s prikazom obvladljivih seznamov konkordanc, saj smo zeleli zajeti tudi variantne in prenovljene oblike. Poleg tega smo sestavinske variante iskali z razlicnimi sestavinami, npr. »imeti hudic« za enoto Kadar ima vrag mlade, nima nikoli samo enega. Pogosto je zadoscala ze kombinacija polnopomenske in nepolnopomenske sestavine, npr. samostalnika in predloga: »vrabec v«, »golob na«, »na strehi« in »v roki«. Ker je korpus manjsi po obsegu, smo nekatere enote lahko iskali tudi z iskalnimi pogoji iz ene same leme, npr. »pameten« za enoto Pametnejsi odneha (52. mesto), kar v vecjih pisnih korpusih ni mozno. V primerih PE z arhaizmom, nekrotizmom ali kaksno drugo posebnostjo smo iskali z enim samim leksemom po pogovornem zapisu, npr »gliha« pri enoti Gliha vkup striha (239. mesto), »Trsti« pri enoti Le povrsti, kakor so hise v Trsti (216. mesto) in »komod«/»komot«/»kamot« pri enoti Cez komod ga ni (271. mesto). Med PE iz javnega diskurza ima podtip razvedrilnega diskurza (54,35 %) obcutno prednost pred podtipom informativno-izobrazevalnega diskurza (21,74 %). Treba je sicer upostevati, da so se snovalci korpusa odlocili uvrstiti prosti moderirani radijski program v razvedrilni diskurz, ker ta »skusa podajati informativne vsebine na razvedrilen nacin« (Verdonik, Zwitter Vitez 2011: 49). Najvec je PE, ki se v okviru razvedrilnega diskurza pojavljajo v radijskih besedilih. Predstavljajo priblizno tretjino vseh najdenih PE (30,43 %), delez radijskih besedil tega podtipa pa v korpusu znasa le 12,13 %. Opazno povecan je tudi delez PE iz televizijskega javnega razvedrilnega diskurza (23,91 %), ce upostevamo, da televizijska besedila tega tipa predstavljajo 10,14 % vseh posnetkov v korpusu. Tako delez PE iz televizijskih kakor tudi radijskih posnetkov iz javnega informativno-izobrazevalnega diskurza sta primerljiva z zastopanostjo besedil v korpusu. Obcutno nizek je delez PE v osebnem stiku javnega izobrazevalno-informativnega diskurza (4,35 %), ce ga primerjamo z delezem besedil tega tipa v korpusu (14,88 %). Korpus GOS vsebuje tudi podsklop solskega diskurza ( javni izobrazevalni diskurz preko kanala osebnega stika), ki obsega 10 %. Nasli smo le dve PE, kar sicer prica o prisotnosti paremiologije v solskem pouku, je pa za kakrsnekoli druge zakljucke premalo. Delez PE iz osebnega stika v okviru nejavnega nezasebnega podtipa diskurza (10,87 %) je primerljiv z delezem besedil tega podtipa v korpusu (11,97 %). Izrazita razlika se kaze v okviru osebnega stika nejavnega zasebnega diskurza, saj je delez PE prepolovljen (10,87 %) v primerjavi z delezem takih besedil v korpusu (21,88 %). Zelo majhen je tudi delez enot iz telefonskih pogovorov nejavnega nezasebnega diskurza, saj smo na tem kanalu nasli le eno PE iz minimuma (2,17 %). V korpusu pa je delez telefonskih pogovorov bistveno vecji (6,67 %). Potrdilo se je pricakovanje, da v korpusu govorjenih besedil ne najdemo le PE, ki so med najbolj pogostimi v pisnem korpusu, temvec tudi take, ki so med najmanj pogostimi. V velikem govornem korpusu bi verjetno nasli vse PE iz paremioloskega minimuma in optimuma. Predstavili smo povprecno stevilo (prototipnih) pojavitev PE iz minimuma v korpusu GOS (1,2 zgleda). Ocenili smo tudi, da se PE iz slovenskega paremioloskega minimuma v povprecju v korpusu govorjenih besedil pojavi na okoli 20000 besed, kar je povsem primerljivo s podatkom iz korpusa pisnih besedil. Ugotovili smo, da ze 46 zgledov PE zadosca za pester prikaz variantnosti, prenovitev in nekaterih drugih fenomenov (antipregovorov, transformacij ter celo frazeoloskih speciik dolocenega idiolekta). Med zgledi prevladujejo PE iz javnega razvedrilnega diskurza. S pomocjo korpusa smo izdelali tudi priblizno oceno pogostnosti pregovorov in rekov iz minimuma v omejenem casovnem intervalu, ki bi jo bilo zanimivo primerjati z izsledki prav tako casovno omejenega terenskega zapisovanja kot dopolnilne raziskave.
Lyons (1994.) povezuje značenje i komunikaciju i drži da se značenje ne može teorijski objasniti, niti empirijski ovjeriti bez oslonca na jezik u uporabi. Što su naredbe prema Lyonsu i kakvo značenje ...prenose? To su izričaji koji nameću, predlažu neki tijek radnje ili obrazac ponašanja i indiciraju da bi se ono trebalo ostvariti. Odlika je dobre zapovijedi da je kratka i potpuno razumljiva svakome kome je namijenjena. K tome mora biti jednoznačna i precizna. Razumijevanje i izvršavanje naredaba vrlo je važno u pomorstvu. Kontrastivno (engleski izvorni jezik, hrvatski ciljni jezik) analizirano je 57 uzvičnih rečenica naredaba na brodu iz korpusa američkoga popularnog romana 19. stoljeća (Dragojević, 2007.). Naime, u romanu Moby Dick (autor Herman Melville) istraživale su se onodobne zapovijedi na engleskome i pripadajući prijevodi na hrvatski jezik (prevoditelji Zlatko Gorjan i Josip Tabak, 1985.). Zapovijedi su klasificirane po značenjskim skupinama. Književni prevoditelji bave se duhom obaju jezika (engleskoga i hrvatskog), pa se njihovim prijevodima može koristiti u komparativnoj lingvističkoj stilistici. Time se u izvornom tekstu uočavaju one stilske osobitosti koje se ne mogu postići u tekstu ciljnoga jezika, zato što najjače očituju vlastitost jednoga jezika (Bonačić, 1999.). Tehnološki napredak u pomorstvu vidljiv je u jeziku naredaba. U doba jedrenjaka kapetan broda morao je izdati jasnu zapovijed svojemu podređenom časniku koje uže pritegnuti ili otpustiti (Stolac, 1998.). Pogreške su mogle biti kobne. Danas Međunarodna pomorska organizacija propisuje standardne naredbe za kormilarenje i upravljanje strojem, i to na engleskom jeziku. Rad daje pregled naredaba originala i prijevoda romana Moby Dick te ih uspoređuje s onima na engleskome i hrvatskome propisanima za današnju upotrebu.
This paper draws on the argument that prototype theory provides a more efficient EFL grammar tutorial for Serbian students. In line with R. W. Langacker (1991) and G. Leech (1994, 2000), if corpus ...linguistics and data driven learning are embraced by the theory, it will significantly enhance the understanding of English verb tenses for students. The major advantages of the novel EFL teaching methodology, namely the prototype driven approach to teaching English verb tenses, are (i) its potential to offer a new view of the verb tense system by mapping out a number of interwoven strands common to different tenses and, (ii) the complete abandonment of the narrowness of the traditional (classical) approach which asserts that tenses should be established by temporal adverbials.
Cilj je ovog rada ispitati značenje riječi musliman ili njemačkog Muslim i odgovoriti na pitanje može
li se značenje te riječi u rječnicima mapirati s pomoću klasične distribucijske analize te mogu ...li se tom
metodom odrediti i još neka značenja. K tomu, donosi se i jednostavna metoda distribucijske značenjske
analize. Istraživanje kreće od česte pretpostavke u korpusno utemeljenoj semantici i leksikografiji da se
značenje riječi razumijeva iz konteksta te se na taj način mogu prepoznati polisemija i sinonimija. Članak
proučava četiri mrežna korpusa za bosanski, hrvatski, njemački i srpski jezik. Prvo se analizira kontekst, uz
pretpostavku da sintaktičke strukture imaju inherentno značenje u određenom okružju. Tako se pridjevski
atributi koriste za analizu obilježja ključne riječi, koordinandi se koriste kao pokazatelji relevantnih
kategorija, a glagoli uz koje ključna riječ ima funkciju subjekta ili izravnog objekta koriste se kao pokazatelji
tipičnih radnji koje izvršava ili trpi ključna riječ. U drugom se koraku grupiraju leksemi koji se pojavljuju u
ta četiri okružja te se određuju značenjske dimenzije ključne riječi.
Rezultati sugeriraju da distribucijska metoda u načelu može prilično dobro mapirati rječničke definicije,
no samo kada je riječ o okružju koje uključuje strukture s atributima i koordinaciju, a ne i kada se radi o
sintaktičkim konfiguracijama usko vezanima uz radnju, odnosno glagol. Gledano u cjelini, najistaknutije
su značenjske dimenzije leksema one koje se tiču članova vjerske zajednice, članova regionalne etničke
skupine te iskušene ili potaknute agresije. Po tom se pitanju četiri korpusa značajno razlikuju: uporaba
u njemačkome gotovo se isključivo odnosi na vjerske vidove pojma dok preostali korpusi sadrže etničku,
odnosno regionalnu komponentu te diskurs o agresiji, koja je u njemačkome uglavnom verbalna, a u
drugim korpusima fizička. Neutralne značenjske komponente riječi musliman prisutne su samo u korpusu
bosanskog jezika.
U ovome radu predstavljamo dijakronijsku i sinkronijsku analizu konstrukcija s uzdižućim predikatima (engl. raising predicates) i konstrukcija s ekstrapozicijom u povijesnoj bazi Brown Corpus i ...suvremenijoj English Web Corpus 2015. Počinjemo utvrđivanjem dviju dijakronijskih činjenica: 1. uzdižuće (engl. raising) konstrukcije koriste se puno češće od semantički ekvivalentnih inačica s ekstrapozicijom, i 2. distribucija uzdižućih konstrukcija i ekstrapozicije – prilično iznimno u usporedbi s drugim strukturama koje dopuštaju varijaciju finitno/nefinitno – dijakronijski je dosljedna od početka 20. stoljeća sve do 2015. godine. Ovu jedinstvenu dijakronijsku distribuciju potom dopunjavamo analizom suvremenijega korpusa koja pokazuje da izborom između ovih dviju semantički ekvivalentnih konstrukcija upravljaju različiti strukturalni čimbenici svojstveni svakoj od njih. Konkretno, pokazujemo da se uzdižuća konstrukcija često koristi kao relativna rečenica, dok se inačica s ekstrapozicijom u toj sintaktičkoj ulozi rijetko javlja. Nasuprot tomu pokazujemo da se istaknut čimbenik u korist ekstrapozicije odnosi na oznaku niječnosti koja se podjednako često smješta i u glavnu i u uklopljenu rečenicu u slučaju konstrukcije s ekstrapozicijom, nasuprot uzdižuće inčice u kojoj se oznaka niječnosti javlja gotovo isključivo u glavnoj rečenici. Konačno, pokazujemo da konstrukcije s ekstrapozicijom češće sadrže modalne glagole u glavnoj rečenici nego li uzdižuće inačice te tu opservaciju povezujemo s idejom da je rečenična struktura konstrukcija s ekstrapozicijom strukturalno prikladnija za izražavanje nesigurnosti/uvjetnosti.
Popravljanja so majhen, a pomemben mehanizem in strukturna enota spontano tvorjenih izjav. Pri analizi izhajam iz pristopov analize diskuza, predvsem konverzacijskih analiz. Popravljanje je ...retrogradna struktura - z vidika dogajanja na sintagmatski osi jo zaznamuje premik nazaj. Analiza pragmatičnih vidikov pa kaže, da so razlog za popravljanja običajno dogajanja v psihološki dimenziji diskurza, natančneje namera govorca, da besedilo uskladi s spremenjeno strategijo, da popravi napako ali težave pri izrekanju. Analiza strukture popravljanj pokaže, da ta vključujejo tri obvezne elemente: popravljeno, prekinitev in popravek, pogosto pa je med prekinitvijo in popravkom še eno ali več popravljalnih sredstev. V gradivu za nalizo, govornem korpusu telefonskih pogovorov v turizmu, je popravljanje izvedeno v 8 % vseh izjav.
Na osnovi dveh obsežnih in primerljivih korpusov, Britanskega in Češkega narodnega korpusa, se v razpravi preverja hipoteza, da se vsaj nekatere stalne besedne zveze ukvarjajo s posebnimi uvajalnimi ...sredstvi. Avtor pregleda 20 najpogostejših rečenic in 20 kolokacijskih rekel in hipoteza se izkaže za pravilno. Poleg teh osnovnih rezultatov razišče tudi naravo in vedenje uvajalnih sredstev, kar mu omogoči delitev na oblikovni in pomenski tip. Pokažejo se tudi nekatere pomembne razlike med angleščino in češčino v rabi teh sredstev. Avtor predlaga, da bi bilo v prihodnje v raziskavo s tega stališča dobro pritegniti več jezikov.
Korpusna lingvistika zauzela je nezamjenjivo mjesto u suvremenoj leksikografskoj praksi. U ovome radu riječ je o korpusima, posebice računalnim korpusima, jezičnim tehnologijama i alatima, te o ...primjeni korpusne lingvistike, osobito u suvremenoj leksikografiji. Posebno je poglavlje posvećeno korpusnoj lingvistici u Hrvatskoj, njezinim početcima, ali i suvremenim projektima i postignućima.