V prispevku skušamo osvetliti medsebojno delovanje dejavnikov, ki vplivajo na besedni red v slovenskem in italijanskem jeziku. Oba jezika imata osnovni besedni red enak, torej osebek-povedek-predmet ...(SVO), a sta vendarle zelo različna, saj gre za analitični in sintetični jezik ter za romanski in slovanski. Besedni red se v jezikovnem paru razlikuje po stopnji svobode, s katero se lahko udejanjijo posamezne različice upovedenega. Preveriti skušam tezo, da na slovenski besedni red v večji meri vplivajo pragmatični in semantični dejavniki kot pa slovnični, nasprotno pa na italijanski besedni red bolj vplivajo slovnični dejavniki od drugih. Analiza zajema besedni red v stavkih, v katerih so prisotni vsi trije elementi, torej S, V in O, in skuša pojasniti variabilni besedni red, ko sta v stavku prisotna zgolj dva od elementov, torej S in V ali O in V. Vzroki za besedni red VS/SV ali OV/VO so rezultat prepleta zgoraj omenjenih dejavnikov.
Od 25. do 27. novembra 2015 je v dvorani GIAM ZRC SAZU v Ljubljani potekala znanstvena konferenca Slovenščina na spletu in v novih medijih. Konferenco so v okviru temeljnega raziskovalnega projekta ...JANES, ki ga med letoma 2014 in 2017 financira Javna agencija za raziskovalno dejavnost Republike Slovenije, soorganizirali Filozofska fakulteta Univerze v Ljubljani, Slovensko društvo za jezikovne tehnologije, slovenska raziskovalna infrastruktura za jezikovne vire in tehnologije CLARIN.SI in regionalna iniciativa za jezikovne podatke RelDI. Prvi dan konference je bil namenjen celodnevnemu seminarju iz statistike za jezikoslovce, ki ga je vodila doc. dr. Maja Miličević z Univerze v Beogradu. 25 udeležencev se je seznanilo z osnovami kvantitativnih metod v korpusnem jezikoslovju, opisno in inferenčno statistiko, prav tako pa tudi z načini vizualizacije jezikovnih podatkov in programskega paketa R. Gradivo s seminarja je dostopno na konferenčni spletni strani.
Gre za domicilno znanost - slovenski prostor je sredisce tovrstnega raziskovanja; nikjer drugje na svetu ne more biti tako razvite slovenistike pa tudi ne sistematicnega, celovitega raziskovanja ...znanstvenih podrocij, ki jih zajema nacionalna humanistika. 2.1 Nepriznavanje oz. omalovazevanje tega dejstva ima daljnosezne posledice. Kot kaze, je temeljna motnja dejstvo, da je vse to napisano v uradnem jeziku drzave, v slovenscini - pac v smislu slovenske univerze, slovenisticne stroke, ki se zaenkrat se lahko postavlja ob bok studijem nacionalnih jezikov v drugih drzavah, in slovenskih studentov, danes se posebej z zivo zavestjo, da vsem, ki iz tujine prihajajo k nam studirat tudi zato, ker jih zanima kulturna in sicersnja specifika tega prostora. Nic ne pomaga, da gre za revijo, ki obravnava kompleksna jezikoslovna in literarnovedna vprasanja in kot taka predstavlja pomemben vir slovenisticno-slavisticnega studija. -
Prispevek se osredotoča na vprašanje izražanja spolske korelacije pri položajnih poimenovanjih v ruščini in slovenščini. Opozarjamo na tri posebnosti pri rabi ženskih poimenovanj za poklice v ...ruščini. Ruščina ima v nezaznamovani rabi manj feminativov. V kontekstih z zmanjšano stopnjo referenčnosti se v ruščini pogosteje kot v slovenščini uporabljajo moška poimenovanja. Pri nekaterih položajnih poimenovanjih se v ruščini pojavlja raba t. i. dvospolskih samostalnikov, ki sodijo v prvo deklinacijo, a lahko označujejo oba referenčna spola. Prispevek analizira skladenjske rabe dvospolskih samostalnikov in stanje v sodobni ruščini primerja z ustreznicami v slovenščini.
Namen prispevka je zastaviti izhodiščna merila za čim bolj jasno prepoznavanje medmetov in za posledično čim bolj jasno razločevanje zlasti med medmeti in členki v nastajajočem novem razlagalnem ...slovarju knjižne slovenščine. Obravnava najprej komentira tipologijo medmetov in predstavlja teoretična merila za ločevanje medmetov zlasti od členkov, praktična slovarska predstavitev medmetov pa je pospremljena z novo tipologijo slovarskih razlag za medmete in s problemskimi komentarji.
Jezikoslovne razlike med slovenskim slovničnim in angleškim semantičnim spolom so razlog za različen pristop teh dveh jezikov k širšemu družbeno-kulturnemu vprašanju neseksistične rabe jezika: (prvi ...počne to s spolno specfičnimi oblikami za ženski in moški spol, drugi z njihovo nevtralizacijo). Prispevek obravnava najbolj kritična področja neseksistične rabe jezika ter predstavi in kritično ovrednoti predloge, ki tako rabo ozaveščajo in spodbujajo.
Prispevek predstavlja razvoj prosto dostopnih modelov za prepoznavanje in klasifikacijo imenskih enot za hrvaški in slovenski jezik. Poskusi se osredotočajo na najbolj informativne jezikovne ...lastnosti, pri čemer upoštevajo dostopnost jezikovnih orodij za oba jezika. Poleg standardnih jezikovnih lastnosti so upoštevane tudi distribucijske lastnosti, ki so bile izračunane iz velikih neoznačenih enojezičnih korpusov. Uporaba distribucijskih lastnosti izboljša rezultate za 7-8 točk v meri F1, uporaba oblikoslovnih informacij pa dodatno za 3-4 točke, in to pri obeh jezikih. Najboljši naučeni model skupaj s testno množico za primerjavo z obstoječimi in bodočimi sistemi ter model za oblikoslovno označevanje hrvaščine s programom HunPos so dostopni za prenos za uporabo v znanstvene in komercialne namene.
V prispevku analiziramo dvoje: (a) vključevanje besedil z interneta v obstoječe referenčne korpuse, ki ga soočamo z obstojem spletnih korpusov, ter (b) dva najnovejša korpusa slovenščine: korpus ...Gigafida, ki ga pretežno sestavljajo tiskana besedila, v manjši meri pa tudi spletna, in korpus slWaC, ki je v celoti sestavljen iz spletnih besedil. Najprej ugotavljamo podobnosti in razlike med njima z metodo tematskega modeliranja, nato pa isto metodo apliciramo še na posamezne taksonomske kategorije Gigafide. Prvi del analize je pokazal, da je ravnanje sestavljalcev referenčnih korpusov v zvezi z vključevanjem internetnih besedil v korpuse, ki naj bi kazali celovito podobo nekega jezika, trenutno še neenotno, če pa se zanj že odločijo, je nabor vključenih žanrov praviloma širok. Drugi del analize je pokazal dokajšnjo tematsko različnost Gigafide in slWaCa ter izpostavil najznačilnejše teme, ki jih pokriva vsak od šestih Gigafidinih delov.