V prispevku predstavljamo rešitve za prepoznavanje in označevanje zaznamovanega besedišča v okviru koncepta odzivnega Slovarja sopomenk sodobne slovenščine. Ker gre za prvi tovrstni projekt, so ...pripravljene rešitve v veliki meri inovativne, umeščene pa v okvir problematike avtomatske strojne izdelave slovarja, njegove odprtosti in vključenosti uporabniške skupnosti. Prispevek prikazuje postopek prepoznavanja sovražnega in grobega besedišča ter pripis oznak, opozorilnih ikon in daljših pojasnil. Ukvarjamo se tako s tehničnimi kot vsebinskimi vprašanji označevanja. Vsebinsko oznake temeljijo na sporočanjskem namenu in učinku, pri čemer je njihovo bistvo informacija o možnih posledicah rabe, pri tehničnih rešitvah pa veliko pozornost posvečamo digitalnemu mediju in vizualizaciji rešitev v njem. Ker je odzivnost eden ključnih konceptov slovarja, se pri rešitvah glede označevanja zavedamo pomembnosti sodelovanja z uporabniško skupnostjo, zato tudi pri dodajanju oznak predlagamo rešitve za sodelovanje s skupnostjo. Izhodiščni konferenčni prispevek je bil razširjen v vseh poglavjih, dodano pa je povsem novo poglavje o obdelavi večpomenskih iztočnic, njihovi pomenski členitvi in pomenskem opisovanju z zgledi pomenov z negativno zaznamovanostjo.
V prispevku so predstavljeni zasnova in uresničitev narečnega tematskega slovarja, ki mu nove tehnološke možnosti omogočajo, da je spletni oziroma e-slovar, interaktivni (z multimedijskimi vsebinami) ...in rastoči (dopolnjujoči), poleg tega pa ima tudi estetsko celostno grafično podobo, kar vse vpliva na potencialne uporabnike.
The paper presents the design and implementation of a thematic dialectal dictionary that uses new technological possibilities of e-media to be transformed into an e-dictionary. It is web-based, interactive (with multimedia content), and growing (supplementing articles), it has an aesthetic graphic identity. All this influences the potential endusers.
Ovaj članak predstavlja koncept i realizaciju dijalektnoga tematskoga rječnika, kome elektronički medij nudi mogućnost da bude online ili e-rječnik, interaktivan (s multimedijskim sadržajima) i komplementaran, a također da ima integriran estetski grafički dizajn, što sve utječe na potencijalne korisnike.
V prispevku obravnavamo razlike med terminografijo in leksikografijo ter pojasnjujemo, v čem se terminološki in splošni razlagalni slovarji razlikujejo. Ukvarjamo se s slovarsko obravnavo ...leksemov, ki imajo v matičnih strokah status terminov, hkrati pa so se že uveljavili v besedilih, namenjenih splošnim uporabnikom, in se determinologizirali, pri čemer predstavljamo nekatere težave, s katerimi se zaradi determinologizacije srečujemo pri opisu leksike v splošnih razlagalnih in v terminoloških slovarjih. Opozarjamo tudi na zadrege uporabnikov pri uporabi obeh omenjenih tipov priročnikov.
V razpravi so predstavljena in analizirana slovenska prostodostopna terminološka spletišča in spletne strani nekaterih terminoloških slovarskih projektov, ki se razlikujejo po številu virov oziroma ...strokovnih področij, zasnovi, številu avtorjev, obsežnosti itd. Glavni namen je bil ugotoviti možnosti predstavitve raznolikih terminoloških virov v novem terminološkem portalu, pri čemer je treba upoštevati, da imajo različni uporabniki terminologije različne potrebe.
Prispevek izhaja iz projekta snovanja novega velikega slovensko-madžarskega slovarja, pri katerem je bila za namene priprave koncepta potrebna tudi analiza obstoječih dvojezičnih virov za ta ...jezikovni par. Tako prispevek najprej ponudi krajši zgodovinski pregled slovensko-madžarskega slovaropisja, od prvih zbirk narečnih besed, glosarjev do frazeoloških zbirk in slovarjev. Sledi pregled dvojezičnih slovarjev za jezikovni par slovenščina-madžarščina in madžarščina-slovenščina. Prispevek se nato osredotoči na primerjavo treh najpogosteje uporabljanih slovensko-madžarskih slovarjev, in sicer slovensko-madžarskega dela slovarja Elizabete Bernjak iz leta 1995, Slovensko-madžarskega slovarja Jožeta Hradila iz leta 1996 ter slovensko-madžarskega dela Hradilovega navzkrižnega slovarja iz leta 2012. Slovarji so primerjani z vidika obsega, geslovnika, predstavitve iztočnic, zaglavja ipd. Primerjani so tudi različni elementi slovarske mikrostrukture, od prevedkov do ponazarjalnega gradiva. Nato je opravljena kratka študija izrazja, ki ga najdemo v e-zbirkah izrazov in ki naj bi odsevalo potrebe izobraževalnih ustanov na dvojezičnem območju. Temu sledi pregled izbranih primerov dobrih praks sodobne dvojezične leksikografije, kot je pri nas npr. Veliki angleško-slovenski slovar Oxford-DZS, v tujini pa dvojezični slovarji založb Oxford in Collins. Pri pregledu predvsem izpostavimo elemente, ki najbolje kažejo sodobne pristope izkoriščanja prednosti digitalnega medija in so posledično najbolj relevantni za snovanje Velikega slovensko-madžarskega slovarja.
Prispevek opisuje izdelavo najnovejšega splošnega slovarja poljskega jezika: Veliki slovar poljskega jezika Poljske akademije znanosti (Wielki słownik języka polskiego PAN). Vodilni partner projekta ...je Inštitut za poljski jezik, pri projektu pa sodelujejo tudi jezikoslovci in leksikografi s številnih poljskih akademskih ustanov. Prispevek na kratko predstavlja zgodovino projekta in glavne značilnosti slovarja. Opisana je tudi organizacija dela in naloge, ki jih opravljajo posamezni člani ekipe. Prispevek dalje prikazuje spletno zasnovo slovarja in dele spletnega vmesnika, npr. različne načine iskanj. V zaključku so navedeni načrti za prihodnost, ki vključujejo tako dodajanje novih iztočnic oziroma novih informacij obstoječim iztočnicam kot tudi izboljšavo leksikografskih postopkov z uporabo sodobnih jezikovnotehnoloških orodij.
V leksikogramatični raziskavi so predstavljeni rezultati analiz struktur s prislovi, ki so bile izvedene v okviru temeljnega raziskovalnega projekta Kolokacije kot temelj jezikovnega opisa: ...semantični in časovni vidiki (KOLOS; J6-8255). Na podlagi rezultatov predhodno izvedene pilotne množičenjske naloge, v kateri so označevalci jezikoslovci ocenjevali avtomatsko izluščene kolokacijske kandidate iz korpusa Gigafida in se opredeljevali do tega, kaj je in kaj ni slovarsko relevantna kolokacija, smo analizirali vse kolokacijsko produktivne strukture s prislovi. Namen analiziranja je bil opredeliti kolokacijo kot semantično relevantno sopojavitev dveh (ali več) besed ter s tem tudi razliko med slovarsko relevantnimi kolokacijami in statistično prepoznanimi oz. šibkejšimi kolokacijami, ki ne opravljajo semantične funkcije in so posledično nerelevantne za kolokacijski slovar.
Analize struktur s prislovi so pokazale, da se je o semantični relevantnosti in slovarski vključenosti pri posameznih primerih kolokacijskih kandidatov ali tipih kolokatorjev treba odločati na ravni posamezne strukture. Tovrstni primer so prislovi, ki lahko nastopajo v vlogi intenzifikatorja (tip kar pošteno načeti) ali pa semantično manj relevantni vlogi poudarnosti oz. členkovnosti (tip kar prekiniti). Podobne jezikoslovne obravnave so potrebne širše skupine števniškosti, kot je kratnost ali zaporedje (zaporednostni prislovi), ki jih zaradi raznolike semantične relevantnosti ne moremo strukturno omejiti (četrtič doktorirati proti stokrat povedati).
Podatki, pridobljeni na podlagi opravljenih analiz, bodo omogočali podrobnejše ali nadaljnje analize, predvsem pa celovit opis vsake kolokacijske strukture in njene kolokativnosti. Na podlagi identificiranih napak zaradi avtomatskega označevanja strukture pa bo mogoče nadgraditi obstoječe vzorce za luščenje in predvsem izboljšati avtomatsko luščenje za problematične strukture. Podatki bodo zelo uporabni tudi pri nadaljnjem vključevanju in obravnavi novih struktur, prvotno izločenih zaradi precejšnjega šuma. Vse ugotovitve bo mogoče implementirati v leksikografski delotok in na ta način izboljšati podatke (stopenjskost gesel) v slovarju. Učno množico s 17.576 kandidati bo mogoče uporabiti tudi v drugih dejavnostih projekta KOLOS: za uvrščanje kolokatorjev v gruče, primerjavo sopomenk s kolokacijami in nenazadnje za proučevanje kolokacijskih trendov skozi čas.
V prispevku obravnavamo definicije leksemov rdeče (rouge) in infrardeče (infrarouge), ki sta si navidezno blizu na ravni označenca in označevalca. Kar razlikuje pomen obeh besed, ni le raba in ...sprejemanje (splošno védenje proti ekspertnemu znanju), pač pa tudi drugačen način razumevanja, saj se pomen leksema infrardeče (infrarouge) nanaša na realnost, ki je z vidom ne moremo zaznati. V primeru infrarouge se znanstvena definicija zdi nujna, pomen leksema rdeče pa pripada splošnemu besedišču. Definicija besede rdeče (rouge) pravzaprav predmetom pripisuje kromatične lastnosti, ki jih z znanstvenega vidika nimajo; v fiziki namreč barva ni lastnost predmeta, pač pa dolžina valov.
Računalniški modeli končnih pretvornikov omogočajo zgoščeno predstavitev slovarjev izgovarjav, ki jih uporabljajo tako sintetizatorji govora kot tudi razpoznavalniki govora. V članku je predstavljen ...nov tip končnih pretvornikov, t. i. končni super pretvorniki, s katerimi lahko slovarje izgovarjav predstavimo z manjšim številom stanj in prehodov kot z uporabo običajnih minimalnih determinističnih končnih pretvornikov. Predstavljen je učinkovit postopek gradnje končnih super pretvornikov, ki ohranjajo svojo determinističnost, poleg besed iz danega slovarja izgovarjav pa lahko sprejmejo in pretvorijo tudi nekatere druge besede, ki niso bile zastopane v izvirnem slovarju. Oddani izhodni fonetični prepisi za določene sprejete izvenslovarske besede so sicer lahko napačni, vendar se izkaže, da je napaka pri pretvorbi primerljiva z napakami, ki jih dosegajo trenutno najboljše metode za samodejno grafemsko-fonemsko pretvorbo besed za slovenski jezik. Za preizkus in preverjanje predlaganega postopka gradnje končnih super pretvornikov je bil uporabljen slovar izgovarjav SI-PRON za slovenski jezik, ki vsebuje več kot milijon različnih slovarskih vnosov. Rezultati poskusov so med drugim podali presenetljivo ugotovitev, da se velikost končnih pretvornikov z naraščanjem obsega slovarja prek določenega števila besed prične zmanjševati, kar pripisujemo predvsem velikemu številu pregibnih oblik besed v slovenščini.
Potreba po večji prisotnosti narečnih vsebin na spletu in njihovi interaktivni multimedijski predstavitvi, predvsem strokovno zasnovanih dialektoloških virov in orodij, je spodbudila ...interdisciplinarno sodelovanje različnih fakultet Univerze v Ljubljani, zlasti Filozofske fakultete (FF) in Fakultete za računalništvo in informatiko (FRI), ki je v letih 2017 in 2018 obrodilo sadove v obliki treh prostodostopnih in odprtokodnih spletnih aplikacij o slovenskih narečjih – to so Slovenski narečni atlas (SNA, 2017), Interaktivna karta slovenskih narečnih besedil (IKNB, 2018) in Slovar starega orodja v govoru Loškega Potoka (SSOLP, 2018). Članek v prvem delu prinaša splošen pregled slovenskih spletnih dialektoloških virov in orodij, v drugem delu pa podrobnejšo predstavitev funkcionalnosti navedenih treh aplikacij, ki so uporabnikom trenutno na voljo. V diskusijskem delu pregleda je izpostavljen del okoliščin nastanka obravnavanih aplikacij in z nastankom povezanih omejitev, nakazane pa so tudi možne rešitve, ki bi jih veljalo preudariti za zagotovitev njihovega dolgoročnega razvoja.