U većini se dosadašnjih pravopisa hrvatskog jezika ne navode pravila transkripcije hebrejskog
jezika. Jedina je iznimka pravopis Badurine, Markovića i Mićanovića. Nijedan dosadašnji
pravopis ...hrvatskog jezika ne navodi pravila transkripcije jidiša. Kako se danas se češće
srećemo s riječima tih jezika izvan uobičajenog korpusa prenesenog nam prijevodom Biblije,
u članku se navode prijedlozi pravila transkripcije (ne transliteracije!) za oba jezika.
full article and abstract in Lithuanian; abstract in English
The Lithuanian historical corpus consists of machine-readable texts, transcribed according to the principles of documentary edition; the ...original spelling and the language features it encodes are preserved. Several orthographic systems were used during the various stages of the history of Lithuanian language, and some of them differ from the modern one to a relatively great extent. The historical orthography does not allow the use of language analysis tools, which were developed on the basis of the modern spelling. A link is therefore needed that would connect the historical orthography to the modern orthography used today.
In normalizing spelling, various challenges must be dealt with: the same grapheme must be differently realized without changing the orthography and by rewriting the form in the modern Lithuanian alphabet. At the same time, the normalization of phonetics has to be carried out, which includes the elimination of dialectal phonetic features and the representation of phonemes in the assimilated position. These principles can be used in constructing a universal search engine, in which queries can be processed across different orthographic systems (http://sr.lki.lt).
The size of the corpus and the available limited resources stimulate the search for an automated way of normalizing orthography. A set of rules was developed based on the empirical research on the history of orthography; these rules were then arranged hierarchically in accordance with the length of the sequence of processed characters, their implementation being limited to using the metadata according to the spelling features of a particular source. A 82–97% accuracy level of correct normalization was achieved.
The advantage of a rules-based transliteration is the consistency of changes; the disadvantage can be seen in generating not a single but several equivalents of the word, and the ambiguous rules in certain cases generate many tokens that do not exist in the natural language. The number of generated forms being fed to the search engine was reduced based on non-existent letter sequences and by narrowing the query alphabet. A further selection of the correct forms could be done using dictionaries or tools for analyzing the morphology and syntax of modern Lithuanian.
straipsnis ir santrauka lietuvių kalba; santrauka anglų kalba
Lingvistinei analizei reikia skaitmeninių tekstų, tinkamų programiniam apdorojimui. Lietuvių kalbos instituto duomenų bazei senieji raštai skaitmeninami laikantis dokumentinio perrašo principų, nekeičiant originalo rašybos. Senoji rašyba dažnai yra variantiška, nenusistovėjusi ir gerokai skiriasi nuo dabartinės, tai trukdo pritaikyti technologijas, kuriamas dabartinei lietuvių kalbai tirti. Straipsnyje aprašomas empirinėmis taisyklėmis paremtas būdas iš žodžių formų senąja rašyba automatiškai sugeneruoti formas dabartine rašyba perraše išlaikant originalios rašybos ypatybes. Sugeneruoti atitikmenys naudojami paieškos sistemoje.
V članku se - predvsem na zgledu priimkov - obravnavata dva sklopa problemov: a) slovenjenje ruske zveze 'soglasnik + e' in slovenjenje zveze 'soglasnik + ë' ter b) vprašanje razkoraka med latiničnim ...prečrkovanjem imen in priimkov, kot se pojavlja v potnih listih državljanov Ruske federacije in Ukrajine, in zapisom teh imen po slovenskih pravilih prečrkovanja oz. podomačenja.
Prema prenošenju imenâ iz ruskoga i drugih jezika koji se služe svojim ćirilicama već stotinjak godina u hrvatskim pravopisnim priručnicima pristupa se na razne načine. Danas se u pisanju ...»ćiriličnih« imena jako osjeća engleski filter.
U radu se donose transkripcija i transliteracija novoidentificiranoga 3. lista i fotografije recto stranice 5. lista Statuta bratovštine Majke Božje Goričke s početka 15, stoljeća te se, s obzirom na ...sadržaj, utvrđuje njihov smještaj u potpuno dekonstruiranu izvornom rukopisu.
Prema prenošenju imenâ iz ruskoga i drugih jezika koji se služe svojim ćirilicama već stotinjak godina u hrvatskim pravopisnim priručnicima pristupa se na razne načine. Danas se u pisanju ...»ćiriličnih« imena jako osjeća engleski filter.
U radu se obrazlažu problematika i promišljanja u rješavanju pristupnica povezanih s uporabom jedinstvenih stvarnih naslova anonimnih klasičnih djela vjerskog sadržaja. To se, u prvom redu, odnosi na ...čl. 17 Pravilnika i priručnika za izradbu abecednih kataloga Eve Verone te većinu njegovih točaka koji nam nalažu izbor pristupnica za svete knjige kao i za dijelove svetih knjiga muslimana, budista, židova i drugih nekršćanskih vjerskih zajednica. Kao jedinstveni naslovi uzimaju se uobičajeni stvarni naslovi što se smatra zastarjelim poimanjem. Navedene članove potrebno je uskladiti sa suvremenim znanstvenim spoznajama, uzimajući u obzir i praksu nacionalnih knjižničarskih zajednica u kojima je uvriježeno da, za razliku od Biblije, nemaju sve svete knjige svoje sastavne dijelove. Jedinstvene stvarne naslove svetih knjiga potrebno je izrađivati na izvornom nacionalnom jeziku i pismu njihova nastanka. Transliteracija u pripadajuće latinizirane znakove u potpunosti je dostupna putem standarda Unicode. U radu su navedeni i predstavljeni primjeri pristupnica za Bibliju, Kur’an, Tanakh i Avestu te njihovih sastavnih dijelova.
U članku autor raspravlja o različitim problemima vezanim uz primjenu staroegipatskog nazivlja u hrvatskim povijesnim znanostima i nastavi povijesti. U uvodnom dijelu rada autor daje pregled ...povijesti staroegipatskog jezika i pisma. U nastavku autor raspravlja o jezičnim problemima vezanim uz obradu staroegipatskih izvora i zbirki muzejskih predmeta. U središnjem dijelu članka autor donosi pregled uporabe staroegipatskog nazivlja u hrvatskim znanstvenim istraživanjima i nastavi povijesti. Kao rezultat autorovih dugogodišnjih istraživanja u završnom dijelu rada predstavljen je prijedlog prvog jedinstvenog nazivlja za hrvatske egiptološke studije. Autor je nazivlje
podijelio u pregledne tablice prema skupinama (preddinastijske kulture, povijesna razdoblja, vladari, gradovi, lokaliteti, bogovi, često korišteni specifični pojmovi). Kao prilog na kraju rada autor je izradio pojmovnik i tumač najvažnijih egiptoloških pojmova i božanstava.
Mjesecoslov Ohridskoga Apostola, srednjobugarskog rukopisa s kraja 12. st. koji je nesumnjivo nastao prema glagoljskom originalu sadrži pod 20. ožujkom jedinstven spomen (“muka s(ve)tomu ep(isko)pu ...Godъpeĉi”), čiju osobu, na temelju datuma i spominjanja biskupskoga dostojanstva, istraživači (arhiepiskop Sergij, P. Vyskočil, H. Miklas i dr.) tradicionalno poistovjećuju sa svetim Kutbertom, biskupom Lindifarnskim († 687.), čije je štovanje u srednjoj Europi povezano s djelatnošću irskih misija. Autor je pokušao pokazati mehanizam preobražaja imena Kutbert u zagonetno “Godъpeĉi” i došao do zaključka da u osnovi leži pogrešno čitanje prepisivača (na razini glagoljskih prijepisa ili u procesu ćirilske transliteracije) koji je spojio glagoljska slova R i T kao Ĉ. Rekonstrukcija imena omogućuje da se istraže neke grafičke osobitosti glagoljskoga originala ovoga rukopisa.
Frane Petrić na latinski je preveo i 1583. tiskao Komentare Metafizike za koje se danas smatra da nisu autentično Filoponovo djelo, nego se njihov autor u literaturi naziva (Pseudo-)Filoponom. Petrić ...ih je, unatoč početnim dvojbama, smatrao autentično Filoponovim.
U članku se izlaže i tumači Petrićeva recepcija (Pseudo-)Filopona na osnovi dvaju citata iz Petrićeva prijevoda Filoponovih Komentara Metafizike, na temelju jednog citata Filopona iz trećeg sveska Peripatetičkih rasprava Frane Petrića i jednog citata iz transliteriranog teksta bečkoga rukopisa. Ključna riječ koje se ponavlja u tim citatima je prilog simbolički (symbolice). Tom riječju (Pseudo-)Filopon izlaže da su pitagorovci na simbolički način govorili o brojevima kao počelima stvarī. U članku
se pokazuje da se takav stav o pitagorovcima može naći i u djelima koja se pripisuju autentičnom Filoponu.
U članku se također iznose spoznaje stečene tijekom postupka transliteracije bečkog rukopisa Cod. Phil. gr. 189 koji sadržava grčki izvornik (Pseudo-)Filoponova Komentara Aristotelove Metafizike. Na listovima 26r–125r nalazi se tekst Aristotelove Metafizike. Od 26r do 46v proteže se tekst 1. knjige (Α). U Hungerovu kataloškom opisu navodi se da ispred f. 32 nedostaje jedan list, ali bez gubitka teksta.
Zatim se navodi da ispred f. 47 nedostaje jedan list na kojem je izgubljen tekst, ali se ne daje identifikacija. Smatramo da iz oskudnih ostataka otrgnutog lista možemo identificirati izgubljeni tekst i s priličnom sigurnošću zaključiti da se radi o početku 5. knjige Aristotelove Metafizike (Ε). Od 47r do 49v nalazi se Aristotelova knjiga α’ ἔλαττον, 6. knjiga (Ζ) počinje na 50r, 7. knjiga (Η) na 71r, 8. knjiga (Θ) na 74v, 9. knjiga (Ι) na 80v, 10. knjiga (Κ) na 87v, 11. knjiga (Λ) na 98r, 12. knjiga (Μ) na 107r i naposljetku 13. knjiga (Ν) počinje na listu 118r i proteže se do 125r.
Od 125v do 129v u katalogu je identificiran Komentar Aristotelova djela De lineis insecabilibus Georgija Pakimera. Na listovima od 130r do 213v nalazi se Komentar na Aristotelovu Metafiziku Ivana Filopona naslovljen Ἐξήγησις τῶν μετὰ τὰ φυσικὰ Ἀριστοτέλους. Opis rukopisa u katalogu donosi početne i završne riječi cjelokupnog Filoponova teksta, bez navođenja na kojim se listovima nalaze počeci komentara na pojedine knjige. Nakon uvida u rukopis možemo definirati raspored (Pseudo-)Filoponovih komentara. Komentar na 1. knjigu (Α) nalazimo na listovima 130r–131r. Uspoređujući grčki tekst rukopisa s tiskanim Petrićevim prijevodom vidimo da je grčki tekst te knjige djelomičan. Izostavljeni su zatim komentari na α’ ἔλαττον, kao i komentari na 2. (Β), 3. (Γ), 4. (Δ) i 5. knjigu (Ε) Aristotelove Metafizike.
Rukopis se na 131v–140r, dakle očito bez gubitka teksta, nastavlja (Pseudo-)Filoponovim komentarom na 6. knjigu (Ζ) Metafizike. Taj smo dio teksta (130r-140r) transliterirali u cijelosti. Na 141r nalazimo zatim (Pseudo-)Filoponov komentar na 7. knjigu (Η), na 146r počinje komentar na 8. knjigu (Θ), na 154r na 9. knjigu (Ι), na 166v na 10. knjigu (Κ), na 174r na 11. knjigu (Λ), na 183v na 12. knjigu (Μ) te na 201v na 13. knjigu (Ν) Aristotelove Metafizike.
Usporedbom grčkoga teksta rukopisa Cod. Phil. gr. 189 s Petrićevim prijevodom, objavljenim u djelu Ioannis Philoponi enarratio in omnes Aristotelis libros, quos Metaphysica appellant. Eam Franciscus Patricius de Graeca, Latinam fecerat (Ferrariae: Ex Typographia Dominici Mammarelli, 1583), utvrdili smo da je grčki tekst djelomičan. Usporedba transliteriranoga teksta iz bečkoga rukopisa s izdanjem Petrićeva latinskog prijevoda otkrila je pojedine razlike između grčkoga rukopisa i objavljenoga latinskog teksta. One su u nekim slučajevima očito posljedica pogrešno pročitanog rukopisa Petrićeva latinskog prijevoda koji je slagaru poslužio kao predložak za tiskano izdanje. U nekim drugim slučajevima te su razlike uzrokovane tradicijom grčkog teksta, to jest razlikama između ovog transliteriranog rukopisa i onog rukopisa koji je Petriću poslužio kao predložak za njegov prijevod na latinski.
Napominjemo da je transliteracija ovoga grčkog rukopisa bila izvanredno iskustvo. Danas se nažalost rijetko poseže za grčkim rukopisima i rijetko se dobiva prilika za obavljanje takvog posla. Ovaj je rukopis zbog obilja tahigrafskih znakova bio poseban izazov. Naravno da nam je od neprocjenjive važnosti u počecima bio Petrićev tiskani latinski prijevod, koji je do kraja rada na rukopisu ostao važan čimbenik kontrole.