Knjižnica tehniških fakultet, Maribor (KTFMB)
  • Algoritmi v spletnih iskalnikih : magistrsko delo
    Login, Samo
    Spletni iskalniki so orodja, katera uporabljajo prav vsi uporabniki interneta. Ker je internet doživel visoko rast, lahko informacije o praktično vsem najdemo tudi na spletu. Najhitrejša pot do ... želene informacije pa so ravno spletni iskalniki. Spletni iskalniki po svoji naravi spadajo med orodja za izbiranje informacij (Information Retrieval), ki so se v preteklosti uporabljala v razne druge namene (z začetkom v knjižničarstvu). Njihova največja moč je, da so sposobni najti želeno informacijo med milijoni ali celo milijardami dokumentov, ki ležijo bolj ali manj neurejeno po spletnih strežnikih širom sveta. Srce iskalnikov so algoritmi, ki omogočajo hitro iskanje po celotnem besedilu dokumentov v delčku sekunde. Najpomembnejša sestavina iskalnikov, ki predstavlja konkurenčno prednost, pa je rangiranje dokumentov v rezultatih iskanj, saj če iskalnik vrne na tisoče dokumentov, ki so slabo rangirani (torej uporabniku ne prikaže najprej naj ustreznejših dokumentov za njegovo iskalno poizvedbo), to uporabniku ne pomaga kaj dosti. Tehnologija iskalnikov se iz leta v leto izboljšuje - boljši izpodrivajo slabše. Magistrsko delo predstavlja algoritme, katere za iskanje uporablja iskalnik Najdi.si, pri razvoju katerega sem sodeloval tudi jaz in sem avtor večine algoritmov, katere uporablja ta iskalnik. Za primerjavo so predstavljeni tudi algoritmi iskalnika Google, ki je v zadnjih letih izpodrinil konkurenco in prevzel prvo mesto med svetovnimi iskalniki. Primerjava algoritmov je zanimiva, saj sta iskal nika v nekaterih pogledih precej različna: Najdi.si indeksira le majhno podmnožico svetovnega spleta (slovenske dokumente) in je prilagojen slovenščini, medtem ko Google indeksira celotni svetovni splet in so njegovi avtorji zaradi tega morali sprejeti določene kompromise. Opisani so algoritmi za:.pajkovanje (Problem pajkovanja z omejenim prostorom, kot tudi pajkovanje po neomejenem prostoru interneta, ki je vsekakor prevelik, da bi lahko obiskali vse dokumente.),indeksiranje (Predstavljene so metode, s katerimi povečamo priklic in posledično zmanjšamo natančnost iskanja ter kako graditi indeks, da bo iskanje dovolj natančno in hitro hkrati.),iskanje (Razčlenjevanje iskalne poizvedbe ter sestavljanje rezultatnih množic za posamezne besede v končni rezultat), predlog črkovalnika (Algoritmi, s katerimi iskalnik uporabniku predlaga popravke iskalne poizvedbe, kadar iskalnik zazna možnost, da se je pri pisanju iskalne poizvedbe uporabnik "zatipkal".)... Predstavljena je tudi problematika gradnje porazdeljenih iskalnikov, ki danes tečejo na multiračunalnikih, saj je uporaba veliko poceni računalnikov najcenejši način, da omogočimo iskanje po vseh besedah več milijonov ali celo milijard dokumentov. Z gradnjo particioniranega porazdeljenega indeksa pa poleg povečanja obsega (v smislu števila indeksiranih dokumentov) iskalnega indeksa lahko dosežemo tudi večje zmogljivosti (v smislu prepustnosti oziroma številu izvedenih iskanj na sekundo) in večjo zanesljivost (tako da isto particijo indeksa streže več računalnikov, ki so del multiračunalnika).
    Vrsta gradiva - magistrsko delo
    Založništvo in izdelava - Maribor : [S. Login], 2005
    Jezik - slovenski
    COBISS.SI-ID - 9837334

Signatura – lokacija, inventarna št. ... Status izvoda Rezervacija
pisarna A-003 (FERI) MD LOGIN S. Algoritmi pisarna A-003 (FERI) MD LOGIN S. Algoritmi prosto - za čitalnico
loading ...
loading ...
loading ...