Akademska digitalna zbirka SLovenije - logo
(UL)
  • Odkrivanje podskupin v podatkih z več odvisnimi spremenljivkami : doktorska disertacija
    Umek, Lan, 1981-
    Odkrivanje podskupin je uporabno področje analize podatkov, ki teži k odkrivanju zanimivih podmnožic slučajnega vzorca glede na izbrani ciljni koncept. Večina obstoječih algoritmov za odkrivanje ... podskupin je bila doslej razvitih za podatke z eno odvisno dvojiško spremenljivko, zanimivost podskupin pa je predstavljala njena porazdelitvena različnost med podskupino in celotnim vzorcem. V disertaciji razširimo problem odkrivanja podskupin na podatke, kjer je odvisnih spremenljivk več, te pa so lahko mešanega tipa. Podatki te vrste se čedalje pogosteje pojavljajo na različnih znanstvenih področjih, zato je potreba po njihovi primerni analizi čedalje večja. Osrednji del disertacije predstavlja razvoj treh algoritmov s skupnim imenom MRSD (Multiple- Responses-Subgroup-Discovery), prilagojenih za analizo podatkov z več odvisnimi spremenljivkami, ki večinoma povezujejo uveljavljene metode multivariatne statistike in odkrivanja znanj v podatkih. Poleg algoritmov MRSD predlagamo postopek analize odkritih podskupin, ki lahko prepozna najbolj tipične podskupine, algoritme preizkusimo na več sintetičnih domenah in jih primerjamo z algoritmi za napovedno razvrščanje. Empirična študija je pokazala, da so algoritmi MRSD robustnejši na šum v podatkih in prisotnost manjkajočih vrednosti, poleg tega pa pri opisu podskupin uporabljajo bogatejši izrazni jezik. Algoritme MRSD smo v disertaciji preizkusili na treh realnih domenah, in sicer na anketnih podatkih evropske družboslovne raziskave, na medicinski domeni ter pri rezultatih kemogenomskih poskusov na kvasovki. Analiza dobljenih podskupin je pokazala, da so te smiselne in razkrivajo potencialno uporabno znanje.
    Vrsta gradiva - disertacija
    Založništvo in izdelava - Ljubljana : [L. Umek], 2011
    Jezik - slovenski
    COBISS.SI-ID - 8313684

Knjižnica Signatura – lokacija, inventarna št. ... Status izvoda
Narodna in univerzitetna knjižnica, Ljubljana GS II 713553 glavno skladišče prosto - za čitalnico
Fakulteta za upravo, Ljubljana Knjižnica
5 UMEK L. Odkrivanje
IN: 000012165
prosto - na dom, čas izposoje: 21 dni
FMF in IMFM, Matematična knjižnica, Ljubljana Skladišče-Jadranska 21

10922/2
prosto - za čitalnico
loading ...
loading ...
loading ...