-
Odkrivanje podskupin v podatkih z več odvisnimi spremenljivkami : doktorska disertacijaUmek, Lan, 1981-Odkrivanje podskupin je uporabno področje analize podatkov, ki teži k odkrivanju zanimivih podmnožic slučajnega vzorca glede na izbrani ciljni koncept. Večina obstoječih algoritmov za odkrivanje ... podskupin je bila doslej razvitih za podatke z eno odvisno dvojiško spremenljivko, zanimivost podskupin pa je predstavljala njena porazdelitvena različnost med podskupino in celotnim vzorcem. V disertaciji razširimo problem odkrivanja podskupin na podatke, kjer je odvisnih spremenljivk več, te pa so lahko mešanega tipa. Podatki te vrste se čedalje pogosteje pojavljajo na različnih znanstvenih področjih, zato je potreba po njihovi primerni analizi čedalje večja. Osrednji del disertacije predstavlja razvoj treh algoritmov s skupnim imenom MRSD (Multiple- Responses-Subgroup-Discovery), prilagojenih za analizo podatkov z več odvisnimi spremenljivkami, ki večinoma povezujejo uveljavljene metode multivariatne statistike in odkrivanja znanj v podatkih. Poleg algoritmov MRSD predlagamo postopek analize odkritih podskupin, ki lahko prepozna najbolj tipične podskupine, algoritme preizkusimo na več sintetičnih domenah in jih primerjamo z algoritmi za napovedno razvrščanje. Empirična študija je pokazala, da so algoritmi MRSD robustnejši na šum v podatkih in prisotnost manjkajočih vrednosti, poleg tega pa pri opisu podskupin uporabljajo bogatejši izrazni jezik. Algoritme MRSD smo v disertaciji preizkusili na treh realnih domenah, in sicer na anketnih podatkih evropske družboslovne raziskave, na medicinski domeni ter pri rezultatih kemogenomskih poskusov na kvasovki. Analiza dobljenih podskupin je pokazala, da so te smiselne in razkrivajo potencialno uporabno znanje.Vrsta gradiva - disertacijaZaložništvo in izdelava - Ljubljana : [L. Umek], 2011Jezik - slovenskiCOBISS.SI-ID - 8313684
Avtor
Umek, Lan, 1981-
Drugi avtorji
Zupan, Blaž, računalništvo
Teme
odkrivanje podskupin |
razvrščanje v skupine |
uvrščanje v skupine |
kontingenčne tabele |
multivariatna statistika |
ploščina pod krivuljo ROC |
disertacije |
subgroup discovery |
clustering |
classification |
contingency tables |
multivariate statistics |
area under ROC curve |
doctoral dissertations |
theses
Knjižnica | Signatura – lokacija, inventarna št. ... | Status izvoda |
---|---|---|
Narodna in univerzitetna knjižnica, Ljubljana | GS II 713553 glavno skladišče | prosto - za čitalnico |
Fakulteta za upravo, Ljubljana | Knjižnica 5 UMEK L. Odkrivanje IN: 000012165 |
prosto - na dom, čas izposoje: 21 dni |
FMF in IMFM, Matematična knjižnica, Ljubljana | Skladišče-Jadranska 21 10922/2 |
prosto - za čitalnico |
Vnos na polico
Trajna povezava
- URL:
Faktor vpliva
Dostop do baze podatkov JCR je dovoljen samo uporabnikom iz Slovenije. Vaš trenutni IP-naslov ni na seznamu dovoljenih za dostop, zato je potrebna avtentikacija z ustreznim računom AAI.
Leto | Faktor vpliva | Izdaja | Kategorija | Razvrstitev | ||||
---|---|---|---|---|---|---|---|---|
JCR | SNIP | JCR | SNIP | JCR | SNIP | JCR | SNIP |
Baze podatkov, v katerih je revija indeksirana
Ime baze podatkov | Področje | Leto |
---|
Povezave do osebnih bibliografij avtorjev | Povezave do podatkov o raziskovalcih v sistemu SICRIS |
---|---|
Umek, Lan, 1981- | 28519 |
Zupan, Blaž, računalništvo | 12536 |
Izberite prevzemno mesto:
Prevzem gradiva po pošti
Obvestilo
Gesla v Splošnem geslovniku COBISS
Izbira mesta prevzema
Mesto prevzema | Status gradiva | Rezervacija |
---|
Prosimo, počakajte trenutek.