-
Odkrivanje podskupin v podatkih z več odvisnimi spremenljivkami : doktorska disertacijaUmek, Lan, 1981-Odkrivanje podskupin je uporabno področje analize podatkov, ki teži k odkrivanju zanimivih podmnožic slučajnega vzorca glede na izbrani ciljni koncept. Večina obstoječih algoritmov za odkrivanje ... podskupin je bila doslej razvitih za podatke z eno odvisno dvojiško spremenljivko, zanimivost podskupin pa je predstavljala njena porazdelitvena različnost med podskupino in celotnim vzorcem. V disertaciji razširimo problem odkrivanja podskupin na podatke, kjer je odvisnih spremenljivk več, te pa so lahko mešanega tipa. Podatki te vrste se čedalje pogosteje pojavljajo na različnih znanstvenih področjih, zato je potreba po njihovi primerni analizi čedalje večja. Osrednji del disertacije predstavlja razvoj treh algoritmov s skupnim imenom MRSD (Multiple- Responses-Subgroup-Discovery), prilagojenih za analizo podatkov z več odvisnimi spremenljivkami, ki večinoma povezujejo uveljavljene metode multivariatne statistike in odkrivanja znanj v podatkih. Poleg algoritmov MRSD predlagamo postopek analize odkritih podskupin, ki lahko prepozna najbolj tipične podskupine, algoritme preizkusimo na več sintetičnih domenah in jih primerjamo z algoritmi za napovedno razvrščanje. Empirična študija je pokazala, da so algoritmi MRSD robustnejši na šum v podatkih in prisotnost manjkajočih vrednosti, poleg tega pa pri opisu podskupin uporabljajo bogatejši izrazni jezik. Algoritme MRSD smo v disertaciji preizkusili na treh realnih domenah, in sicer na anketnih podatkih evropske družboslovne raziskave, na medicinski domeni ter pri rezultatih kemogenomskih poskusov na kvasovki. Analiza dobljenih podskupin je pokazala, da so te smiselne in razkrivajo potencialno uporabno znanje.Type of material - dissertationPublication and manufacture - Ljubljana : [L. Umek], 2011Language - slovenianCOBISS.SI-ID - 8313684
Author
Umek, Lan, 1981-
Other authors
Zupan, Blaž, računalništvo
Topics
odkrivanje podskupin |
razvrščanje v skupine |
uvrščanje v skupine |
kontingenčne tabele |
multivariatna statistika |
ploščina pod krivuljo ROC |
disertacije |
subgroup discovery |
clustering |
classification |
contingency tables |
multivariate statistics |
area under ROC curve |
doctoral dissertations |
theses
Library/institution |
City | Acronym | For loan | Other holdings |
---|---|---|---|---|
Faculty of Administration, Ljubljana | Ljubljana | VUSLJ |
outside loan 1 cop.
|
|
FMF and IMFM, Mathematical Library, Ljubljana | Ljubljana | MAKLJ |
reading room 1 cop.
|
|
National and University Library, Ljubljana | Ljubljana | NUK |
reading room 1 cop.
|
not for loan 1 cop.
|
Shelf entry
Permalink
- URL:
Impact factor
Access to the JCR database is permitted only to users from Slovenia. Your current IP address is not on the list of IP addresses with access permission, and authentication with the relevant AAI accout is required.
Year | Impact factor | Edition | Category | Classification | ||||
---|---|---|---|---|---|---|---|---|
JCR | SNIP | JCR | SNIP | JCR | SNIP | JCR | SNIP |
Select the library membership card:
DRS, in which the journal is indexed
Database name | Field | Year |
---|
Links to authors' personal bibliographies | Links to information on researchers in the SICRIS system |
---|---|
Umek, Lan, 1981- | 28519 |
Zupan, Blaž, računalništvo | 12536 |
Select pickup location:
Material pickup by post
Notification
Subject headings in COBISS General List of Subject Headings
Select pickup location
Pickup location | Material status | Reservation |
---|
Please wait a moment.