Central Technological Library of the University of Ljubljana (CTK)
-
Empirični postopek ocenitve algoritmov za klasifikacijo : doktorska disertacijaBrumen, BoštjanKlasifikacija - najbolj pogost postopek podatkovnega rudarjenja - je človeška nuja. Da bi razumeli svet, o njem komunicirali in se spopadali z njegovo kompleksnostjo, človek nenehno razvršča objekte. ... Morda je najbolj preprosta funkcija, ki jo izvajajo človeški možgani, prav razpoznavanje razlik med dvema objektoma, oziroma razvrščanje dveh različnih objektov v različne razrede. Zmožni smo analizirati objekte na podlagi najmanjših, podrobnih lastnosti in ugotoviti tako podobnosti kot različnosti. Količina podatkov je vzadnjih nekaj desetletjih močno naraščala. Elektronska oprema, ki deluje na različnih področjih, kot so geologija, poslovanje, astronomija, ali medicina, je sposobna zbirati ogromne količine podatkov. Jasno je, da bo le majhen deležteh podatkov ročno obdelan. Če bomo podatke želeli vsaj razumeti, jih bomo morali računalniško analizirati. Raziskovalci s področja strojnega učenja so v preteklosti aktivno delali na razvoju algoritmov, ki so zmožni izvedbe inteligentne analize in lahko ugotovijo vzorce v podatkih. Za samostojno računalniško izvedbo inteligentne analize podatkov moramo računalnike "učiti". Postopek učenja računalnikov je analogen učenju ljudi - s prikazovanjem pozitivnih in negativnih primerov, na podlagi katerih se zgradi model. Podani primeri so člani učne množice, ki jo pripravi strokovnjak ali množica strokovnjakov. Model, ki se zgradi na tak način, predstavlja znanje človeka. Vprašanje, ki se zastavi, je: "Koliko podatkov je potrebnih za izgradnjo modela?" Edini način, kako odgovoriti na to vprašanje je, da odgovorimo tudi na vprašanje "Kaj bomo z modelom znanja počeli?" oziroma "Kaj od modela pričakujemo?" Ko govorimo o klasifikacijskih modelih, od le-teh pričakujemo določeno stopnjo natančnosti. Na žalost ni možno v naprej napovedati, kolikšna bo natančnost algoritma glede na obstoječe podatke. Raziskave na povezanih področjih so se zelo malo ali pa sploh ne ukvarjale z naštetimi vprašanji. V pričujočem delu se osredotočimo na ocenitev učečih se algoritmov na podlagi opazovanja njihovega obnašanja na vzorcih, ki imajo manjše število primerkov. Opazujemo krivuljo učenja, ki opisuje učni proces. Idealna krivulja učenja je v primeru, ko opisujemo napako učenja, monotono padajoča in konkavna. Krivulje učenja, ki jih pridobimo na podlagi meritev, paizkazujejo prisotnost lokalne variance, ki jo lahko povzroči več faktorjev, na primer slaba kakovost podatkov. Glavni prispevek v disertaciji je model učenja v tako imenovanem režimu majhnega l (kjer je l, število primerkov v vzorcu, majhno). Za velike vzorce, kjer se l približuje neskončnosti, so raziskave na omenjena vprašanja že podale odgovore. Na žalost pa je količina podatkov v realnem življenju omejena, število problemov s kakovostjo podatkov pa ne. Izdelani model učenja v režimu majhnega l je konsistenten s sorodnimi raziskavami. Naslednji prispevek v disertaciji je razvoj adaptivne inkrementalne k-kratne navzkrižne validacije, ki omogoča sprotno graditev krivulje učenja, med tem ko se število primerkov v vzorcu povečuje. K-kratna navzkrižna validacija zagotavlja statistično veljavnost meritev v vsakem koraku. Pomemben prispevek so pogoji za odkrivanje konvergence, ki omogočajo opazovanje krivulje učenja. Ko postane oblika krivulje učenja primerna, lahko izdelamo ocenitveni model na podlagi izmerjenih točk krivulje. S takšnim modelom lahko ocenimo bodočo natančnost algoritmov za klasifikacijo na podlagimanjšega števila primerkov v vzorcu. Model, ki smo ga izdelali, smo testirali v več eksperimentih, kjer so bile uporabljene javno dostopne podatkovne zbirke. V vsakem od eksperimentov je bil cilj oceniti napako klasifikacije v naslednjem koraku in končno napako modela. Izmerjene in ocenjene vrednosti smo med seboj primerjali in ugotovili, da so razlike statistično zanemarljive. Rezultati eksperimentov nakazujejo na splošno veljavnost razvitega modela.Type of material - dissertation ; adult, seriousPublication and manufacture - Maribor : [B. Brumen], 2004Language - slovenian, englishCOBISS.SI-ID - 8626198
Author
Brumen, Boštjan
Other authors
Welzer-Družovec, Tatjana
Topics
računalništvo |
podatkovno rudarjenje |
strojno učenje |
strojna kvalifikacija |
krivulje učenja |
ocenitve algoritmov |
doktorske disertacije |
Data Mining |
machine learning |
machine clasification |
learning curves |
assessment of algorithms
Reserve material at the desired pickup location.
Pickup location |
Material status | Reservation |
---|---|---|
Central Technological Library of the University of Ljubljana |
available - outside loan, loan period: 14 days
|
Call number – location, accession no. ... |
Copy status |
---|---|
0000059287/0000000195 Skladišče IN: 320040024 59287/195 Skladišče IN: 320040024 |
available - outside loan, loan period: 14 days
|
Shelf entry
Permalink
- URL:
Impact factor
Access to the JCR database is permitted only to users from Slovenia. Your current IP address is not on the list of IP addresses with access permission, and authentication with the relevant AAI accout is required.
Year | Impact factor | Edition | Category | Classification | ||||
---|---|---|---|---|---|---|---|---|
JCR | SNIP | JCR | SNIP | JCR | SNIP | JCR | SNIP |
Select the library membership card:
If the library membership card is not in the list,
add a new one.
DRS, in which the journal is indexed
Database name | Field | Year |
---|
Links to authors' personal bibliographies | Links to information on researchers in the SICRIS system |
---|---|
Brumen, Boštjan | 18848 |
Welzer-Družovec, Tatjana | 06794 |
Source: Personal bibliographies
and: SICRIS
Select pickup location:
Material pickup by post
Delivery address:
Address is missing from the member's data.
The address retrieval service is currently unavailable, please try again.
By clicking the "OK" button, you will confirm the pickup location selected above and complete the reservation process.
By clicking the "OK" button, you will confirm the above pickup location and delivery address, and complete the reservation process.
By clicking the "OK" button, you will confirm the address selected above and complete the reservation process.
Notification
Automatic login and reservation service currently not available. You can reserve the material on the Biblos portal or try again here later.
Subject headings in COBISS General List of Subject Headings
Select pickup location
The material from the parent unit is free. If the material is delivered to the pickup location from another unit, the library may charge you for this service.
Pickup location | Material status | Reservation |
---|
Reservation in progress
Please wait a moment.
Reservation was successful.
Reservation failed.
Reservation...
Membership card:
Pickup location: