ALL libraries (COBIB.SI union bibliographic/catalogue database)
  • Razvrščanje velikih podatkovij [Elektronski vir]
    Korenjak-Černe, Simona ...
    V zadnjih dveh desetletjih je shranjevanje velikih podatkovij postalo dostopno domala vsem uporabnikom računalnikov. S tem je povezan problem, kako iz velike množice podatkov izluščiti čim več za ... uporabnika koristnih informacij. Eno takih orodij je razvrščanje podatkov v skupine. Klasične metode razvrščanja, ki se najpogosteje uporabljajo, imajo predvsem dve pomanjkljivosti: hierarhične metode (npr. Wardova), ki temeljijo na matriki različnosti med enotami, so primerne le za manjša podatkovja, nehierarhične metode (npr. metoda k-središč) pa so večinoma omejene le na številske podatke in skupine predstavijo le z eno samo vrednostjo (najpogosteje težiščem). V prispevku si ogledamo prilagoditve metod razvrščanja, ki smo jih razvili za podatke, predstavljene z diskretnimi porazdelitvami. Tovrstna predstavitev podatkov in skupin ohrani več informacij kot predstavitev s samo eno od srednjih vrednosti, ki se uporablja pri klasičnih metodah razvrščanja. Prilagojene metode obenem omogočajo obdelavo zelo velikih podatkovij. Tudi za te predstavitve je mogoče izpeljati s kriterijsko funkcijo usklajene hierarhične in nehierarhične metode. Za tovrstne podatke so predstavljene tudi nove metode razvrščanja, ki temeljijo na izračunu relativne napake skupine in imajo v nekaterih primerih zaradi takega izračuna prednost pred klasično metodo k-središč, ki temelji na minimizaciji variance. Uporabnost opisanih metod je predstavljena na konkretnih primerih.
    Type of material - conference contribution ; adult, serious
    Publish date - 2009
    Language - slovenian
    COBISS.SI-ID - 18898918