-
Razvrščanje velikih podatkovij [Elektronski vir]Korenjak-Černe, Simona ...V zadnjih dveh desetletjih je shranjevanje velikih podatkovij postalo dostopno domala vsem uporabnikom računalnikov. S tem je povezan problem, kako iz velike množice podatkov izluščiti čim več za ... uporabnika koristnih informacij. Eno takih orodij je razvrščanje podatkov v skupine. Klasične metode razvrščanja, ki se najpogosteje uporabljajo, imajo predvsem dve pomanjkljivosti: hierarhične metode (npr. Wardova), ki temeljijo na matriki različnosti med enotami, so primerne le za manjša podatkovja, nehierarhične metode (npr. metoda k-središč) pa so večinoma omejene le na številske podatke in skupine predstavijo le z eno samo vrednostjo (najpogosteje težiščem). V prispevku si ogledamo prilagoditve metod razvrščanja, ki smo jih razvili za podatke, predstavljene z diskretnimi porazdelitvami. Tovrstna predstavitev podatkov in skupin ohrani več informacij kot predstavitev s samo eno od srednjih vrednosti, ki se uporablja pri klasičnih metodah razvrščanja. Prilagojene metode obenem omogočajo obdelavo zelo velikih podatkovij. Tudi za te predstavitve je mogoče izpeljati s kriterijsko funkcijo usklajene hierarhične in nehierarhične metode. Za tovrstne podatke so predstavljene tudi nove metode razvrščanja, ki temeljijo na izračunu relativne napake skupine in imajo v nekaterih primerih zaradi takega izračuna prednost pred klasično metodo k-središč, ki temelji na minimizaciji variance. Uporabnost opisanih metod je predstavljena na konkretnih primerih.Source: 19. Statistični dnevi, Radenci, Slovenija, 9.-11. november 2009 = 19th Statistical Days, Slovenia, November [2009] [Elektronski vir] (8 str.)Type of material - conference contribution ; adult, seriousPublish date - 2009Language - slovenianCOBISS.SI-ID - 18898918
Author
Korenjak-Černe, Simona |
Batagelj, Vladimir |
Japelj Pavešić, Barbara |
Kejžar, Nataša, 1976-
Topics
podatki |
statistika |
statistične metode |
razvrščanje v skupine |
velika podatkovja |
hierarhična metoda |
nehierarhična metoda |
diskretna porazdelitev |
relativna napaka skupine |
data |
statistics |
statistical methods |
cluster analysis |
clustering |
large data sets |
discrete distribution |
hierarchical clustering |
k-means method |
relative error function
Shelf entry
Permalink
- URL:
Impact factor
Access to the JCR database is permitted only to users from Slovenia. Your current IP address is not on the list of IP addresses with access permission, and authentication with the relevant AAI accout is required.
Year | Impact factor | Edition | Category | Classification | ||||
---|---|---|---|---|---|---|---|---|
JCR | SNIP | JCR | SNIP | JCR | SNIP | JCR | SNIP |
Select the library membership card:
DRS, in which the journal is indexed
Database name | Field | Year |
---|
Links to authors' personal bibliographies | Links to information on researchers in the SICRIS system |
---|---|
Korenjak-Černe, Simona | 12303 |
Batagelj, Vladimir | 01467 |
Japelj Pavešić, Barbara | 13260 |
Kejžar, Nataša, 1976- | 24344 |
Select pickup location:
Material pickup by post
Notification
Subject headings in COBISS General List of Subject Headings
Select pickup location
Pickup location | Material status | Reservation |
---|
Please wait a moment.