Veliki podatci Breslauer, Nenad
Zbornik radova Međimurskog veleučilišta u Čakovcu
14, Issue:
1
Paper
Open access
U prvom dijelu rada definiran je pojam „veliki podatci“. Zatim je dan pregled upotrebe i izvora velikih podataka. Spomenute su najčešće tehnologije koje se koriste u radu s velikim skupovima ...podataka. U drugom dijelu rada definiran je pojam strojnoga učenja te su opisane tri vrste strojnog učenja: podržano učenje, nadzirano učenje i nenadzirano učenje. Dat je pregled najpopularnijih tehnologija koje se koriste za strojno učenje i njihove mogućnosti. U zaključku su sumirane osnovne misli rada.
Veliki podatci (eng. Big data) je popularni termin koji opisuje eksponencijalni rast dostupnosti strukturiranih i nestrukturiranih podataka. Veći broj podatka pridonosi točnijoj analizi. S obzirom na to „veliki podatci“ imaju veliko značenje za samo poslovanje i društvo. 1 Točnijom analizom dobivamo pouzdanije odluke što ujedno donosi veću efikasnost, smanjuje troškove i rizik poslovanja.
Veliki podatci su idealno rješenje za analizu strukturiranih, nestrukturiranih i polustrukturiranih podataka koji dolaze s različitih izvora.
Prikaz članka u kojem su autori izradili sustav strojnog učenja za otkrivanje solarnih elektrana na satelitskim snimkama, a zatim su sustav implementirali na preko 550 terabajta slika. Pretražili su ...gotovo polovicu kopnene površine Zemlje, ukupno detektirali 68 661 solarni objekt i dobili globalnu procjenu od 423 gigavata instaliranog proizvodnog kapaciteta na kraju 2018. To je vrlo blizu procjeni Međunarodne agencije za obnovljivu energiju (IRENA). od 420 gigavata za isto razdoblje.
Cilj istraživanja bio je testiranje mogućnosti predikcije natjecateljske uspješnosti slovenskih tenisača temeljem najvažnijih morfoloških mjera i testova motoričkih sposobnosti koji su bili odabrani ...na osnovu automatskih kompjutorskih metoda i od strane iskusnih teniskih trenera, uz upotrebu metoda strojnog učenja. U analizu je bilo uključeno 1002 muškaraca i žena koji su prošli redovita testiranja slovenskog nacionalnog teniskog saveza te su bili pozicionirani na njihovoj rang listi u sezonama od 1993 do 2008. Odabir najvažnijih varijabli uz pomoć dvije automatske metode dao je slične rezultate, dok su se varijable odabrane od strane trenera bitno razlikovale. Dokazano je kako je uz pomoć klasifikacijskih metoda moguća dobra predikcija natjecateljske uspješnosti u uzrastima ispod 16 godina, dok je kod uzrasta starijih od 16 godina ta predikcija loša. Među regresijskim metodama, za razliku od linearne regresije koja je dala zadovoljavajuće rezultate, regresijsko drvo pokazalo se praktično neupotrebljivim. Automatske metode odabira najvažnijih varijabla morfoloških karakteristika i motoričkih sposobnosti pokazale su se superiornima u odnosu na metode odabira koje koriste teniski treneri. Ta je činjenica bila najviše istaknuta kod ženskih tenisačica i kod upotrebe metode linearne regresije.
Full text
Available for:
DOBA, FSPLJ, IZUM, KILJ, NUK, PILJ, PNG, SAZU, SIK, UILJ, UKNU, UL, UM, UPUK
Provider: - Institution: - Data provided by Europeana Collections- Tehnološki razvoj u modernom društvu kao jednu od posljedica ima i povećan broj generiranih podataka čija brojnost predstavlja ...značajan tehnički i znanstveni izazov u smislu pohrane i obrade.Za podatke koji u sebi ne sadrže vremensku komponentu, metode i tehnike za pohranu i analizu su veoma razvijene, ali za podatke koji su producirani slijedno ovo je još uvijek izazov. Podaci u vremenskim serijama nisu podobni za analizu klasičnim statističkim metodama jer je svaki podatak mjerenja direktno ovisan o prethodnom podatku mjerenom na istom izvoru. Ovime je prekršeno temeljno načelo klasičnih statističkih metoda o nezavisnosti opservacija u uzorku. Jedan od složenijih problema u analizi vremenskih serija je analiza elektrokardiograma (EKG-a). Ovaj rad predlaženovu metodu za analizu vremenskih serija te predstavlja istraživanje u kojem je ista metoda primijenjena u analizi ljudskog EKG signala. EKG kao postupak relativno niskih troškova koji je k tome ineinvazivan jest jedna od osnovnih dijagnostičkih metoda. Kako dugotrajno pregledavanje mnogo-brojnih EKG valova može biti naporno i neprakticno za ljudskog eksperta, računalna analiza EKG signala je značajan znanstveni i tehnički izazov s mnogim potencijalnim primjenama. Problem analize EKG signala obuhvaća nekoliko podrucja istraživanja poput uklanjanja šumova i smetnjikoje nastaju tijekom snimanja, detekcije otkucaja srca, analize ritma te raspoznavanja oblika EKG valova. Ovo istraživanje fokusirano je na detekciju otkucaja srca i raspoznavanje oblika valova.Inspiracija za razvoj metode dolazi iz spoznaja racunalne neuroznanosti, a metoda je u okviruovog istraživanja implementirana u programskom jeziku C++. Provedeni su eksperimenti u detekciji QRS kompleksa bez filtriranja signala, te detekciji QRS kompleksa i prepoznavanja oblikavalova nakon filtriranja signala. U tu svrhu su implementirani i digitalni filtri. U istraživanjusu dobiveni rezultati koji nadmašuju trenutno stanje tehnike te su dobivene spoznaje za daljnjirazvoj i primjenu metode i u podrucju racunalnog vida. Postignuta je tocnost detekcije otkucaja srca bez primjene filtara u prosjeku iznad 95% izracunato prema metodi unakrsne validacije nadsvakim zapisom, te iznad 99% nakon filtriranja signala prema više realisticnoj metodi testiranja baziranoj na subjektu te iznad 96% u raspoznavanju oblika EKG valova testirano prema prepo-rukama AAMI standarda. Takvo testiranje realno simulira potencijalnu klinicku primjenu. U smislu racunalnog vida, provedeni su eksperimenti u raspoznavanju rukom napisanih brojeva i drugih dvodimenzionalnih oblika. Rezultati u tim eksperimentima su približni trenutnom stanjutehnike i kreću se oko 90% tocnosti u raspoznavanju rukom napisanih brojeva iz MNIST skupa podataka.- In this research, a new method (algorithm) of artificial intelligence for pattern recognition is proposed. The method is based on principles of human perception and it is a part of computer engineering domain, the field of artificial intelligence. Method is the result of perennial scientific research and development. The main implementation of the algorithm within the project is on the example of the human ECG signal analysis, which is one of the most demanding problems within the field of time series analysis. Research scope included software implementation and testing on the officially recognized databases of the human ECG signal (MIT-BIH Arrhythmia Database) by using the scientifically recognized metrics (specificity, sensitivity, positive predictivity etc.). The essence of the method is its algorithm, which, in the authors opinion, reminds of human perception principles. In the scientific literature no similar approach is yet known. The approach is based ona study of a specific field in Computational Neuroscience and also, on the conclusions about how brain neurons perceive stimuli coming from sensors (human senses). Beyond the analysis of ECG signals, the above method has many other applications, such as applications in finance, industry,energy, computer vision (recognition of 2D and 3D shapes or photographs after pre-processing) etc. Results achieved in the research are competitive with the current state of the art methods.Without signal filtering, QRS detection is accurate in more than 95% cases. After signal filtering, accuracy is above 99% tested with the subject-based methodology, which is the most realistic one. Heartbeat classification is accurate above 96% tested by the AAMI standard methodology.Handwritten character recognition is accurate around 90% (MNIST dataset). Methods are implemented in C++ programming language.- All metadata published by Europeana are available free of restriction under the Creative Commons CC0 1.0 Universal Public Domain Dedication. However, Europeana requests that you actively acknowledge and give attribution to all metadata sources including Europeana
Ovaj rad se bavi strojnim učenjem i njegovim korištenjem u svrhu izrade aplikacije za kolorizaciju crno-bijelih slika. Kao pomoć pri izradi aplikacije su se koristile otvorene biblioteke za strojno ...učenje. U prvom dijelu rada je objašnjeno strojno učenje, njegova podjela i njegovi glavni algoritmi. Također su objašnjene i međusobno uspoređene neke od najpopularnijih otvorenih biblioteka za strojno učenje. U drugom dijelu je objašnjen rad izrađene aplikacije, te algoritma strojnog učenja koji se je koristio pri njezinoj izradi. Za kraj su prikazani rezultati aplikacije zajedno s evaluacijom implementiranog modela.
ANSAMBL METODE STROJNOG UČENJA Stojanović, Aleksandar; Kovačević, Željko; Ivošević, Danko
Politehnika i dizajn
11, Issue:
4
Paper
Open access
Ansambl metode strojnog učenja privukle su značajnu pažnju posljednjih godina zbog svoje sposobnosti poboljšanja točnosti i robusnosti prediktivnih modela. Ove metode kombiniraju rezultate više ...pojedinačnih modela kako bi proizvele konačno predviđanje. Ansambl metode otpornije su na odstupanja u podacima. Mogu se primijeniti na širok raspon problema u području strojnog učenja, uključujući klasifikaciju, regresiju i klasteriranje. Općenito mogu pomoći u poboljšanju izvedbe modela strojnog učenja i naširoko se koriste u praksi. Zbog njihove velike važnosti i značaja ovaj članak pruža pregled nekih od najčešće korištenih ansambl metoda u strojnom učenju, uključujući pakiranje, pojačavanje i slaganje, te opisuje prednosti i ograničenja svakog od ovih pristupa.
Svjetsko nogometno prvenstvo najveći je globalno popularni nogometni događaj koji ima veliki utjecaj na ljudske emocije, kao i na način izražavanja na temu nogometa na internetu. Toliko je važan da ...gledatelji koji obično ne prate ostala nogometna natjecanja pridaju veliku pozornost kada njihova nacija igra utakmicu na Svjetskome prvenstvu. Stoga je u ovome radu obrađeno ponašanje ljudi za vrijeme Svjetskoga nogometnog prvenstva 2018. godine metodama analize teksta. Analizom emocija utvrđeno je da postoje različita emocionalna stanja kroz koja ljudi prolaze dok razmjenjuju svoja mišljenja s drugim ljudima o nogometu. U ovome se radu za dohvaćanje korisničkih podataka koristio Reddit, internetska platforma za raspravu. Primijenjeno je pet algoritama strojnoga učenja kako bi se testirao i revidirao postojeći model te je utvrđeno da postojeći model predviđa emocije unutar teksta s prosječnom točnošću od 78 %.
Butoniga pripada relativno malim i plitkim akumulacijama te je kao takva jako osjetljiva na procese degradacije i eutrofikacije uzrokovane kako klimatskim promjenama tako i antropogenim aktivnostima ...u svojem slivu. Klorofil-a kao široko primjenjiv ekološki pokazatelj primarne proizvodnje, odnosno biomase fitoplanktona, i procesa eutrofikacije u akumulacijama, ovisi o dostupnosti hranjivih tvari, pH vrijednosti, svjetlosti, temperaturi, kao i njihovim međuodnosima. Tehnika strojnog učenja za izradu modela u obliku regresijskih stabala i pravila primijenjena je na skup mjernih podataka u svrhu boljeg razumijevanja procesa eutrofikacije i ekološkog stanja akumulacije Butoniga. Upotrebom alata za strojno učenje izrađena su dva modela, (1) opisni model klorofila-a u obliku regresijskih stabala kojim se opisuju promjene koncentracije klorofila-a te utvrđuju najznačajniji čimbenici tih promjena, te (2) simulacijski model klorofila-a u obliku pravila koji služi za predviđanje koncentracije klorofila-a s obzirom na promatrane vrijednosti izmjerenih okolišnih čimbenika. Izrađeni modeli doprinose boljem razumijevanju ekosustava akumulacije Butoniga, a također se mogu koristiti u svrhu upravljanja akumulacijom.
Točno predviđanje vidljivosti ključno je za sigurne operacije zrakoplova. Ova studija ispituje kako različite konfiguracije modela slučajne šume (eng. Random Forest) mogu poboljšati predviđanja ...vidljivosti. Koriste se tehnike predprocesiranja, uključujući analizu korelacije za prepoznavanje temeljnih odnosa u promatranjima vremena. Podaci vremenskih nizova pretvaraju se u redoviti podatkovni okvir kako bi se olakšala analiza. Ova studija predlaže klasifikacijski okvir za organiziranje podataka o vidljivosti i meteoroloških pojava. Taj okvir se zatim koristi za razvoj prognoze vidljivosti korištenjem metode slučajne šume. Studija također prikazuje postupke za podešavanje hiperparametara, odabir značajki, uravnotežavanje podataka i procjenu točnosti za taj skup podataka. Glavni rezultati su parametri modela slučajne šume za trosatnu prognozu vidljivosti te analiza pogrešaka prognoze slabe vidljivosti. Dodatno, ispitani su i modeli za jednosatnu prognozu i prognozu vidljivosti u slučaju oborine. Dobiveni modeli pokazuju točnost determinističke prognoze od približno 78%, uz oko 6% lažnih uzbuna, dajući sveobuhvatan pregled mogućnosti modela slučajne šume za predviđanje vidljivosti. Kao što se i očekivalo, model je pokazao ograničenja pri simulaciji brzog radijacijskog hlađenja i pri naglom smanjenju vidljivosti uzrokovanom oborinama. Naime, u odnosu na oborine, točnost modela je bila 79%, ali stopa lažnih uzbuna iznosila 19%. Dodatno, metoda slučajne šume postavlja temelje za poboljšanje točnosti prognoza uključivanjem dodatnih prognostičkih podataka, dok njezina primjena na skupove realnih podataka proširuje primjenu tehnika strojnog učenja na na meteorološke probleme.
Many years of electronic data processing have enabled the storage of a large amount of data that can be used today to improve educational processes through machine learning algorithms. Using data ...from the Moodle distance learning system, an artificial neural network model was created to predict the final outcome of students at the end of their studies based on their final grades of the first year of study. In three artificial neural network models, the power of this algorithm was demonstrated, where all models achieved a very low error, and the artificial neural network model achieved the best results with two hidden layers of nine neurons, whose absolute error was 0.1920, and the squared error 0.0562. The research shows that artificial neural networks are very effective in predicting the final outcome of students based on the grade from the first year of study and that such models have the potential to become an auxiliary tool and means of decision-making in educational institutions.
Višegodišnja elektronička obrada podataka omogućila je pohranu velike količine podataka koja se danas može iskoristiti za poboljšanje procesa u obrazovanju putem algoritama strojnog učenja. Koristeći se podacima iz sustava Moodle za učenje na daljinu, stvoren je model umjetne neuronske mreže s ciljem predviđanja konačnog ishoda studenta na kraju studija na temelju njegovih zaključnih ocjena prve godine studija. Kroz ukupno tri modela umjetne neuronske mreže pokazana je snaga ovog algoritma, gdje su svi modeli ostvarili vrlo nisku pogrešku, a najbolji rezultati postignuti su modelom umjetne neuronske mreže s dva skrivena sloja od devet neurona, čija je apsolutna greška iznosila 0,1920, a kvadratna pogreška 0,0562. Istraživanje pokazuje da su umjetne neuronske mreže vrlo učinkovite u predikciji konačnog ishoda studenata na temelju ocjena s prve godine studija te da takvi modeli imaju potencijal postati pomoćni alat i sredstvo donošenja odluka u obrazovnim institucijama.