Clustering of uncertain objects in large uncertain databases and problem of mining uncertain data has been well studied. In this paper, clustering of uncertain objects with location uncertainty is ...studied. Moving objects, like mobile devices, report their locations periodically, thus their locations are uncertain and best described by a probability density function. The number of objects in a database can be large which makes the process of mining accurate data, a challenging and time consuming task. Authors will give an overview of existing clustering methods and present a new approach for data mining and parallel computing of clustering problems. All existing methods use pruning to avoid expected distance calculations. It is required to calculate the expected distance numerical integration, which is time-consuming. Therefore, a new method, called Segmentation of Data Set Area-Parallel, is proposed. In this method, a data set area is divided into many small segments. Only clusters and objects in that segment are observed. The number of segments is calculated using the number and location of clusters. The use of segments gives the possibility of parallel computing, because segments are mutually independent. Thus, each segment can be computed on multiple cores.
Paralelno klasteriranje nesigurnih podatka koristeći se segmentacijom područja podataka i Voronojevim dijagramima. Klasteriranje podataka s nesigurnošću je vrlo proučavano područje u velikim bazama nesigurnih podataka. U takvim bazama podataka teško je pronaći korisne podatke u mnoštvu podataka s nesigurnošću. U ovom radu proučavano je klasteriranje objekata koji imaju nesigurnost položaja. Većina pokretnih objekata, kao što su mobilni uređd
-
aji, periodički izvještava svoj položaj, stoga je njihov položaj neprecizan te se mora opisati funkcijom gustoće vjerojatnosti. Broj objekata u bazi podataka može biti jako velik i doći do točnih podataka je izazovan zadatak i zahtijeva puno vremena. Sve metode za klasteriranje nesigurnih podataka koriste slične principe. Ovim radom predložen je nov pristup. Prvo je dan pregled postojećih metoda, a nakon toga predložena je nova metoda za paralelno klasteriranje nesigurnih podataka. Sve postojeće metode koriste se različitim postupcima pročišćavanja kako bi se izbjeglo računanje očekivane udaljenosti jer ono uključuje numeričke integracije i zahtijeva puno vremena. Predložili smo metodu nazvanu paralelna segmentacija područja podataka. U toj metodi, klastersko područje podijeljeno je u mnogo malih segmenata te se promatraju samo klasteri i objekti u tim malim segmentima. Broj segmenata izračunava se pomoću broja i položaja klastera u prostoru. To nam daje mogućnost za paralelno računanje jer segmenti su međd
-
usobno neovisni te se tako svaki segment može računati na više procesorskih jezgri.
CUDA procesori Trstenjak, Bruno; Knok, Željko; Trstenjak, Jurica
Zbornik radova Međimurskog veleučilišta u Čakovcu,
12/2010, Letnik:
1, Številka:
2
Paper
Odprti dostop
CUDA je grafički procesor, nasljednik klasičnih vektorskih procesora. Procesor je izrađen od strane kompanije NVIDIA koja njime uvodi novi pojam, CUDA arhitektura. Procesor se sastoji od nekoliko ...stotina CUDA procesorskih jezgri i dozvoljava da i klasične aplikacije imaju mogućnost izvršavanja u paralelnom okruženju na grafičkom procesoru. Briše se granica između brzih grafičkih procesora i sporijih centralnih procesora. Upotrebom posebnih CUDA biblioteka korisnik može izraditi aplikacije na način da se njeni zahtjevniji dijelovi izvode zasebno na brzim grafičkim procesorima, paralelno, koristeći višenitnu strategiju podjele zadataka između CUDA jezgri.
Trodimenzionalno, kompresibilno, viskozno i nestacionarno transonično turbulentno strujanje oko krila modelirano je hibridnom RANS-LES metodom, kombiniranom s kompresibilnim k-omegaSSTSAS ...turbulentnim modelom. Rabljeni pristup bazira se na podjeli utjecaja fluktuirajućih i osrednjenih polja brzina u okviru subtenzora i modeliranju svakog od njih odgovarajućim turbulentnim viskozitetom. U proračunu, "RANS mod" se koristi u područjima strujnog polja koja se s prihvatljivom točnošću mogu tretirati kao stacionarna, npr. u graničnom sloju, dok se "LES mod" primjenjuje u dominantno nestacionarnim područjima, daleko od krila. Diskretizacija jednadžbi strujanja vrši se metodom konačnih razlika na nestrukturiranoj mreži. Metoda je verificirana na Onera M6 krilu. Paralelizacija se provodi dekomponiranjem mreže na subdomene i uporabom Open MPI tehnologije. Implementacija turbulentnog modela obavljena je uporabom OpenFOAM-a. Simulacija strujanja provedena je i u ANSYS Fluent-u, a rezultati dobiveni pomoću ove dvije metode uspoređeni su kako međusobno, tako i s Onera M6 eksperimentom.
Razvrstavanje podataka s nesigurnošću je vrlo istraživano područje. Ovaj rad posvećen je razvrstavanju objekata koji imaju nesigurnost 2D položaja uzrokovanog gibanjem objekata. Položaj pokretnog ...objekta izvještava se periodički, i stoga položaj objekta sadrži nesigurnost i opisan je funkcijom gustoće razdiobe (PDF). Podaci o takvim objektima i njihovim položajima čuvaju se u distribuiranim bazama podataka. Broj objekata s nesigurnošću može biti jako velik i dobivanje kvalitetnog rezultata u razumnom vremenu je zahtijevan zadatak. Najjednostavnija metoda za razvrstavanje je UK-means, u kojoj se računaju sve očekivane udaljenosti (ED) od objekata do središta grozdova. Stoga je UK-means nedjelotvorna metoda. Kako bi se izbjeglo računanje očekivanih udaljenosti predstavljene su brojne metode za odbacivanje. U radu je dan pregled postojećih metoda i predložena kombinacija dviju metoda. Prva metoda je nazvana podjela područja skupa podataka (SDSA) i kombinirana je s poboljšanom simetralnom metodom kako bi se skratilo vrijeme razvrstavanja podataka s nesigurnošću. Pomoću SDSA metode područje skupa podataka je podijeljeno na mala pravokutna područja i promatraju se samo objekti koji se nalaze u tom području. Koristeći mala pravokutna područja nudi se mogućnost za paralelno procesiranje, jer su područja međusobno neovisna i mogu se računati na različitim jezgrama procesora. Provedeni su pokusi kako bi se pokazala uspješnost nove kombinirane metode.
Procjenjivanje onečišćenja zraka predstavlja važan segment sustava za ocjenu utjecaja
onečišćenja na zdravlje ljudi i okoliša. Temeljni, zakonom propisani, postupak procjenjivanja je
korištenje ...standardiziranih modela kakvoće zraka. Modeli kakvoće zraka učestalo se primjenjuju
pri višegodišnjim analizama emisija onečišćujućih tvari iz novih potencijalnih postrojenja te pri
kontinuiranom procjenjivanju i praćenju imisija iz postojećih izvora. Takve simulacije
zahtijevaju iznimnu količinu informacija za pripremu te odabir modela kakvoće sa primjerenom
učinkovitošću i točnosti izračunatih koncentracija onečišćenja. Analizom različitih modela
disperzije i kakvoće zraka odabran je CALPUFF model disperzije. Učinkovitost je povećana na
dvije razine. Prva razina odnosi se na efikasniji i robusniji način prikupljanja i pripreme svih
potrebnih podataka za CALPUFF model disperzije. U d rugom d ijelu p ovećana je učinkovitost
modela disperzije dimnih oblaka korištenjem grafičkih procesora opće namjene (GPGPU).
Postupak paralelizacije postojećeg računalnog koda proveden je na proračunski najzahtjevnijem
segmentu modela. Rezultati paralelizacije CALPUFF modela disperzije uspoređeni su sa
osnovnom serijskom varijantom proračuna.
Procjenjivanje onečišćenja zraka predstavlja važan segment sustava za ocjenu utjecaja
onečišćenja na zdravlje ljudi i okoliša. Temeljni, zakonom propisani, postupak procjenjivanja je
korištenje standardiziranih modela kakvoće zraka. Modeli kakvoće zraka učestalo se primjenjuju
pri višegodišnjim analizama emisija onečišćujućih tvari iz novih potencijalnih postrojenja te pri
kontinuiranom procjenjivanju i praćenju imisija iz postojećih izvora. Takve simulacije
zahtijevaju iznimnu količinu informacija za pripremu te odabir modela kakvoće sa primjerenom
učinkovitošću i točnosti izračunatih koncentracija onečišćenja. Analizom različitih modela
disperzije i kakvoće zraka odabran je CALPUFF model disperzije. Učinkovitost je povećana na
dvije razine. Prva razina odnosi se na efikasniji i robusniji način prikupljanja i pripreme svih
potrebnih podataka za CALPUFF model disperzije. U d rugom d ijelu p ovećana je učinkovitost
modela disperzije dimnih oblaka korištenjem grafičkih procesora opće namjene (GPGPU).
Postupak paralelizacije postojećeg računalnog koda proveden je na proračunski najzahtjevnijem
segmentu modela. Rezultati paralelizacije CALPUFF modela disperzije uspoređeni su sa
osnovnom serijskom varijantom proračuna.
Air pollution forecasting presents major segment for mitigation of air pollution effects on
humans and environment. Regulatory modeling techniques have been established for such
purposes. Air quality models, nowadays, are often used for longtime analysis of emitted
pollutants from newly planned sources, for continuous forecasts from current sources. Such
simulations need high number of different input parameters and selection of efficient model for
each specific purpose in order to obtain accurate ground level concentrations. Different air
quality m odels have been t horoughly a nalyzed with a conclusion t hat CALPUFF m odel i s most
suited for wide range of applications. Furthermore, the model was made more effective by
raising the efficiency of model input data delivery and preparation. Moreover, the model was
programmed for parallel execution on general purpose graphical processors (GPGPU). A process
of parallelization was conducted on the code segment that consume the most compute time of
the entire model. Results of raised efficiency of CALPUFF dispersion model have been compared
to the results of current serial model version.