DIKUL - logo
E-viri
Celotno besedilo
Recenzirano Odprti dostop
  • Baza slika za strojno učenj...
    Pobar, Miran; Ivašić-Kos, Marina; Šimac, Ivan

    Zbornik Veleučilišta u Rijeci, 2023, Letnik: 11, Številka: 1
    Journal Article, Paper

    Velika količina podataka koja se svaki dan kreira može se upotrijebiti za razvoj algoritama umjetne inteligencije u domeni računalnog vida koji rješavaju zadatke poput klasifikacije slika, detekcije osoba i raspoznavanja akcija. Ti skupovi podataka su najčešće izrađeni od videozapisa i slika preuzetih s televizijskih kanala ili s društvene mreže YouTube i prikupljeni su i pripremljeni za odgovarajući zadatak. Nas je zanimao zadatak detekcije plivača, kako bi se model mogao koristiti za raspoznavanje i unaprjeđenje plivačkih tehnika. Iako danas postoje ogromne otvorene baze slika poput COCO i ImageNet, pripremljene za nadzirano strojno učenje te baze sportskih scena poput Olympic Sports Dataset, UCF Action Sport dataset ili Sport-1M koje uključuju slike popularnijih (gledanijih) sportova, nijedna od njih ne uključuje slike koje bi se mogle koristiti za izradu našeg modela za detekciju plivača. Stoga je u ovom radu opisan postupak snimanja i prikupljanja video materijala te priprema skupa slika UNIRI-SWM za detekciju plivača. Skup uključuje snimke plivača u realnim, situacijskim uvjetima treninga i natjecanja snimljenih akcijskim kamerama iz različitih kutova snimanja. U radu su dani rezultati detekcije plivača korištenjem dubokih konvolucijskih neuronskih mreža Mask R-CNN i Yolov3, naučenim na skupu općih slika prije i nakon učenja na skupu UNIRI-SWM. Rezultati pokazuju da se nakon prilagodbe modela na odgovarajućem skupu slika iz domene plivanja mogu postići jako dobri rezultati detekcije plivača. The large amount of data that is created every day can be used to develop artificial intelligencealgorithms in the domain of computer vision that solve tasks such as image classification, facedetection and action recognition. These datasets are most often created from videos and imagesdownloaded from television channels or the YouTube social network and are collected and preparedfor the appropriate task. We were interested in the task of detecting swimmers, so that the modelcould be used to recognize and improve swimming techniques. Although today there are huge openimage databases like COCO and ImageNet, prepared for supervised machine learning and sportsscene databases like Olympic Sports Dataset, UCF Action Sport dataset or Sport-1M that includeimages of more popular (watched) sports, none of them include images that could be used to makeour swimmer detection model. Therefore, this paper describes the process of recording and collectingvideo material and preparing a set of UNIRI-SWM images for swimmer detection. The set includesshots of swimmers in real, situational training and competition conditions filmed by action camerasfrom different shooting angles. The paper presents the results of swimmer detection using deepconvolutional neural networks Mask R-CNN and Yolo v3, learned in the set of general images beforeand after learning in the set UNIRI-SWM. The results show that after adjusting the model on theappropriate set of images from the swimming domain, very good results of swimmer detection canbe achieved.