UP - logo
E-viri
Celotno besedilo
Recenzirano Odprti dostop
  • Bölütleme Kullanarak Doğal ...
    ŞENKAYA, Yeliz; KURNAZ, Çetin

    Düzce Üniversitesi bilim ve teknoloji dergisi (Online), 12/2022, Letnik: 10, Številka: 5
    Journal Article

    OCR olarak da bilinen optik karakter tanıma, taranan görüntülerdeki bir kelimeyi ya da bir cümleyi tanımak için kullanılan bir yöntemdir. Uzun yıllara dayanan araştırmalarla geliştirilmiştir. Taranan görüntüler üzerindeki metni tespit etmede büyük başarı sağlamıştır. Ancak doğal görüntüler üzerinde istenilen sonucu vermemektedir. Bu nedenle, doğal görüntülerdeki metinleri tespit edebilmek için özel yaklaşımların geliştirilmesi gerekliliği doğmuştur. Bu çalışmada, doğal görüntüler üzerinde metin olan bölgeleri algılamak için Otsu ve maksimum kararlı ekstrem bölgeler (MSER) görüntü bölütleme yöntemleri kullanılmıştır. Görüntü bölütleme, bir görüntüyü daha iyi analiz edebilmek için görüntüyü anlamlı bölgelere ayırma işlemidir. Otsu modelinde görüntü için en uygun eşik değeri belirlenerek, görüntü bu eşik değerine göre ön plan ve arka plan olmak üzere iki sınıfa ayrılmaktadır. MSER yöntemi ise metin olmayan bölgeleri engelleyerek, metin olduğu düşünülen bölgeleri sınırlayıcı kutu içerisine almaktadır. Gerçekleştirilen çalışmada, Otsu metodu ve MSER yöntemi ile ICDAR 2013 veri setinden seçilen 20 doğal görüntü üzerinde metin olan bölgelerinin tespit edilmesi amaçlanmıştır. Doğal görüntü üzerinde bölütleme işlemleri yapıldıktan sonra görüntülere OCR uygulanarak doğal görüntüler üzerindeki metnin tespit edilmesi sağlanmış ve doğruluk oranları karşılaştırılmıştır. Optical character recognition, also known as OCR, is a method for recognizing a word or a phrase in scanned images. It has been developed through years of research. It has had great success in detecting text on scanned images. However, it does not give the desired result in natural images. Therefore, it is necessary to develop special approaches to detect texts in natural images. This study used Otsu and The Maximum Stable Extremal Regions (MSER) image segmentation methods to detect regions with text on natural images. Image segmentation is dividing an image into meaningful regions to analyze it better. In the Otsu model, the most appropriate threshold value is determined for the image, and the image is divided into two classes, foreground, and background, according to this threshold value. On the other hand, the MSER method blocks non-text regions and encloses regions thought to be text in bounding boxes. The study carried out aimed to determine the text areas on 20 natural images selected from the ICDAR 2013 data set with the Otsu method and the MSER method. After segmentation on the natural image, OCR was applied to the images to detect the text on the natural images, and the accuracy rates were compared.