Research Hub

대학 자원

대학 인프라와 자원을 공유해 공동 연구와 기술 활용을 지원합니다.

Loading...

논문 리스트

2019
멀티 스케일 퓨전 네트워크를 활용한 문서영상 이진화 Document Image Binarization Using Multi-scale Fusion Network
한국정보과학회
논문정보
Publisher
정보과학회논문지
Issue Date
2019-12-31
Keywords
-
Citation
-
Source
-
Journal Title
-
Volume
46
Number
12
Start Page
1314
End Page
1321
DOI
ISSN
2383630X
Abstract
화질이 저하된 문서 이미지의 이진화는 문서 이미지 분석에 중대한 영향을 미친다. 본 논문에서는 다중 스케일 구조를 갖는 LadderNet을 이용하여 저하된 문서 이미지의 기능을 학습하고 노이즈 픽셀로부터 텍스트 및 배경 픽셀을 분류하는 방법을 제시한다. 본 논문에서는 적절히 수정된 형태의 두 가지 LadderNet 아키텍처를 고려한다. 하나는 더 깊은 네트워크 구조이고 다른 하나는 더 얕은 네트워크 구조이며, 각 구조는 문서 이미지 패치를 사용하여 독립적으로 학습된다. 더 작은 크기의 윈도우로 더 깊은 아키텍처에서 생성된 예측 출력에는 텍스트 획이 더 명확하지만 많은 노이즈가 존재한다. 반면에, 더 큰 크기의 윈도우를 갖는 더 얕은 아키텍처로부터는 배경에서 더 낮은 노이즈가 생성된다. 본 논문에서는 이 두 가지 네트워크의 출력을 결합하여 더 나은 결과를 생성한다. 문서 이미지 이진화를 위한 벤치 마크 DIBCO 데이터 세트를 이용한 실험결과, 기존 방법보다 우수한 성능을 보임이 확인되었다.

저자 정보

이름 소속
등록된 데이터가 없습니다.