Research Hub

대학 자원

대학 인프라와 자원을 공유해 공동 연구와 기술 활용을 지원합니다.

Loading...

논문 리스트

2005
문자 별 특징 모델을 이용한 한글 문서 영상에서 키워드 검색 Keyword Spotting on Hangul Document Images Using Character Feature Models
한국정보처리학회
박상철, 김수형 외 1명
논문정보
Publisher
정보처리학회논문지B
Issue Date
2005-10-01
Keywords
-
Citation
-
Source
-
Journal Title
-
Volume
12
Number
6
Start Page
521
End Page
526
DOI
ISSN
1598284X
Abstract
본 논문에서는 저 품질의 한글 문서 영상에서 OCR 기반 검색 시스템의 대안으로 키워드 검출 시스템(Keyword Spotting)을 제안하고 OCR 기반 문서 검색 시스템과 비교한다. 제안 시스템은 문자 분할, 키워드 특징 추출 그리고 단어 매칭으로 구성된다. 문자 분할 단계에서는 인접한 두 문자간의 연결을 효과적으로 분리하면서 문자 넓이 값의 분산이 최소가 되도록 하는 문자 분할 방법을 제안한다. 키워드 특징은 서체별 문자 모델의 결합으로 구성한다. 단어 매칭 단계에서는 문자 매칭에 기반한 단어 대 단어 매칭 방법을 적용한다. 본 논문에서 제안한 키워드 검출 시스템의 성능을 평가하기 위해 한글 문서 영상을 대상으로 OCR 기반 문서 검색 시스템과 비교하였다. 그 결과 한글 글자 크기가 작고 문서의 상태가 좋지 않은 경우 제안한 키워드 검출 시스템에 의한 검색 성능이 OCR 기반 검색 시스템 보다 우수함을 입증하였다. 攀※이 논문은 2004년도 산업자원부의 지역혁신인력양성사업의 지원에 의하여 연구되었음.†준 회 원:전남대학교 자연과학대학 전산학과 박사과정 ††정 회 원:전남대학교 자연과학대학 전산학과 교수†††종신회원:전남대학교 자연과학대학 전산학과 교수논문접수:2005년 6월 21일, 심사완료:2005년 8월 18일

저자 정보

이름 소속
박상철 전산학과
김수형 인공지능학부