Research Hub

대학 자원

대학 인프라와 자원을 공유해 공동 연구와 기술 활용을 지원합니다.

Loading...

논문 리스트

2018
단어의 의미와 문맥을 고려한 순환신경망 기반의 문서 분류 Document Classification using Recurrent Neural Network with Word Sense and Contexts
한국정보처리학회
양형정, 박혁로 외 2명
논문정보
Publisher
정보처리학회논문지. 소프트웨어 및 데이터 공학
Issue Date
2018-07-31
Keywords
-
Citation
-
Source
-
Journal Title
-
Volume
7
Number
7
Start Page
259
End Page
266
DOI
ISSN
22875905
Abstract
본 논문에서는 단어의 순서와 문맥을 고려하는 특징을 추출하여 순환신경망(Recurrent Neural Network)으로 문서를 분류하는 방법을 제안한다. 단어의 의미를 고려한 word2vec 방법으로 문서내의 단어를 벡터로 표현하고, 문맥을 고려하기 위해 doc2vec으로 입력하여 문서의 특징을추출한다. 문서분류 방법으로 이전 노드의 출력을 다음 노드의 입력으로 포함하는 RNN 분류기를 사용한다. RNN 분류기는 신경망 분류기 중에서도 시퀀스 데이터에 적합하기 때문에 문서 분류에 좋은 성능을 보인다. RNN에서도 그라디언트가 소실되는 문제를 해결해주고 계산속도가빠른 GRU(Gated Recurrent Unit) 모델을 사용한다. 실험 데이터로 한글 문서 집합 1개와 영어 문서 집합 2개를 사용하였고 실험 결과 GRU 기반 문서 분류기가 CNN 기반 문서 분류기 대비 약 3.5%의 성능 향상을 보였다.

저자 정보

이름 소속
양형정 인공지능융합학과
박혁로 소프트웨어공학과