Research Hub

대학 자원

대학 인프라와 자원을 공유해 공동 연구와 기술 활용을 지원합니다.

Loading...

논문 리스트

2006
주성분 보유수에 따른 중요 용어 추출의 비교 Comparison of Significant Term Extraction Based on the Number of Selected Principal Components
한국정보처리학회
박혁로
논문정보
Publisher
정보처리학회논문지B
Issue Date
2006-06-03
Keywords
-
Citation
-
Source
-
Journal Title
-
Volume
13
Number
3
Start Page
329
End Page
336
DOI
ISSN
1598284X
Abstract
문서를 구성하는 단어들은 서로 연관이 있다는 정보를 충분히 이용할 수 있는 다변량 분석 방법 중, 주성분분석(Principal Component Analysis)을 이용하여 중요 용어를 추출하고자 한다. 본 논문에서는 주성분분석의 분석 대상을 용어 사이의 공분산행렬이 아닌 상관행렬을 이용한다. 그리고, 중요 용어를 추출하기 위해서, 보유해야 할 주성분 개수와 주성분과 용어 사이의 상관계수에 대한 최적의 임계치를 찾고자 한다. 283건의 신문기사를 대상으로, 추출된 용어에 기반한 문장 추출 실험 결과, 첫 6개까지의 주성분과 상관계수 |0.4|라는 조건에서 가장 좋은 성능을 보였다.

저자 정보

이름 소속
박혁로 소프트웨어공학과