Loading...
2006
주성분 보유수에 따른 중요 용어 추출의 비교
Comparison of Significant Term Extraction Based on the Number of Selected Principal Components
한국정보처리학회
박혁로
논문정보
- Publisher
- 정보처리학회논문지B
- Issue Date
- 2006-06-03
- Keywords
- -
- Citation
- -
- Source
- -
- Journal Title
- -
- Volume
- 13
- Number
- 3
- Start Page
- 329
- End Page
- 336
- DOI
- ISSN
- 1598284X
Abstract
문서를 구성하는 단어들은 서로 연관이 있다는 정보를 충분히 이용할 수 있는 다변량 분석 방법 중, 주성분분석(Principal Component Analysis)을 이용하여 중요 용어를 추출하고자 한다. 본 논문에서는 주성분분석의 분석 대상을 용어 사이의 공분산행렬이 아닌 상관행렬을 이용한다. 그리고, 중요 용어를 추출하기 위해서, 보유해야 할 주성분 개수와 주성분과 용어 사이의 상관계수에 대한 최적의 임계치를 찾고자 한다. 283건의 신문기사를 대상으로, 추출된 용어에 기반한 문장 추출 실험 결과, 첫 6개까지의 주성분과 상관계수 |0.4|라는 조건에서 가장 좋은 성능을 보였다.
- 전남대학교
- KCI
- 정보처리학회논문지B
저자 정보
| 이름 | 소속 |
|---|---|
| 박혁로 | 소프트웨어공학과 |