Loading...
2023
ChatGPT를 활용한 텍스트 데이터에서 키워드 추출: 수동방식과의 유사도 비교를 중심으로
한국교육공학회
류지헌 외 6명
논문정보
- Publisher
- 교육공학연구
- Issue Date
- 2023-12-31
- Keywords
- -
- Citation
- -
- Source
- -
- Journal Title
- -
- Volume
- 39
- Number
- 4
- Start Page
- 1337
- End Page
- 1368
- ISSN
- 1225424X
Abstract
이 연구의 목적은 텍스트 마이닝 분야에서 키워드 추출 작업을 사람이 했을 때와 ChatGPT를 활용했을 때의 결과가 얼마나 유사한지 비교하는 것이다. 이를 위해 짧은 길이의 텍스트 데이터에서 키워드를 추출하는 경우를 비교했다. 분석 대상이 된 데이터는 선행연구를 통해 확보한 수동방법 키워드 추출 작업이 완료된 교육대학원 AI융합교육전공 442개 교과목명 데이터이다. 이 데이터에는 해당 분야 전문가 3명이 각 교과목명에서 최대 3개까지의 키워드를 추출한 결과가 포함되었다. ChatGPT 활용법의 경우, ChatGPT API를 활용하여 GPT-3.5 모델과 GPT-4.0 모델로 442개 교과목명에서 최대 3개까지 키워드를 추출했다. 수동방식, GPT-3.5, GPT-4.0, 이 세 방법 간의 유사도를 자카드 계수(Jaccard Coefficient)로 비교하였으며, 0.50 이상일 때 유사한 것으로 간주하였다. 삼자 간 비교 결과, GPT-3.5와 GPT-4.0 사이는 약 0.69, 수동방식과 GPT-3.5 사이는 약 0.50, 수동방식과 GPT-4.0 사이는 약 0.48의 유사도를 보였다. 수동방식과 ChatGPT 방식 간의 키워드 추출 결과에서 발견된 여러 특징들을 보고하였다. 이 연구의 의의로는, 짧은 한국어 텍스트에서 키워드를 추출할 때 ChatGPT 방식이 아직 인간 수동방식을 대체할 수 있다고 보기엔 어렵지만, 충분한 가능성을 확인할 수 있었다는 것에 있다.
- 전남대학교
- KCI
- 교육공학연구
저자 정보
| 이름 | 소속 |
|---|---|
| 류지헌 | 교육학과 |