Loading...
2023
RoutingConvNet: 양방향 MFCC 기반 경량 음성감정인식 모델
RoutingConvNet: A Light-weight Speech Emotion Recognition Model Based on Bidirectional MFCC
(사)한국스마트미디어학회
양형정, 김수형 외 2명
논문정보
- Publisher
- 스마트미디어저널
- Issue Date
- 2023-06-30
- Keywords
- -
- Citation
- -
- Source
- -
- Journal Title
- -
- Volume
- 12
- Number
- 5
- Start Page
- 28
- End Page
- 35
- DOI
- ISSN
- 22871322
Abstract
본 연구에서는 음성감정인식의 적용 가능성과 실용성 향상을 위해 적은 수의 파라미터를 가지는 새로운 경량화 모델 RoutingConvNet(Routing Convolutional Neural Network)을 제안한다. 제안모델은 학습 가능한 매개변수를 줄이기 위해 양방향 MFCC(Mel-Frequency Cepstral Coefficient)를 채널 단위로 연결해 장기간의 감정 의존성을 학습하고 상황 특징을 추출한다. 저수준 특징 추출을 위해 경량 심층 CNN을 구성하고, 음성신호에서의 채널 및 공간 신호에 대한 정보 확보를 위해 셀프어텐션(Self-attention)을 사용한다. 또한, 정확도 향상을 위해 동적 라우팅을 적용해 특징의 변형에 강인한 모델을 구성하였다. 제안모델은 음성감정 데이터셋(EMO-DB, RAVDESS, IEMOCAP)의 전반적인 실험에서 매개변수 감소와 정확도 향상을 보여주며 약 156,000개의 매개변수로 각각 87.86%, 83.44%, 66.06%의 정확도를 달성하였다. 본 연구에서는 경량화 대비 성능 평가를 위한 매개변수의 수, 정확도 간 trade-off를 계산하는 지표를 제안하였다.
- 전남대학교
- KCI
- 스마트미디어저널
저자 정보
| 이름 | 소속 |
|---|---|
| 양형정 | 인공지능융합학과 |
| 김수형 | 인공지능학부 |