Research Hub

대학 자원

대학 인프라와 자원을 공유해 공동 연구와 기술 활용을 지원합니다.

Loading...

논문 리스트

2023
RoutingConvNet: 양방향 MFCC 기반 경량 음성감정인식 모델 RoutingConvNet: A Light-weight Speech Emotion Recognition Model Based on Bidirectional MFCC
(사)한국스마트미디어학회
양형정, 김수형 외 2명
논문정보
Publisher
스마트미디어저널
Issue Date
2023-06-30
Keywords
-
Citation
-
Source
-
Journal Title
-
Volume
12
Number
5
Start Page
28
End Page
35
DOI
ISSN
22871322
Abstract
본 연구에서는 음성감정인식의 적용 가능성과 실용성 향상을 위해 적은 수의 파라미터를 가지는 새로운 경량화 모델 RoutingConvNet(Routing Convolutional Neural Network)을 제안한다. 제안모델은 학습 가능한 매개변수를 줄이기 위해 양방향 MFCC(Mel-Frequency Cepstral Coefficient)를 채널 단위로 연결해 장기간의 감정 의존성을 학습하고 상황 특징을 추출한다. 저수준 특징 추출을 위해 경량 심층 CNN을 구성하고, 음성신호에서의 채널 및 공간 신호에 대한 정보 확보를 위해 셀프어텐션(Self-attention)을 사용한다. 또한, 정확도 향상을 위해 동적 라우팅을 적용해 특징의 변형에 강인한 모델을 구성하였다. 제안모델은 음성감정 데이터셋(EMO-DB, RAVDESS, IEMOCAP)의 전반적인 실험에서 매개변수 감소와 정확도 향상을 보여주며 약 156,000개의 매개변수로 각각 87.86%, 83.44%, 66.06%의 정확도를 달성하였다. 본 연구에서는 경량화 대비 성능 평가를 위한 매개변수의 수, 정확도 간 trade-off를 계산하는 지표를 제안하였다.

저자 정보

이름 소속
양형정 인공지능융합학과
김수형 인공지능학부