音声からの高精度感情識別法の開発
情報科学部
情報メディア学科
音声・音楽情報処理研究室
鈴木基之
教授
通常音声から感情を識別するには,声の高さや大きさ,声色といった情報を利用しますが,これらは仮に同じ感情で話していても話す内容(言葉)によって大きく変化してしまいます。
そこで「同じ発話内容を無感情で話している音声」を音声合成を用いて準備し,それとの違いを見ることで高精度に感情を識別する方法を開発しています。近年利用が一般的となった大規模事前学習モデルの効果的な利用方法についても検討を行い,簡単な感情認識実験において97%の正解率を達成しました。
論文
「音声合成器の中間表現を利用した発話内容に依存しない感情識別用特徴量の抽出」(2022)八木崇『日本音響学会2022年秋季研究発表会講演論文集』2-Q-32p.1251-1254.
「Improvement of multilingual emotion recognition method based on normalized acoustic features using CRNN」(2022)SuzukiMotoyuki『Proc. 26th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems』p.684-691.
「提示メディアによる感情伝達傾向の差異に関する分析」(2015)土屋誠司『電子情報通信学会論文誌』J98-A-Dp.103–112.