音声からの高精度感情識別法の開発
通常音声から感情を識別するには,声の高さや大きさ,声色といった情報を利用しますが,これらは仮に同じ感情で話していても話す内容(言葉)によって大きく変化してしまいます。 そこで「同じ発話内容を無感情で話している音声」を音声合成を用いて準備し,それとの違いを見ることで高精度に感情を識別する方法を開発しています。近年利用が一般的となった大規模事前学習モデルの効果的な利用方法についても検討を行い,簡単な感情認識実験において97%の正解率を達成しました。
さまざまな画像認識AIが提案されていますが、画像のどこを見て認識しているのでしょうか?本研究ではAIの認識箇所を特定する技術であるGrad-CAMを利用して認識箇所を可視化し、どこを見て認識しているかを調べました!その結果から次の提案を考えています。1)画像認識AIの精度比較のために、人間が画像を認識している特徴的な箇所とAIの認識箇所を利用する。2)長年の経験や勘が必要な画像識別技術をAIで再現し、無意識に利用していた画像の特定箇所を明らかにする。
論文
「画像認識AIはどこを見ているの?」(2021)『MOBIO産学連携オフィス テーマ別合同シーズ発表会『情報処理・AI編』』
「Grad-CAMを利用した画像認識AIに対する注目箇所特定手法の提案と評価」(2021)『ソフトウェアエンジニアリングシンポジウム2021』p.1-2.
研究シーズ・教員に対しての問合せや相談事項はこちら
技術相談申込フォーム© INNOVATION DAYS 2025 智と技術の見本市.