多様な歌唱スタイルに対応した楽曲検索システム
データベース中から楽曲を検索する際,題目や歌手名,といったメタ情報ではなく,楽曲を直接歌唱することで簡単に検索できるシステムを開発しています。 ハミング歌唱や歌詞による歌唱に加え,擬音語による歌唱にも対応し,またメロディの誤りや歌詞の誤りといった現象に対しても高精度に検索するための各種技術を開発しています。
さまざまな画像認識AIが提案されていますが、画像のどこを見て認識しているのでしょうか?本研究ではAIの認識箇所を特定する技術であるGrad-CAMを利用して認識箇所を可視化し、どこを見て認識しているかを調べました!その結果から次の提案を考えています。1)画像認識AIの精度比較のために、人間が画像を認識している特徴的な箇所とAIの認識箇所を利用する。2)長年の経験や勘が必要な画像識別技術をAIで再現し、無意識に利用していた画像の特定箇所を明らかにする。
論文
「画像認識AIはどこを見ているの?」(2021)『MOBIO産学連携オフィス テーマ別合同シーズ発表会『情報処理・AI編』』
「Grad-CAMを利用した画像認識AIに対する注目箇所特定手法の提案と評価」(2021)『ソフトウェアエンジニアリングシンポジウム2021』p.1-2.
研究シーズ・教員に対しての問合せや相談事項はこちら
技術相談申込フォーム© INNOVATION DAYS 2021 智と技術の見本市.