画像認識 AI はどこを見ているの?
さまざまな画像認識AIが提案されていますが、画像のどこを見て認識しているのでしょうか?本研究ではAIの認識箇所を特定する技術であるGrad-CAMを利用して認識箇所を可視化し、どこを見て認識しているかを調べました!その結果から次の提案を考えています。1)画像認識AIの精度比較のために、人間が画像を認識している特徴的な箇所とAIの認識箇所を利用する。2)長年の経験や勘が必要な画像識別技術をAIで再現し、無意識に利用していた画像の特定箇所を明らかにする。
近年,大規模言語モデルをはじめとした深層学習技術に注目が集まり,多くのアプリケーションが性能を競い合っている.構造に複雑化した深層学習モデルの構造を人の手で設計することは困難なため,モデル構造の最適化を意味するNeural Architecture Search(NAS)手法が数多く開発されている.一般的にNASでは推論性能を最大化するようにモデル構造を作成する.しかし,ハイエンドな深層学習モデルは,非常に高コストな計算処理を要求するため,個人の所有するロースペックな計算機では高度なAIアプリケーションを利用することはできない.今後,AI技術が広く普及していくため,ユーザの持つ計算機スペックと推論性能のトレードオフを考慮した多目的NASアルゴリズムの開発を行っている.
研究シーズ・教員に対しての問合せや相談事項はこちら
技術相談申込フォーム© INNOVATION DAYS 2025 智と技術の見本市.