0 瀬尾 昌孝 二次元画像1枚からの表情変化動画像のリアルタイム生成 深層生成モデルを用いて,1枚の二次元顔画像から表情変化動画像の自動生成を行った.現状,動画像のサイズは500×500pixel程度だが、超解像度、ネットワーク規模削減手法を組み合わせることでリアルタイムの生成を実現した.本研究はビデオ会議システムにおけるアバターの自動生成を想定して行っており、今後は応用システムの開発に取り組む予定である.
+1 瀬尾 昌孝 二次元画像1枚からのキャラクターの姿勢制御 三次元構造や動きに関する特徴を獲得可能な深層生成モデルに人間の取り得る姿勢を学習させることで,類似の形状を持つ対象(本研究ではキャラクター)の姿勢制御を実現した.未知の二次元画像1枚からの姿勢制御が可能である.本研究は映像制作支援システムとしての発展を想定している.
0 平 博順 深層学習を用いた機械読解技術 私たちの研究室では、英語の入試問題などを題材にして機械読解技術の精度向上に取り組んでいます。最新の深層学習(ディープラーニング)手法を用いることで、従来の単語レベルの解析から文章レベルへの解析が可能となり、読解精度が向上しました。
0 佐野 睦夫 AI画像認識による作業の可視化・生産性向上とXR技術によるスキル継承 データを基に時間の速さをスコアとして強化学習を行い, 最適化された作業の動きと新人の動きを比較できるようにARグラス等を用いて可視化
0 瀬尾 昌孝 深層学習における判断根拠の理解可能な潜在変数空間 深層学習は精度の高い処理を実現できるものの,判断根拠の理解が困難になりがちである.判断根拠が理解できないままでは実応用上問題が発生するケースも多い.例えば医用データ解析など,答えを誤った際の被害が甚大となる分野では現在でもこのような手法の全面利用が法律上規制されている.これに対し,本研究では潜在変数空間のdisentanglement化手法を応用して,目的とするタスクに関係の無い特徴を排除することで,判断根拠の理解が容易な潜在変数空間の獲得を実現した. 本報告では実応用を想定した課題として,撮影環境の大きく異なる顔画像における表情認識などを扱う.この課題では被験者情報以外にも照明や化粧など,表情認識に関係の無い様々なバリエーションを持つデータベースを構築し,学習に際して表情認識に不要な特徴を取り除く手法を開発した.本手法を応用することで,表情認識精度と判断根拠可読性の向上を実現した.