視覚障害者の映画鑑賞のための骨伝導ヘッドフォンによる音声ガイド配信
視覚障害者が映画鑑賞するとき,セリフとセリフの間に説明音声が流れる音声ガイドをヘッドフォンで聴取する方法が主流であるが、ヘッドフォンで耳を塞いでしまうため、映画館のマルチチャンネル臨場感音声を楽しめないという問題があった。そこで、音声ガイドを耳を塞がない骨伝導ヘッドフォンで聞き、映画館の臨場感音声は直接耳で聞くシステムを開発した。
深層生成モデルを用いて,1枚の二次元顔画像から表情変化動画像の自動生成を行った.現状,動画像のサイズは500×500pixel程度だが、超解像度、ネットワーク規模削減手法を組み合わせることでリアルタイムの生成を実現した.本研究はビデオ会議システムにおけるアバターの自動生成を想定して行っており、今後は応用システムの開発に取り組む予定である.
研究シーズ・教員に対しての問合せや相談事項はこちら
技術相談申込フォーム