logo main logo main
  • ホーム
  • ご挨拶
  • 研究シーズ
    • 研究シーズ条件検索
    • 研究シーズ一覧
    • キーワード一覧
  • 学部学科一覧
    • 工学部
      • 都市デザイン工学科
      • 建築学科
      • 機械工学科
      • 電気電子システム工学科
      • 電子情報システム工学科
      • 応用化学科
      • 環境工学科
      • 生命工学科
      • 一般教育科
      • 総合人間学系教室
      • ナノ材料マイクロデバイス研究センター
      • インキュベーションラボ
      • その他
    • ロボティクス&デザイン工学部
      • ロボット工学科
      • システムデザイン工学科
      • 空間デザイン学科
      • その他
    • 情報科学部
      • 情報知能学科
      • 情報システム学科
      • 情報メディア学科
      • ネットワークデザイン学科
      • その他
    • 知的財産学部
      • 知的財産学科
    • 知的財産研究科
    • その他
      • 教務部
        • 教職教室
        • 教育センター
        • ランゲージラーニングセンター
        • その他
      • 情報センター
      • 八幡工学実験場
      • ものづくりセンター
      • ロボティクス&デザインセンター
  • 協力機関コーナー
    • 大阪産業技術研究所
    • 大阪商工会議所
    • 大阪信用金庫
  • 特集コーナー
    • イノベーション・ジャパン2020~大学見本市Online
    • 動画コーナー
    • 八幡工学実験場バーチャルツアー
大阪工業大学
logo main logo main
  • ホーム
  • ご挨拶
  • 研究シーズ
    • 研究シーズ条件検索
    • 研究シーズ一覧
    • キーワード一覧
  • 学部学科一覧
    • 工学部
      • 都市デザイン工学科
      • 建築学科
      • 機械工学科
      • 電気電子システム工学科
      • 電子情報システム工学科
      • 応用化学科
      • 環境工学科
      • 生命工学科
      • 一般教育科
      • 総合人間学系教室
      • ナノ材料マイクロデバイス研究センター
      • インキュベーションラボ
      • その他
    • ロボティクス&デザイン工学部
      • ロボット工学科
      • システムデザイン工学科
      • 空間デザイン学科
      • その他
    • 情報科学部
      • 情報知能学科
      • 情報システム学科
      • 情報メディア学科
      • ネットワークデザイン学科
      • その他
    • 知的財産学部
      • 知的財産学科
    • 知的財産研究科
    • その他
      • 教務部
        • 教職教室
        • 教育センター
        • ランゲージラーニングセンター
        • その他
      • 情報センター
      • 八幡工学実験場
      • ものづくりセンター
      • ロボティクス&デザインセンター
  • 協力機関コーナー
    • 大阪産業技術研究所
    • 大阪商工会議所
    • 大阪信用金庫
  • 特集コーナー
    • イノベーション・ジャパン2020~大学見本市Online
    • 動画コーナー
    • 八幡工学実験場バーチャルツアー
大阪工業大学
logo main logo light
研究シーズを検索
  • ホーム
  • ご挨拶
  • 研究シーズ
    • 研究シーズ条件検索
    • 研究シーズ一覧
    • キーワード一覧
  • 学部学科一覧
    • 工学部
      • 都市デザイン工学科
      • 建築学科
      • 機械工学科
      • 電気電子システム工学科
      • 電子情報システム工学科
      • 応用化学科
      • 環境工学科
      • 生命工学科
      • 一般教育科
      • 総合人間学系教室
      • ナノ材料マイクロデバイス研究センター
      • インキュベーションラボ
      • その他
    • ロボティクス&デザイン工学部
      • ロボット工学科
      • システムデザイン工学科
      • 空間デザイン学科
      • その他
    • 情報科学部
      • 情報知能学科
      • 情報システム学科
      • 情報メディア学科
      • ネットワークデザイン学科
      • その他
    • 知的財産学部
      • 知的財産学科
    • 知的財産研究科
    • その他
      • 教務部
        • 教職教室
        • 教育センター
        • ランゲージラーニングセンター
        • その他
      • 情報センター
      • 八幡工学実験場
      • ものづくりセンター
      • ロボティクス&デザインセンター
  • 協力機関コーナー
    • 大阪産業技術研究所
    • 大阪商工会議所
    • 大阪信用金庫
  • 特集コーナー
    • イノベーション・ジャパン2020~大学見本市Online
    • 動画コーナー
    • 八幡工学実験場バーチャルツアー
研究シーズを探す
カテゴリー・キーワードから探す
SDGsの分類
  • 1. 貧困をなくそう
  • 2. 飢餓をゼロに
  • 3. すべての人に健康と福祉を
  • 4. 質の高い教育をみんなに
  • 5. ジェンダー平等を実現しよう
  • 6. 安全な水とトイレを世界中に
  • 7. エネルギーをみんなに そしてクリーンに
  • 8. 働きがいも経済成長も
  • 9. 産業と技術革新の基盤をつくろう
  • 10. 人や国の不平等をなくそう
  • 11. 住み続けられるまちづくりを
  • 12. つくる責任 つかう責任
  • 13. 気候変動に具体的な対策を
  • 14. 海の豊かさを守ろう
  • 15. 陸の豊かさも守ろう
  • 16. 平和と公正をすべての人に
  • 17. パートナーシップで目標を達成しよう
  • 該当無し
テーマの分類
  • IT・IoT・AI・ロボティクス
  • 建築
  • 土木・社会基盤
  • エネルギー・環境
  • ライフサイエンス
  • ものづくり・製造技術
  • ナノ・材料
  • デザイン
  • 人文学
  • 自然科学
  • 該当無し
学部・学科の分類
  • 工学部
    • 都市デザイン工学科
    • 建築学科
    • 機械工学科
    • 電気電子システム工学科
    • 電子情報システム工学科
    • 応用化学科
    • 環境工学科
    • 生命工学科
    • 一般教育科
    • 総合人間学系教室
    • ナノ材料マイクロデバイス研究センター
  • ロボティクス&デザイン工学部
    • ロボット工学科
    • システムデザイン工学科
    • 空間デザイン学科
  • 情報科学部
    • 情報知能学科
    • 情報システム学科
    • 情報メディア学科
    • ネットワークデザイン学科
    • その他
  • 知的財産学部
    • 知的財産学科
  • 知的財産研究科
  • 教務部
    • 教育センター
    • ランゲージラーニングセンター
  • 情報センター
  • 八幡工学実験場
  • ものづくりセンター
  • 該当無し
キーワード
  • 遺伝的アルゴリズム
  • 再生可能エネルギー
  • ワークショップ
  • アーカイブ研究
  • コミュニケーション支援
  • 植物工場
  • ごみ処理
  • 細胞老化
  • AI(人工知能)
  • 生体素材
  • 制御工学
  • 都市計画
  • 光物性
  • 景観
  • プログラミング教育
  • くずし字
  • 機械学習
  • 関連性理論
  • 地盤防災
  • 画像修復

すべてのキーワードを見る

ホーム強化学習を用いたロボットの知能化
SDGsの分類
研究テーマ
IT・IoT・AI・ロボティクス
学科の分類
情報科学部情報知能学科

強化学習を用いたロボットの知能化

情報科学部

情報知能学科

学習・先進知能システム研究室

小谷直樹 講師

強化学習機械学習人工知能

近年,人工知能・機械学習技術の発展もあり,これらの知能化技術をロボットの環境適応能力や自律性の付与の手段として用いることが期待されています.しかし,強化学習を含む機械学習は,一般的に多くの学習時間を必要とする根本的な問題を抱えています.従って,学習時間を短縮することが,実時間で学習する実ロボットにとって,特に解決すべき重要な課題です.私達は,遺伝的アルゴリズムの概念で説明した学習高速化手法を開発し,より高度なロボットの知能化の実現を目指しています.

研究背景と目的

人手不足の問題解消や危険な環境下で人に代わって作業するために,ロボットを活用することが期待されています.これを実現する方法として,環境に応じた行動を自律的に学習する人工知能・機械学習技術の一つである強化学習を用いたアプローチが考えられます.

強化学習は,エージェントと呼ばれる学習主体が,環境から得られる報酬を最大化するような行動を自律的に学習する手法です.

人手不足の問題解消や危険な環境下で人に代わって作業するために,ロボットの活用が期待されている.これを実現する方法として,環境に応じた行動を自律的に学習する人工知能・機械学習技術の一つである強化学習を用いたアプローチが考えられる.
知能化技術による環境適応能力の向上がロボットの活用範囲を広げる
転移学習の有無によるエージェントの学習イメージの違い

強化学習の問題点と転移学習

  • 強化学習(RL)だけでは,個々のタスクを個別に学習するため,全てのタスクに対して,同じコストをかけて試行錯誤で学習します.また,獲得した知識は互いに独立しており,利用できません(図左).
  • 提案手法では,強化学習に転移学習(TL)を加えることで,獲得した知識の中から使えるものを利用できるようになります.また,不要な知識を削除して計算量を減らすことも可能です(図右).

提案する学習手法

  • 強化学習の一手法であるActor-Criticをベースにした学習アルゴリズム

  • 環境から得られる状態は,ニューラルネットワークの1つであるFuzzy ARTでクラスタリングしながら状態空間を構築

  • ロボットの行動を表す政策はガウス分布で表現

  • 知識の転移・消去・ランダムな政策を遺伝的アルゴリズムの交叉・淘汰・突然変異の概念で表現

提案する学習アルゴリズムのイメージ図
6リンクロボットアームの軌道学習問題

学習性能検証実験:6リンクロボットアームの軌道学習問題

実験目的

強化学習のみの従来法と知識の転移が可能な提案手法の学習性能を比較

学習条件

  • 障害物の位置が異なる10個のタスクを学習
  • 1万試行ごとに障害物の位置を変える
  • 1試行50step以内で,アームの先端がゴール内に入れば報酬+10,失敗時の報酬はなし
  • エージェントは,アームの関節の動かし方を学習する

実験結果

提案手法を用いて学習した結果(赤)と,強化学習のみを用いた結果(青)を示します.提案手法の方が,ゴールへ到達する成功率が高く,知識転移によって,早期に学習可能であることが分かります.また,提案手法は短い時間で学習できており,従来手法と比べると提案手法が優れていることが分かります.

シミュレーション実行時間比較

  • 提案手法:10.2 h

  • 従来手法:86.5 h

 

知識転移の有無による学習曲線の比較(赤:提案手法,青:従来手法)
IMG_3185

ヒューマノイドロボットの知能化に向けた研究

提案手法を実際のロボットに適用することを目指して研究を行っています.写真は,小型のヒューマノイドロボットです.現在,このヒューマノイドロボットを使って,動作生成実験に取り組んでいます.提案手法の有効性の評価だけでなく,実環境下での学習における課題の抽出も行っています.

論文

「学習時間の短縮に向けた状態価値を用いた知識転移手法」(2017)小谷直樹『電気学会論文誌C』137(9)p.1171-1176.

「知識の転移と選別機能を備えた強化学習手法の複数タスク下における性能検証」(2016)小谷直樹『システム制御情報学会論文誌』p.152-154.

「転移学習における価値に基づく知識の選別」(2015)小谷直樹『システム制御情報学会論文誌』28(6)p.275-283 .

研究者INFO: 情報科学部 情報知能学科 学習・先進知能システム研究室 小谷直樹 講師

研究シーズ・教員に対しての問合せや相談事項はこちら

技術相談申込フォーム
SDGs
研究テーマ
  • IT・IoT・AI・ロボティクス
  • 建築
  • 土木・社会基盤
  • エネルギー・環境
  • ライフサイエンス
  • ものづくり・製造技術
  • ナノ・材料
  • デザイン
  • 人文学
  • 自然科学
  • 該当無し
学部・学科
  • 工学部
    • 都市デザイン工学科
    • 建築学科
    • 機械工学科
    • 電気電子システム工学科
    • 電子情報システム工学科
    • 応用化学科
    • 環境工学科
    • 生命工学科
    • 一般教育科
    • 総合人間学系教室
    • ナノ材料マイクロデバイス研究センター
  • ロボティクス&デザイン工学部
    • ロボット工学科
    • システムデザイン工学科
    • 空間デザイン学科
  • 情報科学部
    • 情報知能学科
    • 情報システム学科
    • 情報メディア学科
    • ネットワークデザイン学科
    • その他
  • 知的財産学部
    • 知的財産学科
  • 知的財産研究科
  • 教務部
    • 教育センター
    • ランゲージラーニングセンター
  • 情報センター
  • 八幡工学実験場
  • ものづくりセンター
  • 該当無し
キーワード
  • 遺伝的アルゴリズム
  • 光物性
  • 細胞老化
  • 制御工学
  • 画像修復
  • プログラミング教育
  • 生体素材
  • 植物工場
  • アーカイブ研究
  • ワークショップ
  • 再生可能エネルギー
  • ごみ処理
  • 関連性理論
  • 都市計画
  • 地盤防災
  • コミュニケーション支援
  • 機械学習
  • くずし字
  • 景観
  • AI(人工知能)

すべてのキーワードを見る

同じカテゴリーの研究シーズ

吉田 福蔵

熱刺激電流からのトラップの分布状態可視化による信号の分離解析

電気・電子デバイス素子の改善・高性能化にあたり, 電気伝導に影響を与える材料内部の欠陥準位や空間電荷そして添加剤等を調べることは重要であり, 従来からの大きな課題である. 熱刺激電流(TSC)はまさに材料内部で電荷が移動する変位を高感度に計測できる.測定後の評価に, 従来の評価法の概念を超えた最新の解析法がある. つまりTSCスペクトルのトラップ状態可視化技術は, 一度の実験で得られたあらゆる形状のTSCスペクトルを, 全体にわたってトラップ状態を可視化することで, 正確な信号の分離から解析までを実現できる.

小林 正治

リサイクル可能なエーテル系溶媒を用いる環境適合型有機合成法

有機合成化学における反応溶媒の役割は極めて重大であり,特に大規模な工場レベルでの製造プロセスでは,原料や試薬に対する相溶性に加えて,安定性,回収・再利用性,安全性,価格などに優れた溶媒が求められている.発表者は,今世紀に開発された日本発の疎水性エーテル系溶媒,シクロペンチルメチルエーテル(CPME)ならびに4-メチルテトラヒドロピラン(4-MeTHP)の基本有機化学特性を解明し,幅広い有機合成反応における溶媒としての活用法を提案した.

伊與田 宗慶

部材のマルチマテリアル化を達成する抵抗発熱を活用した接合技術

 近年の自動車産業では,車体重量の低減を目的として,車体構造部材に対して従来の鉄のみならず,アルミニウム合金や樹脂材料を組み合わせるマルチマテリアル化が推進されている.中でも,鉄とアルミニウム合金を組み合わせたFe-Al異種金属材料の活用が期待されている一方で,その接合部において剥離強度である十字引張強さの低下が懸念されている.そこでFe-Al異種金属材料継手の接合強度向上に寄与する抵抗スポット溶接手法について開発を行った事例を紹介する.

小松 信雄

移動体の制御に関する研究

自動車や飛行機などの移動体の制御に関する位置計測システム,誘導制御システムの構築を目指して研究を行っている.位置計測システムについては,加速度計,ジャイロ,画像処理を用いた計測を融合し,移動体の位置を瞬時に計測することを目標にしている.誘導制御については,移動体の3次元的位置姿勢を制御するため,制御システムの動的特性を推定する同定を行ない,安定化制御を実現することを目標にしている.

大島 一能

IoTとAIを活用したネットワークデザイン手法

 情報通信ネットワーク研究室では、IoTネットワーク技術や機械学習、AIを活用したネットワークデザイン手法の研究に取組んでいます。本サイトでは次の各テーマの概要を説明させて頂きます。 (1) 深層学習を活用した屋内位置検出: GPSなどの電波受信が難しい屋内で位置情報を利用するサービスの需要が拡大しています。BLE の電波強度(RSSI)を深層学習により分析して位置検出を行う手法を研究しています。 (2) AIを活用した局地的豪雨予測方式: 降雨観測レーダや雲画像等の気象データを活用した局地的豪雨の予測方式を研究しています。 (3) その他の研究課題: IoT と AI を活用したドローン自律制御方式や可視光LED通信の応用システム等も進めています。

重弘 裕二

遺伝的アルゴリズムに基づく鉄道ダイヤの生成自動化

現代社会において鉄道は不可欠なものとなっており、鉄道ダイヤの乱れは多くの人に影響を及ぼす。しかしダイヤの乱れは様々な原因によって生じるため、完全になくすことは難しい。ダイヤの乱れが生じると運行計画の変更を行う必要があるが、変更案の作成は人手に頼らざるを得ないため、多大な時間が必要となる。そこで本研究では、研究の最初の段階として、遺伝的アルゴリズムを用いて鉄道ダイヤの自動生成を試みる。

西川 出

デジタル画像相関法によるき裂・欠陥の非破壊検査

負荷を受ける部材の表面画像を2枚(時間差1秒程で2枚撮影する)利用して、表面のひずみ分布を非接触で評価するデジタル画像相関法援用変位・ひずみ評価システムを構築した。さらにこれを発展させ、き裂や欠陥に生じる特有のひずみ場を利用することにより、き裂・欠陥の有無は言うに及ばず、き裂周りの応力や応力拡大係数といった力学量を高精度に非接触評価できるシステムを開発した。

真貝 寿明

宇宙物理学・相対性理論研究のアウトリーチ活動

アインシュタインが相対性理論を提唱して100年が経ち,技術が進化して,ようやく重力波・ブラックホールの直接観測ができる時代になりました.日本の重力波観測プロジェクトKAGRA(かぐら)の科学部門を2017年より取りまとめ,一般向けの著作や講演も多く手掛けている教員が,この分野の解説を提供いたします.「相対性理論はどこまで正しいのか」「宇宙への理解は今後どう深まっていくのか」などをテーマに,歴史的・科学的どちらの視点からも可能です.

雨宮 徹

生きる意味の研究

 ニヒリズム(この世界は生きるに値しないという世界観)の克服をテーマに、主にフランクル(V.E.Frankl,1905-1997)の意味の思想の研究を行っている。ユダヤ人であるフランクルは、強制収容所の体験記『夜と霧』によって世界的に有名であるが、精神科医としてニヒリズムの克服を一生のテーマとし続けた人物である。全体像が見えづらく断片的な印象を与えるフランクルの思想を、哲学の立場から体系化し、理解を深め、そこからニヒリズムを克服しうる理論を明確にすることを目的としている。 

田岡 育恵

オクシモロンの謎―意味の矛盾と伝達効果

オクシモロンとは「小さな巨人」のように反対の意味が同じ対象に適用されるレトリックである.「小さくて大きいものは何だ?」とすれば「なぞなぞ」にもなり得るが,字義通りに考えれば反対語が共起しているのだから矛盾することになる.しかし,実際には意味解釈に支障は来さない.それどころかこのレトリックならではの伝達効果がある.オクシモロンの構造,伝達効果は私の研究テーマの一つである.

小林 弘一

レーダ画像からレーダ断面積とアンテナパターンが評価できる?!

電気長の非常に大きな物体のレーダ断面積、アンテナパターンの計測は困難を極めます。このため、物体近傍の散乱電磁界を計測し、逆合成開口による画像処理後、遠方電磁界を数学的に評価する方法を確立、提案しています。

谷口 浩成

筋萎縮と関節拘縮を予防する足関節多自由度運動装置

筋萎縮と関節拘縮の予防には,関節可動域(ROM)訓練や筋肉や腱のストレッチなどによって,対象の部位を動かすことが重要である.このような運動は,理学療法士などの介助者によって実施され,患者に合わせて複数の動作を実施する.本研究は,独自に開発した空気圧ソフトアクチュエータを用いることで,足関節のROM訓練やストレッチ運動など多様な動作を実現できるリハビリテーションシステムの開発である.本アクチュエータの柔軟性を利用することで,患者に対して安全で予防に必要な多様な動作を提供できる点が特長である.

小林 昭寛

知的財産研究科シーズ一覧

大学院 知的財産研究科の研究シーズ一覧です.

前元 利彦

未来の生活を変える新機能デバイスの開発

今まで半導体として利用されてきたシリコンに比べて異なる性質のもつ半導体や、透明でしなやかな材料を研究することで、新しい機能を持った素子の実現を目指します。たとえば、酸化物半導体に関する研究では透明なディスプレイ・情報端末を実現するための技術や、自在に曲げられるデバイス・センサに関する研究を進めています。これらの技術は未来の生活の利便性を大幅に高めます。

福原 和則

ローコストで可変性のあるイベント空間の創出

ダンボールを加工して構造体をつくります。この構造体を組み合わせて、建築の柱梁構造のようなフレームを構築して、簡易なイベント空間を創出します。ダンボールは安価で軽量で再生可能な材料です。自在に組み合わせて、イベント活動に合わせた会場設定が可能です。

横山 奨

樹脂製マイクロ流体デバイスの量産に向けた拡散接合装置の開発

本技術は、主に金属の接合に用いられていた拡散接合を高分子樹脂に適用することで、医療用ディスポーザブルマイクロ流体デバイスの安価な量産の実現を目標としています。拡散接合は、母材を溶かすことなく接合界面を一体化するため、接合により透明性を損なうことはありません。さらに、多少の凹凸や切削痕が残っていても接合可能です。加工面への後処理も不要で、多種多様な高分子樹脂に対応可能です。現在、商用利用を目指して試作機を開発しており、テストサンプルとしてPMMA製のマイクロ流体デバイスの接合に成功しています。

井原 之敏

多軸制御工作機械の加工精度向上

除去加工を行う工作機械は、機械の精度が悪いと加工方法や工具がどんなに良いものを使用しても加工されたものの精度はよくなりません(母性原則)。しかし、機械そのものの精度はあまり見えてこないのが実情です。特に多軸制御工作機械は機械そのものの精度を検査する方法も定まったものが存在しません。そこで私たちの研究室では機械の運動精度を検査する方法を提案し実施することでまず機械の精度を保証し、そのうえで加工方法について提案を行っています。

宮脇 健三郎

ROS対応オリジナルロボットによるPBL教育

大阪工業大学ではロボカップジャパンオープンにおいて@ホームリーグという競技に2011年から参加し,PBLのテーマとして活用している. PBLにおいては小型の車輪移動ロボットと大型の競技用ロボットを使い分け,効率的に学習を進められるように配慮している。

鵜飼 孝博

非接触型の空間温度分布計測手法

光の屈折を利用した空間の温度分布の計測手法を開発しました.航空機・自動車・流体機械・家電の周辺に生じる熱の移流などの流体現象の把握に役立ちます.現在,複雑な流れ場にも適用できる手法の開発にも取り組んでいます.

奥 宏史

ドローンの閉ループシステム同定によるモデリングと飛行制御

幅広い産業でビッグデータの活用が進んでいるが,予測・診断・制御・意思決定の精度向上に際してモデルの重要性が近年ますます高まっている.データエンジニアリングのひとつの分野として,システム同定法によるデータ駆動モデリングについて紹介する.具体例として,MOESP型閉ループ部分空間同定法(CL-MOESP)によるドローンの閉ループ同定と,得られた同定モデルを利用した最適制御器設計の事例研究を紹介する.

  • ホーム
  • ご挨拶
  • 研究シーズ
    • 研究シーズ条件検索
    • 研究シーズ一覧
    • キーワード一覧
  • 学部学科一覧
    • 工学部
      • 都市デザイン工学科
      • 建築学科
      • 機械工学科
      • 電気電子システム工学科
      • 電子情報システム工学科
      • 応用化学科
      • 環境工学科
      • 生命工学科
      • 一般教育科
      • 総合人間学系教室
      • ナノ材料マイクロデバイス研究センター
      • インキュベーションラボ
      • その他
    • ロボティクス&デザイン工学部
      • ロボット工学科
      • システムデザイン工学科
      • 空間デザイン学科
      • その他
    • 情報科学部
      • 情報知能学科
      • 情報システム学科
      • 情報メディア学科
      • ネットワークデザイン学科
      • その他
    • 知的財産学部
      • 知的財産学科
    • 知的財産研究科
    • その他
      • 教務部
        • 教職教室
        • 教育センター
        • ランゲージラーニングセンター
        • その他
      • 情報センター
      • 八幡工学実験場
      • ものづくりセンター
      • ロボティクス&デザインセンター
  • 協力機関コーナー
    • 大阪産業技術研究所
    • 大阪商工会議所
    • 大阪信用金庫
  • 特集コーナー
    • イノベーション・ジャパン2020~大学見本市Online
    • 動画コーナー
    • 八幡工学実験場バーチャルツアー

研究シーズ・教員に対しての問合せや相談事項はこちら

技術相談申込フォーム

© INNOVATION DAYS 2021 智と技術の見本市.

v

Facebook

Dribbble

Behance

Instagram

E-mail