強化学習周辺の課題とアプローチ ~報酬設計，多目的逐次計画問題に向けて～

講演者: 荒井幸代教授（千葉大学大学院融合理工学府都市環境システムコース）
講演日時: 2022年1月19日（水）　10:00～11:30
講演場所: オンライン
講演概要: 強化学習は，モデルベースト制御との関係（相補性，類似性）から，その実用可能性が議論されており，特にそのモデルフリー性（対象システムのダイナミクスが未知）については理解が深められてきた．本発表では，制御におけるモデルと共に，予め設定が不可欠な「目標値（目的関数）」に着目し，これが強化学習の報酬値（報酬関数）に相当するとした文脈で，逆強化学習を中心にその研究の現状と課題を紹介する．（SICE DML研究会と共催）

足立研セミナー: 強化学習周辺の課題とアプローチ ~報酬設計，多目的逐次計画問題に向けて～