講演者
荒井 幸代 教授(千葉大学大学院 融合理工学府 都市環境システムコース)
講演日時
2022年1月19日(水) 10:00~11:30
講演場所
オンライン
講演概要
強化学習は,モデルベースト制御との関係(相補性,類似性)から,その実用可能性が議論されており,特にそのモデルフリー性(対象システムのダイナミクスが未知)については理解が深められてきた.本発表では,制御におけるモデルと共に,予め設定が不可欠な「目標値(目的関数)」に着目し,これが強化学習の報酬値(報酬関数)に相当するとした文脈で,逆強化学習を中心にその研究の現状と課題を紹介する. (SICE DML研究会と共催)