三菱重工技報
    Vol. 59 No. 2 (2022)   プラント·インフラ特集
    技術論文

    熟練者の操作習得とノウハウ可視化に寄与する逆強化学習技術

    Inverse Reinforcement Learning Technology Contributing to Imitation and Know-How Visualization of Plant Expert Operations

    中川陽介
    Yosuke Nakagawa
    小野仁意
    Hitoi Ono
    筈井祐介
    Yusuke Hazui
    荒井幸代
    Sachiyo Arai
    中川陽介
    小野仁意
    筈井祐介
    荒井幸代

    プラントの非定常手動操作は,運転状態に応じた適切な判断が求められ,運転員の知見や技量に大きく依存している。深層強化学習は,状態を認識し,その状態に対する評価指標に基づき一連の操作を学習でき,これまで暗黙知とされてきた操作指針の明文化に繋がる手法として期待されている。しかし,学習に必要な評価指標の設計が難しいことや,学習結果の説明性等の課題があり,安全性·信頼性が求められるプラント操作への適用が進んでいなかった。本報では,千葉大学との共同研究にて開発した逆強化学習技術を用いて熟練者の操作を習得するとともに,学習結果の可視化を通じてそのノウハウを推量する技術について紹介する。