论文摘要
本文针对同时具有线性与非线性未知动态干扰情况下的离散时间的部分线性系统的输出调节问题,提出了仅利用在线数据的基于强化学习的数据驱动控制方法.首先,该问题可拆分为一个受约束的静态优化问题和一个动态优化问题,第一个问题的解可以对应调节器方程的解.第二个问题可以确定出控制器的最优反馈增益.传统的控制方法需要准确的系统模型参数用来解决这两个优化问题.针对这个问题,本文提出了一种数据驱动离线策略算法,该算法仅使用在线数据找到动态优化问题的解.然后,基于动态优化问题的解,为静态优化问题提供了数据驱动的方法找到该问题的解.最后,仿真结果验证了所提方法的有效性.
论文目录
文章来源
类型: 国际会议
作者: 庞文砚,范家璐,姜艺
关键词: 输出调节,离散时间系统,强化学习,非线性未知动态
来源: 第30届中国过程控制会议(CPCC 2019) 2019-07-31
年度: 2019
分类: 基础科学,信息科技
专业: 数学,自动化技术
单位: 东北大学流程工业综合自动化国家重点实验室
分类号: TP181;O231
页码: 252
总页数: 1
文件大小: 642k
下载量: 19