基于自适应动态规划的最优输出反馈控制研究

基于自适应动态规划的最优输出反馈控制研究

论文摘要

近年来最优控制问题一直是控制领域研究的热点之一,其主要思路是找到一个最优的控制策略使得由系统状态和控制策略组成的价值函数达到最优。但是现实工业中系统状态难以测得,因此最优输出反馈控制被提出研究。在最优输出反馈控制的研究中,传统的求解方案有离线求解方案和设计状态观测器把输出反馈问题转化为状态反馈进行求解的方案。本文在传统求解方式的基础上,寻找一种只借助于系统输出在线求解最优输出反馈控制方法,摒弃通过设计观测器的求解方案。本文重点介绍了使用数学变换的方法结合数据驱动的理论,将待求代数黎卡提方程变换成利用系统输出求解。此外,为了克服前两种方法的局限性,本文结合了一种状态重构的方法对输出反馈控制问题进行求解,具体研究内容为:针对连续时间线性系统最优输出反馈控制问题,本文首先概述了最优控制问题,介绍了最优控制问题中的状态反馈控制求解方式。同时,介绍了最优输出反馈控制和最优状态反馈控制之间的转换关系。本文第二章使用离线求解的方法求解最优输出反馈控制,离线迭代的方法虽然可以根据系统的构造求解出系统的最优控制器值,但是离线迭代方案不能满足工业生产中的实时性要求。因此,本文第三章提出了在线迭代的方法,把系统的输出整合到根据系统构建出来的ARE方程中去,这种方法中定义系统的增益矩阵和系统增益值为两个不同步的迭代值,在进行迭代的时候需要给增益值一个初始值,才能保证迭代能继续进行。这种求解方法虽然可以满足系统求解的实时性问题,但是因为其分步迭代的原因导致其求解控制器的收敛速度过于缓慢,不能满足工业生产中控制器的快速响应的要求。因此,本文第四章提出了在线自适应求解的方案,利用自适应来求解最优的思路,在进行算法设计的时候,控制系统的增益矩阵和增益值是同步求解的,所以在线自适应学习是一次求解的方法,可以更加快速的求解出控制器,但是这种求解方式需要的系统条件相对严苛,且求解精度较低速度不够快。因此,本文的第五章提出了状态重构的思路,利用系统输出来重新构造出系统的状态,然后利用构造的状态进行最优输出反馈控制问题的求解。为了说明本文研究算法的有效性,分别在本文的第二、第三、第四、及第五章节进行了仿真分析,并在本文的第六章使用三自由度直升机实验平台对本文第三章的理论进行了实验验证,对比PID控制,本文第三章研究算法更加稳定可靠。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 前言
  •   1.2 研究背景与意义
  •   1.3 国内外研究现状
  •     1.3.1 最优控制的国内外研究现状
  •     1.3.2 自适应动态规划的国内外研究现状
  •     1.3.3 最优输出反馈控制问题的国内外研究现状
  •   1.4 课题研究主要内容
  •   1.5 本章总结
  • 第二章 最优输出反馈控制
  •   2.1 最优控制问题
  •     2.1.1 最优状态反馈控制问题
  •     2.1.2 最优输出反馈控制问题
  •   2.2 线性系统最优输出反馈控制问题的离线求解
  •     2.2.1 最优输出反馈控制问题的离线求解问题
  •     2.2.2 仿真分析
  •   2.3 本文使用的数学基础
  •   2.4 本章总结
  • 第三章 基于策略迭代的最优输出反馈控制求解
  •   3.1 线性系统最优控制的问题描述
  •   3.2 线性系统最优输出反馈问题
  •     3.2.1 基于数据驱动方法求解控制器
  •     3.2.2 在线求解最优输出反馈控制问题
  •   3.3 仿真分析
  •   3.4 本章总结
  • 第四章 基于在线自适应学习求解最优输出反馈控制
  •   4.1 连续时间线性系统的问题描述
  •   4.2 在线自适应学习求解的问题制定
  •     4.2.1 基于在线自适应进行求解
  •     4.2.2 稳定性分析
  •   4.3 仿真分析
  •   4.4 本章总结
  • 第五章 基于状态重构的最优输出反馈控制
  •   5.1 状态重构的数学问题描述
  •   5.2 基于状态重构的最优输出反馈控制问题求解
  •     5.2.1 基于策略迭代的方案
  •     5.2.2 在线自适应学习求解的方案
  •   5.3 仿真分析
  •   5.4 本章总结
  • 第六章 最优输出反馈控制实验验证
  •   6.1 三自由度直升机介绍
  •     6.1.1 三自由度直升机结构简介
  •     6.1.2 控制系统的介绍
  •     6.1.3 实验台的硬件设置
  •     6.1.4 实验台的软件设计
  •   6.2 实验设计
  •     6.2.1 建立数学模型
  •     6.2.2 算法设计
  •     6.2.3 实验参数设置
  •   6.3 实验结果
  •   6.4 本章总结
  • 第七章 总结与展望
  •   7.1 工作成果
  •   7.2 工作展望
  • 致谢
  • 参考文献
  • 附录一 硕士期间所获科研成果
  • 文章来源

    类型: 硕士论文

    作者: 李子灿

    导师: 吴涛

    关键词: 最优输出反馈控制,数据驱动,自适应动态规划,策略迭代,状态重构

    来源: 昆明理工大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 昆明理工大学

    分类号: O232

    DOI: 10.27200/d.cnki.gkmlu.2019.000571

    总页数: 90

    文件大小: 3684K

    下载量: 104

    相关论文文献

    • [1].基于事件触发的互联电网负荷频率模型预测输出反馈控制[J]. 电力建设 2020(02)
    • [2].基于输出反馈控制理论的电力系统研究[J]. 自动化与仪器仪表 2016(11)
    • [3].基于切换原理的非均匀采样系统输出反馈控制[J]. 电子学报 2020(01)
    • [4].不确定非线性系统的鲁棒自适应输出反馈控制[J]. 控制与决策 2015(06)
    • [5].既含有一般多个随机延迟以及多个测量丢失和随机控制丢失的鲁棒H_∞模糊输出反馈控制(英文)[J]. 自动化学报 2017(09)
    • [6].水轮机导叶开度的自适应非线性输出反馈控制[J]. 中国电机工程学报 2008(17)
    • [7].卫星编队飞行姿态协同输出反馈控制(英文)[J]. 宇航学报 2010(12)
    • [8].具有未知动态的船舶编队输出反馈控制[J]. 控制理论与应用 2017(09)
    • [9].具有未建模动态和输出约束系统的自适应输出反馈控制[J]. 控制与决策 2017(01)
    • [10].小型无人直升机的静态H_∞输出反馈控制[J]. 控制工程 2017(10)
    • [11].一阶旋转倒立摆输出反馈控制[J]. 实验技术与管理 2020(03)
    • [12].一类不确定离散切换模糊系统的鲁棒输出反馈控制[J]. 辽宁工业大学学报(自然科学版) 2008(03)
    • [13].一种面向交互应用的串联弹性驱动器有限时间输出反馈控制方法[J]. 机器人 2016(05)
    • [14].两轮自平衡小车的状态反馈和输出反馈控制[J]. 仪表技术与传感器 2018(08)
    • [15].一类大型互联非线性系统的鲁棒分散输出反馈控制[J]. 苏州科技学院学报(自然科学版) 2011(03)
    • [16].一类带非线性扰动的广义系统输出反馈控制[J]. 江苏工业学院学报 2008(04)
    • [17].柔性关节机器人有界自适应输出反馈控制(英文)[J]. Journal of Zhejiang University-Science A(Applied Physics & Engineering) 2018(07)
    • [18].基于神经网络的机械臂自适应输出反馈控制设计[J]. 应用科学学报 2013(04)
    • [19].一类非线性系统的高增益输出反馈控制(英文)[J]. 西南大学学报(自然科学版) 2010(11)
    • [20].离散Markov跳变系统事件触发H_∞量化输出反馈控制[J]. 计算机测量与控制 2019(03)
    • [21].有未知延迟的下三角系统的输出反馈控制[J]. 河南师范大学学报(自然科学版) 2018(02)
    • [22].四旋翼飞行器静态H_∞输出反馈控制[J]. 电光与控制 2018(04)
    • [23].未知控制方向的非线性级联系统鲁棒自适应输出反馈控制[J]. 工程数学学报 2018(03)
    • [24].一类严格反馈时滞系统的自适应输出反馈控制[J]. 系统工程与电子技术 2017(06)
    • [25].非匹配不确定线性系统离散滑模输出反馈控制[J]. 系统仿真学报 2009(16)
    • [26].基于平均驻留时间切换离散线性系统的降阶输出反馈控制[J]. 控制理论与应用 2020(03)
    • [27].无线传感器网络中基于事件驱动的输出反馈控制[J]. 计算机研究与发展 2017(11)
    • [28].基于约束H_∞输出反馈的四轮转向模型跟踪控制[J]. 信息与控制 2016(01)
    • [29].基于控制器切换的不确定模糊时滞系统的鲁棒输出反馈控制[J]. 河南科学 2012(01)
    • [30].一类离散系统基于偏差分离的输出反馈控制[J]. 数学的实践与认识 2012(12)

    标签:;  ;  ;  ;  ;  

    基于自适应动态规划的最优输出反馈控制研究
    下载Doc文档

    猜你喜欢