动态系统的最优控制论文_符繁强

导读:本文包含了动态系统的最优控制论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:最优,动态,系统,线性规划,作战,步长,线性。

动态系统的最优控制论文文献综述

符繁强[1](2019)在《一类多值逻辑动态系统的最优控制问题》一文中研究指出多值逻辑网络作为布尔网络的一种自然推广,它能更好的刻画细胞内基因之间相互动态行为,同时它在计算机科学领域、人工智能、博弈论及复杂的神经网络中也有着广泛的应用.因此,对多值逻辑网络的研究受到了国内外学者的关注.本文主要研究多值逻辑动态网络系统的最优控制问题,通过运用矩阵的半张量积方法,将多值逻辑动态系统和收益函数表示为代数形式,进而给出求解此最优控制问题的动态规划方法.多值逻辑在博弈决策中有广泛的应用,对博弈双方,若一方的决策固定且已知,则博弈问题就可以转化为最优控制问题.本文主要研究人机博弈问题,假设机器的策略固定且已知,考虑人的收益最大化的策略这一最优控制问题.论文应用矩阵半张量积这一工具,研究了选择策略类型相同的一对一和多对多博弈,以及各个对手可选择的策略类型不同的博弈,这叁种情形下收益函数的代数表达式;进而,研究其相应的最优控制问题的求解方法.通过引入值函数和证明最优性原理,建立了矩阵半张量积下的多值网络的动态规划算法;最后,针对一人一机、多人多机和混合值动态逻辑的最优控制问题,应用所给出的算法计算了几个实例.本论文的创新点在于:多值逻辑网络的演化过程是用网络中各节点根据其更新规则来刻画,一般很难用逻辑表达式来刻画;在演化博弈的过程中,博弈双方的收益也是通过收益矩阵来描述的,也难写出收益函数的表达式;但引入逻辑变量的半张量积表达以后,我们很容易导出演化方程和收益函数的代数表达式,从而建立了求解这一类问题的动态规划方法.(本文来源于《贵州民族大学》期刊2019-06-08)

陈学松,刘富春[2](2013)在《一类非线性动态系统基于强化学习的最优控制》一文中研究指出提出一类非线性不确定动态系统基于强化学习的最优控制方法.该方法利用欧拉强化学习算法估计对象的未知非线性函数,给出了强化学习中回报函数和策略函数迭代的在线学习规则.通过采用向前欧拉差分迭代公式对学习过程中的时序误差进行离散化,实现了对值函数的估计和控制策略的改进.基于值函数的梯度值和时序误差指标值,给出了该算法的步骤和误差估计定理.小车爬山问题的仿真结果表明了所提出方法的有效性.(本文来源于《控制与决策》期刊2013年12期)

陈向勇,井元伟,李春吉[3](2013)在《基于Lanchester方程的作战混合动态系统最优控制》一文中研究指出针对作战过程的混合动态特性,利用Lanchester方程建立了一类作战混合动态系统模型,在合理战术假设的基础上,讨论了一类变招顺序固定的作战决策方最优控制问题.利用动态规划原理给出了解决问题的基本框架与途径.最后,通过应用算例验证了所建立模型和所设计最优控制方案的可行性.研究结果对作战指挥决策和对策的研究具有理论指导意义.(本文来源于《系统工程理论与实践》期刊2013年10期)

陈向勇,井元伟,李春吉[4](2012)在《基于Lanchester方程的作战混合动态系统最优变招控制》一文中研究指出根据作战混合动态过程特性,提出了一种基于Lanchester方程的作战混合动态系统模型.该模型可较好的描述离散事件驱动的对阵招法和连续作战实力变化之间的相互作用.在合理战术假设的基础上,讨论了作战混合动态系统最优变招控制问题.首先,利用微分对策理论得到了作战招法存在的必要条件.进而对作战变招过程进行分析,并提出了一种最优变招控制策略的求解方法.最后,应用算例验证了所构建作战混合系统模型和所设计最优变招策略的可行性.(本文来源于《控制理论与应用》期刊2012年06期)

于瑞林[5](2009)在《混合动态系统的最优控制理论与应用》一文中研究指出本文主要研究了混合动态时变系统在有限时间域上的最优控制理论及其应用问题。本文首先分别考虑了有限时间混合动态时变系统在终端自由和终端约束两种情形下的最优控制问题,得到了最优控制问题的解在这两种情形下分别是一类拟变分不等式的唯一的粘性解和唯一的下半连续解的结论,并给出了它们之间的关系。随后对于实际存货系统建立了一个统一的混合动态模型,并将前面所得到的理论结果应用到生产存货系统中的一个具体实例中,得到了最优切换控制问题的解以及相应的最优切换律。本文的最后还讨论了非线性边界抛物型方程在叁维柱坐标系下的能控性问题。全文包括有以下七章。第一章介绍了混合动态系统及其研究背景,简单描述了混合动态系统的数学模型,并从最大值原理和动态规划两个方面回顾了关于混合动态系统的最优控制问题的研究现状以及存在的问题。最后对于本文的主要工作做了简要说明。第二章研究了一类有限时间终端自由的切换时变系统的最优控制问题,讨论了值函数的性质,得到了切换问题的最优化条件,并给出了建立最优切换律的策略,最后对于最优切换问题的值函数是一类拟变分不等式的唯一的连续粘性解的结论给出了新的严格详尽的证明。这一章的内容也是为下文关于混合动态系统终端受到约束的情形奠定了必要的理论基础,并且在这一章中采用的方法以及得到的结论和下文中所采用的方法以及得到的结论可以形成更清晰的对比。第叁章研究了一类有限时间内终端受到约束的切换时变系统的最优控制问题。终端约束的出现使得最优控制问题的值函数不仅仅不是连续可微的,甚至是不连续的。因此,以往关于拟变分不等式的粘性解的讨论中所使用的方法也就不再适用,需要利用新的方法将粘性解延展到半连续函数中。本文首次将生存理论这一数学工具应用到有限时间切换时变系统的最优控制问题中,得到了最优控制问题的值函数是一类拟变分不等式唯一的下半连续解的重要结论。值得注意的是,本章的证明中去除了以往文献[57,58]中关于切换费用通常所做的叁角不等式的假设,而只保留了严格大于零的假设条件。在这一章的最后在对值函数附加了一定的假设条件后还进一步地得到了最优切换控制问题的值函数是这类拟变分不等式粘性解的结论。第四章研究了一类同时包含有两类离散事件,即状态跳变和系统切换的混合动态时变系统在终端受到约束时的最优控制问题。这类系统的最优控制问题比起第叁章的最优切换问题更为复杂。本文首次将生存理论应用到这一复杂系统的最优控制问题中来,得到了最优控制问题中的值函数是一类拟变分不等式唯一的下半连续解的重要结论。在这一章中同样把以前文献[3][57,58]中常用的关于切换费用和跳变费用的叁角不等式的假设条件都予去除。而且在这一章中,比[68]和第叁章更进一步地讨论了这类拟变分不等式的下半连续解与拟变分不等式的粘性解之间的关系。第五章从实际的库存系统的优化管理中提出一个数学问题,即是我们对于存货系统应该建立一个怎样的数学模型使得这一模型能够全面而真实的描述出一个实际存货系统的变化。在这一章中对以往的关于存货系统的数学模型进行了回顾,并建立了一个新的模型。这一模型中不仅含有驱动系统演化的连续变量,也有驱动系统演化的离散事件。而且这一新的模型不仅可以刻划存货系统中出现的各种离散现象,还可以包容以前关于存货系统建立的各种数学模型。因为这一模型的高度包容性,我们称之为存货系统的统一的混合动态模型。这一章也为第六章的内容做了必要的铺垫。第六章的主要目的是要将前面第叁章中关于切换系统的理论成果和应用问题联系起来,通过一个生产存货系统的具体实例说明这些复杂艰深的数学理论的实用性。在这一章中并没有对H-J-B方程进行直接计算,而是首先提出了候选值函数,通过计算候选值函数的邻近次微分,并且验证其是否满足拟变分不等式下半连续解的定义,由此证明了这一候选值函数确实是最优切换问题的值函数,从而得到了与之相对应的最优切换策略。这一求解途径和以前关于切换系统最优控制问题的应用方面所取得成果都是不同的,而且在这一章中的最优切换问题的切换序列是未知的。本文的第七章研究了柱坐标系下的叁维热传导方程的非线性边界控制系统的能控性问题。这类非线性系统中的非线性项只满足局部Lipschitz条件,于是采用了阶梯函数的方法,对于热传导方程的逼近能控性进行了讨论,得到了线性系统的逼近能控性,并给出了控制的显式表达,而在文献[103]中控制的具体求法是未知的。在这一章的最后,利用线性系统的结果得到了非线性边界控制系统的逼近能控性。(本文来源于《山东大学》期刊2009-04-01)

王志胜[6](2008)在《时滞非线性离散动态系统最优控制的信息融合估计方法》一文中研究指出对非线性时滞离散动态系统的最优控制,提出了一种信息融合估计(information fusion estimation,IFE)方法,把非线性控制问题的所有信息转化为关于控制量的"测量信息",从而使非线性控制问题转化为关于控制量的"非线性估计"问题.通过算例表明,IFE方法明显优于动态系统优化与参数估计的集成(dynamic integrated system optimization and parameter estimation,DISOPE)方法.(本文来源于《控制理论与应用》期刊2008年03期)

张益群,杨球[7](2007)在《一类离散事件动态系统的最优控制与调度》一文中研究指出以极大代数为数学工具,讨论了一类(m×n)型Flow-shop结构的离散事件动态系统(DEDS)的最优控制与最优调度问题。提出了通过系统的加工时间矩阵获得系统矩阵的特征值和特征向量的阵列迭代方法。得到了系统具有最优控制与最优调度的协调性的有关结果。(本文来源于《武汉理工大学学报》期刊2007年08期)

张熙,朱经浩,陈杰[8](2007)在《线性规划在动态系统最优控制中的一个应用》一文中研究指出研究了Behavioral方式下的动态系统的离散型半正定线性二次最优控制问题。把原问题转化为半正定二次规划,应用线性规划的对偶理论,求解半正定二次规划,并得到原最优控制问题的最优值和最优轨道。(本文来源于《同济大学学报(自然科学版)》期刊2007年07期)

杨源,梁晓龙,李炳杰[9](2007)在《一类开关动态系统最优控制问题的梯度下降算法》一文中研究指出以开关动态系统的时间最优控制问题作为研究对象,给出了代价泛函的梯度表达式及证明过程,根据具有Armijo步长梯度下降算法得到数值解。通过仿真结果可以看出第一开关点为0.943 2 s,第二开关点为1.426 7 s,精度较高,说明具有Armijo步长梯度下降算法对于最优控制问题有良好的适应性。(本文来源于《空军工程大学学报(自然科学版)》期刊2007年03期)

陈杰,朱经浩[10](2006)在《动态系统,线性规划,线性二次优化线性规划在动态系统最优控制中的一个应用》一文中研究指出研究了Behavioral方式下的动态系统的线性二次最优控制问题。当评价函数为半正定二次函数时, 用线性规划来解最优控制问题。(本文来源于《中国运筹学会第八届学术交流会论文集》期刊2006-08-01)

动态系统的最优控制论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

提出一类非线性不确定动态系统基于强化学习的最优控制方法.该方法利用欧拉强化学习算法估计对象的未知非线性函数,给出了强化学习中回报函数和策略函数迭代的在线学习规则.通过采用向前欧拉差分迭代公式对学习过程中的时序误差进行离散化,实现了对值函数的估计和控制策略的改进.基于值函数的梯度值和时序误差指标值,给出了该算法的步骤和误差估计定理.小车爬山问题的仿真结果表明了所提出方法的有效性.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

动态系统的最优控制论文参考文献

[1].符繁强.一类多值逻辑动态系统的最优控制问题[D].贵州民族大学.2019

[2].陈学松,刘富春.一类非线性动态系统基于强化学习的最优控制[J].控制与决策.2013

[3].陈向勇,井元伟,李春吉.基于Lanchester方程的作战混合动态系统最优控制[J].系统工程理论与实践.2013

[4].陈向勇,井元伟,李春吉.基于Lanchester方程的作战混合动态系统最优变招控制[J].控制理论与应用.2012

[5].于瑞林.混合动态系统的最优控制理论与应用[D].山东大学.2009

[6].王志胜.时滞非线性离散动态系统最优控制的信息融合估计方法[J].控制理论与应用.2008

[7].张益群,杨球.一类离散事件动态系统的最优控制与调度[J].武汉理工大学学报.2007

[8].张熙,朱经浩,陈杰.线性规划在动态系统最优控制中的一个应用[J].同济大学学报(自然科学版).2007

[9].杨源,梁晓龙,李炳杰.一类开关动态系统最优控制问题的梯度下降算法[J].空军工程大学学报(自然科学版).2007

[10].陈杰,朱经浩.动态系统,线性规划,线性二次优化线性规划在动态系统最优控制中的一个应用[C].中国运筹学会第八届学术交流会论文集.2006

论文知识图

闭环系统框图仿真实验系统结构系统动态响应曲线及误差曲线几种控制方法的速度响应实验结果1 控制系统基本结构复合控制原理图·1 最优状态反馈控制...

标签:;  ;  ;  ;  ;  ;  ;  

动态系统的最优控制论文_符繁强
下载Doc文档

猜你喜欢