随机最优控制论文_阮志刚,应祖光,颜光锋

导读:本文包含了随机最优控制论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:最优,方程,微分方程,对偶,传染病,系统,函数。

随机最优控制论文文献综述

阮志刚,应祖光,颜光锋[1](2019)在《基于噪声观测非线性系统随机振动的最优控制》一文中研究指出工程结构例如车辆工作状态的随机振动水平是评估其动力学性能的重要指标,该振动对于结构的工作性能具有极其重要的影响,因此必需进行结构随机振动控制。结构受强随机激励或本身构造特性常常产生非线性振动,例如特殊类重型多轴车辆,其悬架采用斜杆转动方式支承,从而导致结构振动的几何强非线性。最优振动控制是基于动态过程最优性的一个理想控制方法,但其反馈控制律依赖于结构即时状态,而状态观测不可避免地包含测量噪声,因此基于噪声观测非线性结构系统随机振动的最优控制是一个切实的重要问题。本文介绍该基于噪声观测非线性系统随机振动最优控制的一个理论方法及其应用,首先通过拉格朗日方程建立车辆控制系统模型的非线性运动微分方程,再转为非线性随机耦合振动方程,同时建立包含测量噪声的系统观测方程,组成部分可观系统的非线性随机系统的控制问题;根据推广的Kalman滤波方法得到估计状态的非线性随机系统方程,然后转化为最优估计非线性随机系统的控制问题,再根据随机动态规划原理建立HJB方程,确定对于估计状态的最优控制律,并对于控制有界性确定最优有界控制律;对于具有噪声观测的采用磁流变阻尼器控制的两自由度非线性车辆系统随机最优控制问题,结合运用推广的Kalman滤波方法与随机动态规划原理,并考虑控制力的有界性,按照上述方法得到对于系统估计状态的最优有界控制律,通过半主动控制与未控系统响应统计的比较说明控制效果。(本文来源于《中国力学大会论文集(CCTAM 2019)》期刊2019-08-25)

周林峰,金雪梅,李程伟,徐昊辰,蔡晨晨[2](2019)在《倒向随机系统的线性二次混合最优控制》一文中研究指出倒向随机系统的线性二次最优控制问题的状态系统是具有两个控制器的倒向随机微分方程:一个为确定的控制器,另一个为随机控制器.在适当的假设下,通过凸分析技术可以证明最优控制存在且唯一.利用It?公式和对偶计算获得了最优控制的随机Hamiltion系统的对偶表示.随机Hamiltion系统是由状态方程、对耦方程和最优控制的对偶表示构成完全耦合的平均场类型的正倒向随机微分方程.(本文来源于《湖州师范学院学报》期刊2019年08期)

牟晓洁,张启敏,王宗[3](2019)在《随机SIRS模型拟最优控制存在的充分条件》一文中研究指出通常的流行病模型参数都是确定的,但由于各种不确定因素的影响,模型的参数很难准确的得到.本文讨论一类不确定参数随机SIRS传染病模型的拟最优控制,目标函数为治疗疾病的过程中所花费的成本尽可能小.根据伴随方程的估计值,给出拟最优控制的误差估计.利用Hamiltonian函数建立了拟最优控制的充分条件,并通过数值算例验证了控制变量对疾病的影响.(本文来源于《应用数学学报》期刊2019年04期)

牟晓洁,张启敏,王宗[4](2019)在《随机SIRS模型拟最优控制存在的必要条件》一文中研究指出建立了不确定参数和白噪声影响的随机SIRS模型,给出了易感者、感染者和恢复者的先验估计.利用Ekeland变分原理和极大值条件得到SIRS模型的拟最优控制存在的必要条件.通过一个数值例子验证了所得到的理论结果.(本文来源于《河南师范大学学报(自然科学版)》期刊2019年05期)

唐矛宁,孟庆欣[5](2019)在《带跳跃平均场倒向随机微分方程的线性二次最优控制》一文中研究指出该文研究了一类随机线性二次最优控制问题,其中状态方程是由泊松随机鞅测度和布朗运动共同驱动的平均场类型的倒向随机微分方程.首先,通过经典的凸变分原理获得了最优控制的存在性与唯一性;其次,利用对偶方法给出了最优控制的随机哈密顿系统刻画,这里的随机哈密顿系统是由状态方程、对偶方程和最优控制的对偶刻画构成的一个完全耦合的具有跳跃的平均场正倒向随机微分方程;最后,利用解耦技术,通过引入两个黎卡提方程和一个平均场倒向随机微分方程对随机哈密顿系统进行解耦,进而获得最优控制的反馈表示.(本文来源于《数学物理学报》期刊2019年03期)

胡世培,贺志民[6](2019)在《由布朗运动和列维过程联合驱动的一个有限期的线性二次最优随机控制问题(英文)》一文中研究指出我们研究了由布朗运动和列维过程联合驱动的线性二次最优随机控制问题.我们利用深刻的截口定理新的仿射随机微分方程存在逆过程.应用拟线性贝尔曼原理和单调迭代收敛方法,我们证明了倒向黎卡提微分方程解的存在性和唯一性.最后,我们证明了存在一个最优反馈控制且值函数由相应的倒向黎卡提微分方程和相应的伴随方程的初始值合成.(本文来源于《应用概率统计》期刊2019年03期)

王若鹏[7](2019)在《基于前景理论的随机库存系统最优控制策略研究》一文中研究指出库存控制是企业生产经营活动中的重要内容和重要组成部分.经典的随机库存系统是以风险中立为前提,通过优化系统的某种性能指标实现对系统的最优控制.而在考虑风险的库存管理问题中,涉及风险时往往忽略了决策者的主观行为,或者只考虑了不确定性带来的风险.而前景理论认为面对复杂的市场环境、信息的不完全性和诸多不确定因素,决策者以相对性的观点进行判断,在做决策时不仅关注决策的最终结果,且关注结果的变化,即参考依赖的影响.研究前景理论的参考依赖性和决策者的主观行为是本文的研究出发点.本文基于前景理论,从公司和顾客两个角度出发,以运筹学、行为经济学和统计学等多个交叉学科理论为基础,采用优化方法、博弈分析、数值模拟和仿真等方法研究了随机库存系统中决策者参考依赖和损失厌恶行为,并讨论了公司的最优定价和最优订货策略,分析了策略型顾客、参考依赖和损失厌恶行为对公司最优决策的影响,并探讨了策略型顾客的两阶段选择行为对公司产生的不利影响.针对策略型顾客对公司的负面影响,探究了公司的几种应对策略.研究表明发现公司价格保证、数量承诺等策略对顾客所带来的不利影响起到一定缓解作用,而补偿契约不能改善公司的收益.针对随机供应和不确定性供应限制下的随机库存问题,建立了基于零前景的库存模型,分析了公司与策略型顾客之间的博弈.主要工作总结如下:1.在完全信息水平下,提出了数量导向参考依赖的库存模型,并讨论了公司的最优控制策略.首先,基于数量导向的参考,研究了损失厌恶型公司的最优库存策略,并讨论了损失厌恶程度及数量导向的参考点对公司最优库存策略的影响.研究结果表明损失厌恶公司的订货量低于损失中立公司的最优订货量,然而损失厌恶系统的订货量由于参考依赖水平的差异可能低于、高于或者等于经典库存系统的订购量.从而表明基于前景理论的决策结果与传统结果存在“决策偏差”.进一步,公司的最优订货量关于损失厌恶水平和订购成本递减,而产品的售价和残值在不同参考水平下对最优订货量也产生不同的影响.其次,基于数量导向的参考依赖,研究了公司的联合库存控制和定价策略,引入策略型顾客,建立了公司与顾客的理性预期均衡条件.重点考虑了掌握的信息程度对公司的策略的影响.2.在未知信息情况下,分别从公司的角度和顾客的角度,建立了既定参考和随机参考点的模型,研究了基于策略型顾客的随机库存系统最优库存控制和定价策略问题.首先从公司的角度出发,建立了面对风险偏好型策略顾客时损失厌恶系统的两阶段销售模型.假设顾客是风险偏好的,而公司是基于零利润为参考依赖的损失厌恶型模型.其次从顾客角度出发,研究了面对具有随机参考依赖的顾客时公司库存控制和定价策略.理论分析表明在两种库存系统中,策略型顾客对系统的最优库存量和售价都有显着的影响.为缓解策略型顾客所带来的负面影响,公司采取顾客补偿契约、库存承诺机制和价格保证策略等可行干预策略.而研究表明对于两种系统,顾客补偿契约并不能缓解策略型顾客对公司造成的负面影响,库存承诺机制在均衡下可以增加公司的收益,而价格保证策略在一定条件下可改善公司的收益.3.在随机供应和不确定性供应限制下,研究了面对策略型顾客的随机库存系统的联合库存和定价策略.假定公司的效用函数是内在效用和获得-损失效用的线性组合,建立了基于不确定供应和随机供应库存系统与策略型顾客的博弈模型,通过对模型的分析发现,对于不确定订购下的库存系统,订购的不确定性使得公司最优订货量增加,但是最优定价不变.而公司的损失厌恶水平越大,其订货量越小但是价格越高,以此来平衡公司收益的降低.对于随机供应库存系统,随机供应性不影响公司的最优订货量.并分析了在理性预期均衡下,系统参数变化对库存系统性能指标的影响.本文的创新之处可归纳为:在前景理论的框架下研究了公司最优控制策略和公司与顾客的博弈问题,对于完全信息水平,提出了基于数量导向的参考依赖,分析了策略型顾客对公司最优决策的影响;对于未知信息,分别从公司的角度和顾客的角度,建立了既定参考和随机参考点的库存模型;引入策略型顾客,在理性预期条件下证明了理性预期均衡的存在性并研究了理性预期均衡的性质,探讨了系统参数变化对公司性能指标的影响;在前人工作的基础上进一步考虑了不确定供应能力和随机供应下基于前景理论的库存系统中顾客与公司的博弈问题.(本文来源于《北京交通大学》期刊2019-06-01)

孙琪[8](2019)在《随机系统的最优控制理论、实现和应用》一文中研究指出针对非均匀介质的扩散模型和现实图像的识别问题,本文旨在研究相关随机系统的最优控制理论、实现和应用。通过量化模型中不确定性因素对系统状态的影响,设计具有鲁棒性的控制函数在工程决策领域里有着重要的价值。具体来讲,本文首先考虑带随机系数的分布式椭圆控制问题,其中扩散系数需采用高维的随机场模型以便刻画复杂的地质条件。为应对维数灾难的问题,本文在数值离散中选用了蒙特卡洛有限元法并推导出相关的误差估计。然而在通过梯度下降算法寻找最优控制函数的高精度逼近时,每步迭代都需要在剖分很细的网格上求大量状态以及对偶函数的有限元样本解。因此,本文提出部分采样的梯度下降算法来降低更新过程的计算花销,并利用时间平均的策略来消除由欠采样引发的随机震荡。另一方面,借助于多重蒙特卡洛有限元法,最优状态函数的期望等统计矩可以先在粗网格上花费较低的代价来数值逼近,然后利用细网格上少量的样本解作为修正,故相比于传统的单重网格算法更经济有效。特别的,由于工程应用中的地质构造十分复杂,渗透率在多孔页岩层的不同位置差别可达十个数量级以上,因此在建立扩散系统的随机模型时还需考虑多尺度效应。确切地讲,通过援引具有遍历性的多尺度随机扩散系数,本文接下来研究相应的分布式椭圆控制问题及其渐进行为,并利用随机匀质化理论证明该问题的宏观模型为常系数的椭圆控制问题。数值实验的计算结果验证了上述理论分析,并且给出多尺度问题到达匀质化状态的收敛速度估计。与此同时,深度学习的各类应用以及对其工作原理的解读成为近年来热门的讨论主题,其中残差网络在解决现实图像的识别和分割等任务中取得许多突破性成果,相关的随机训练方法是本文最后要研究的课题。具体地讲,图像特征的变换规律在插入标配的剪枝层后等价于随机修正方程的数值离散格式,进而根据伊藤公式可知:深度残差网络的传统和随机训练过程可以分别被描述为倒向输运方程和Kolomogorov方程的最优控制问题。因此从偏微分方程的角度来看,剪枝层的使用相当于在约束条件里添加人工粘性项来增强损失函数的正则性,继而迫使优化算法收敛到泛化能力更好的局部最优解附近。事实上,该理论框架同样适用于其他类型的加噪技巧,本文也据此构建出带有伯努利剪枝层的随机训练方法,并通过现实图像的分类任务验证了这一策略的有效性。本文构建的理论和算法能够有效分析各类系统中不确定性因素所带来的影响,从而为工程工业领域的决策控制提供科学依据。(本文来源于《中国科学技术大学》期刊2019-05-05)

张海森,张旭[9](2019)在《随机最优控制的二阶必要条件综述》一文中研究指出文章介绍作者(含合作)近期在随机最优控制的二阶必要条件方面的工作.首先,在凸控制约束情况下给出经典意义下随机奇异最优控制的逐点型二阶必要条件.其次,利用针状变分获得具有非凸控制约束的Pontryagin最大值原理意义下随机奇异最优控制的逐点型二阶必要条件.最后利用变分分析的工具进一步改进非凸控制约束情形的结果,并将其推广到具有状态约束的情形.(本文来源于《系统科学与数学》期刊2019年02期)

陈辉强,王永,黄志龙[10](2018)在《柔性作动器驱动的非线性系统随机振动的最优有界控制》一文中研究指出柔性作动器具有低刚度、大变形等特征,这一方面使主结构具备了强的环境适应性,另一方面也使主结构易受外界微扰影响,从而降低其操作精度.本文以介电弹性体作动器驱动的单自由度非线性系统为研究对象,通过即时微调电压,抑制系统在平衡位置附近的随机振动.通过随机平均法降低系统维数,将原系统的控制问题转化为关于慢变过程的控制问题;结合随机动态规划原理及控制约束导出最优有界控制策略.该策略具干摩擦形式,具有能量耗散本质,在抑制系统振动的同时提高了系统的稳定性.数值研究表明:最优有界控制策略具有良好的控制效果、控制效率及较高的鲁棒性.(本文来源于《力学季刊》期刊2018年04期)

随机最优控制论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

倒向随机系统的线性二次最优控制问题的状态系统是具有两个控制器的倒向随机微分方程:一个为确定的控制器,另一个为随机控制器.在适当的假设下,通过凸分析技术可以证明最优控制存在且唯一.利用It?公式和对偶计算获得了最优控制的随机Hamiltion系统的对偶表示.随机Hamiltion系统是由状态方程、对耦方程和最优控制的对偶表示构成完全耦合的平均场类型的正倒向随机微分方程.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

随机最优控制论文参考文献

[1].阮志刚,应祖光,颜光锋.基于噪声观测非线性系统随机振动的最优控制[C].中国力学大会论文集(CCTAM2019).2019

[2].周林峰,金雪梅,李程伟,徐昊辰,蔡晨晨.倒向随机系统的线性二次混合最优控制[J].湖州师范学院学报.2019

[3].牟晓洁,张启敏,王宗.随机SIRS模型拟最优控制存在的充分条件[J].应用数学学报.2019

[4].牟晓洁,张启敏,王宗.随机SIRS模型拟最优控制存在的必要条件[J].河南师范大学学报(自然科学版).2019

[5].唐矛宁,孟庆欣.带跳跃平均场倒向随机微分方程的线性二次最优控制[J].数学物理学报.2019

[6].胡世培,贺志民.由布朗运动和列维过程联合驱动的一个有限期的线性二次最优随机控制问题(英文)[J].应用概率统计.2019

[7].王若鹏.基于前景理论的随机库存系统最优控制策略研究[D].北京交通大学.2019

[8].孙琪.随机系统的最优控制理论、实现和应用[D].中国科学技术大学.2019

[9].张海森,张旭.随机最优控制的二阶必要条件综述[J].系统科学与数学.2019

[10].陈辉强,王永,黄志龙.柔性作动器驱动的非线性系统随机振动的最优有界控制[J].力学季刊.2018

论文知识图

非线性悬挂系统模型二自由度悬挂系统模型缓冲器被撞击二自由度悬挂系统模型双线性模型的本构关系非线性弹簧-质量系统的物理模型孔隙式双出杆式缓冲器示意图

标签:;  ;  ;  ;  ;  ;  ;  

随机最优控制论文_阮志刚,应祖光,颜光锋
下载Doc文档

猜你喜欢