动态最优控制论文-仙阿曼

动态最优控制论文-仙阿曼

导读:本文包含了动态最优控制论文开题报告文献综述及选题提纲参考文献,主要关键词:燃料电池,能量管理,动态行驶工况,续驶里程

动态最优控制论文文献综述

仙阿曼[1](2019)在《燃料电池电动汽车动态工况能量管理最优控制研究》一文中研究指出提高燃料的经济性是燃料电池电动汽车能量管理的关键目标,针对燃料电池电动汽车在动态行驶工况下燃料电池利用效率低下,续驶里程下降的问题,在燃料电池电动汽车关键部件的数学模型基础上,采用识别驾驶员驾驶意图的能量管理策略,搭建了基于施加的加速踏板位置执行驾驶意图的驾驶员模型,构建了燃料电池电动汽车整车仿真模型,着重分析了动态制动工况下电动汽车燃料电池的输出功率,试验结果表明,提高驾驶员驾驶意图的识别能够快速的提升燃料电池利用率,从而提高燃料电池电动汽车的续驶里程。(本文来源于《国外电子测量技术》期刊2019年10期)

符繁强[2](2019)在《一类多值逻辑动态系统的最优控制问题》一文中研究指出多值逻辑网络作为布尔网络的一种自然推广,它能更好的刻画细胞内基因之间相互动态行为,同时它在计算机科学领域、人工智能、博弈论及复杂的神经网络中也有着广泛的应用.因此,对多值逻辑网络的研究受到了国内外学者的关注.本文主要研究多值逻辑动态网络系统的最优控制问题,通过运用矩阵的半张量积方法,将多值逻辑动态系统和收益函数表示为代数形式,进而给出求解此最优控制问题的动态规划方法.多值逻辑在博弈决策中有广泛的应用,对博弈双方,若一方的决策固定且已知,则博弈问题就可以转化为最优控制问题.本文主要研究人机博弈问题,假设机器的策略固定且已知,考虑人的收益最大化的策略这一最优控制问题.论文应用矩阵半张量积这一工具,研究了选择策略类型相同的一对一和多对多博弈,以及各个对手可选择的策略类型不同的博弈,这叁种情形下收益函数的代数表达式;进而,研究其相应的最优控制问题的求解方法.通过引入值函数和证明最优性原理,建立了矩阵半张量积下的多值网络的动态规划算法;最后,针对一人一机、多人多机和混合值动态逻辑的最优控制问题,应用所给出的算法计算了几个实例.本论文的创新点在于:多值逻辑网络的演化过程是用网络中各节点根据其更新规则来刻画,一般很难用逻辑表达式来刻画;在演化博弈的过程中,博弈双方的收益也是通过收益矩阵来描述的,也难写出收益函数的表达式;但引入逻辑变量的半张量积表达以后,我们很容易导出演化方程和收益函数的代数表达式,从而建立了求解这一类问题的动态规划方法.(本文来源于《贵州民族大学》期刊2019-06-08)

安毅[3](2019)在《基于自适应动态规划的可重构机械臂的分散保代价最优控制方法研究》一文中研究指出随着现代科学技术智能化的推进,针对可重构机械臂一类具有自动组装性、灵活应变性及环境适应性等特点,子模块可按既定任务需求进行重新组合的智能机械设备,广泛应用于深空深海探测、核工业等高危产业及智能娱乐工厂等领域中。然而,可重构机械臂在构形重组时需要兼顾能耗和控制精度性能指标的问题来确保其在强耦合、非线性不确定性条件下完成既定任务,故简化控制器结构及优化能源消耗的研究十分重要。本文首先论述了选题的背景意义,分别对可重构机械臂及控制方法和自适应动态规划(Adaptive Dynamic Programming,ADP)的现状和进展论述,且介绍了ADP的基本理论基础,确定了本文的研究内容。其次,针对于可重构机械臂构建了两种的动力学模型。一种是基于NewtonEuler迭代算法建立的传统动力学模型,将耦合交联不确定项表征为一组与耦合力矩相关联子系统的集合。另一种是针对谐波传动装置,基于关节实时力矩量测信息的的动力学模型,大大简化了传统的动力学模型。再次,针对于传统的动力学模型,设计了一种基于ADP的可重构机械臂的分散保代价最优(Guaranteed Cost Optimal Control,GCOC)跟踪控制器。针对轨迹跟踪问题,为简化控制器的结构和提高系统的控制精度,结合最优控制理论,建立关于匹配构形与运动轨迹联合优化下的保代价上界约束性能指标函数,利用神经网络构建了单网络评价结构,继而求解哈密顿雅可比贝尔曼(Hamilton Jacobi Bellman,HJB)方程得出最优反馈跟踪控制律,并对系统稳定性分析和仿真验证。然后,针对于关节力矩量测信息的动力学模型,设计了一种基于关节力矩量测信息的可重构机械臂的能耗分散保代价最优跟踪控制器。通过定义兼顾控制精度与能耗的性能指标函数构建HJB方程,采用基于策略迭代(Policy Iteration,PI)的学习算法对HJB方程进行求解,继而得到近似最优控制律。并基于Lyapunov理论对系统的渐近稳定性进行证明,在数值仿真中,对比了本章算法和传统的RBF神经网络算法,验证了算法的有效性。最后,针对本文完成的工作内容进行了总结展望。(本文来源于《吉林大学》期刊2019-06-01)

谭飞,曹立佳[4](2019)在《基于改进动态变异差分进化的最优PID控制》一文中研究指出为了在加快PID控制参数优化求解的同时保证解的全局性以及精度,提出一种改进的动态变异差分进化(Dynamic Mutation Differential Evolution,DMDE)算法。该算法在差分进化(Differential Evolution,DE)算法中,引入随机变异和动态种群策略,增加对精英的学习概率,提高了优化速度和精度。将改进DMDE算法应用于最优PID控制中,对5种常用工业对象模型和7种偏差积分性能指标进行优化求解。仿真实验和对系统在最优控制时灵敏度分析的结果表明,改进DMDE算法可有效提高系统性能,且采用时间乘偏差绝对值积分、偏差的绝对值平方根积分和改进的综合积分指标更有利于综合评判控制系统的稳定性和快速性。(本文来源于《控制工程》期刊2019年03期)

薛木森[5](2019)在《考虑价格外生时的易逝品动态广告最优投入控制模型》一文中研究指出本文研究了在以逝品企业产品价格外生时的动态最优广告投入策略,考虑了广告投入的长远影响。建立了以广告投入策略为决策变量的最优控制模型,并且考虑了企业的预算约束。利用极大值原理得到了计划周期内的最优的广告投入策略。最后给出了数值算例,验证了模型的有效性。(本文来源于《价值工程》期刊2019年02期)

逯九利,袁朝辉,罗科训[6](2018)在《基于近似动态规划的飞机刹车自适应最优控制》一文中研究指出考虑到飞机防滑刹车系统中传统"PD+PBM"控制方法的低速打滑、湿跑道及混合跑道适应性差的问题,以及现有智能控制方法仅以满足控制目标的片面性,提出了一种基于近似动态规划的自适应最优控制方法,在满足控制目标的同时,使刹车性能指标也达到最优。通过仿真分析及试验验证表明,上述方法能够很好的实现机轮速度平滑减速,良好跟踪飞机速度。同时还能确保系统滑移率维持在最大结合系数对应的最佳滑移率附近,从而最大限度的利用地面结合力,提高刹车效率。不仅避免了传统控制方法的缺陷,同时也继承了滑移率控制的优点,从系统集成层面提升了刹车性能,为今后飞机刹车控制领域的发展奠定了良好的基础。(本文来源于《计算机仿真》期刊2018年10期)

洪成文,富月[7](2018)在《基于自适应动态规划的非线性鲁棒近似最优跟踪控制》一文中研究指出为克服现有近似最优跟踪控制方法只能跟踪连续可微参考输入的局限,本文针对一类具有未知动态的连续时间非线性时不变仿射系统,提出了一种新的基于自适应动态规划的鲁棒近似最优跟踪控制方法.首先采用递归神经网络建立系统模型,然后建立评价神经网络对最优性能指标进行估计,从而得到最优性能指标偏导数的估计值,进而得到近似最优跟踪控制器,最后利用系统输出与参考输入之间的跟踪误差设计鲁棒项对神经网络建模误差进行补偿.分别针对两个非线性系统进行仿真实验,仿真结果表明了所提方法的有效性和优越性.(本文来源于《控制理论与应用》期刊2018年09期)

张冰战,李开放[8](2018)在《基于动态规划的插电式混合动力汽车全局最优控制策略研究》一文中研究指出针对某款插电式混合动力汽车,基于动态规划(DP)算法建立了汽车全局最优控制策略。通过将每一时刻SOC初始取值范围均选定为0.6~0.8,对DP程序通用性和计算效率进行了改进。选择能够代表各种道路类型的11种标准工况以及UDDS工况进行仿真验证,结果表明,所编写DP程序通用性良好,汽车在全局最优控制策略下燃油经济性相对于传统电机助力控制策略有明显的提升。(本文来源于《汽车技术》期刊2018年07期)

董婕逊[9](2018)在《基于贝叶斯网络的银行支付系统动态安全风险评估和最优控制决策》一文中研究指出近年来,国际上银行支付系统频繁遭到黑客攻击,导致受害银行损失巨大。基于此,笔者在剖析现有风险评估和控制理论意义和不足的基础上,将贝叶斯攻击网络图推广应用于银行支付信息系统的风险分析评估与决策,将模型结合业界公认的银行支付系统关键风险点,构建了专属安全风险网络图,以期指导管理者依据数据快速作出最优安全控制选择决策。(本文来源于《信息与电脑(理论版)》期刊2018年09期)

胡怀中,张建博,杨清宇[10](2019)在《采用最优状态估计的主蒸汽温度动态矩阵控制方法》一文中研究指出针对主蒸汽温度控制系统不可测扰动影响的问题,提出一种基于最优状态估计的动态矩阵控制(OSEDMC)算法.首先分析主蒸汽温度系统的动态特性,归纳出减温水量对主蒸汽温度影响的数学模型;然后基于常规DMC算法,利用最优估计理论对DMC算法的预测序列进行补偿修正,有效抑制不可测扰动的影响,并提出一种Kalman滤波的降维算法,使其计算更加简洁、便于实际应用与在线计算. Simulink仿真结果表明:在不可测扰动影响下,所提出方法抑制扰动效果比常规DMC算法提高20%,抑制扰动能力有显着提升.(本文来源于《控制与决策》期刊2019年07期)

动态最优控制论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

多值逻辑网络作为布尔网络的一种自然推广,它能更好的刻画细胞内基因之间相互动态行为,同时它在计算机科学领域、人工智能、博弈论及复杂的神经网络中也有着广泛的应用.因此,对多值逻辑网络的研究受到了国内外学者的关注.本文主要研究多值逻辑动态网络系统的最优控制问题,通过运用矩阵的半张量积方法,将多值逻辑动态系统和收益函数表示为代数形式,进而给出求解此最优控制问题的动态规划方法.多值逻辑在博弈决策中有广泛的应用,对博弈双方,若一方的决策固定且已知,则博弈问题就可以转化为最优控制问题.本文主要研究人机博弈问题,假设机器的策略固定且已知,考虑人的收益最大化的策略这一最优控制问题.论文应用矩阵半张量积这一工具,研究了选择策略类型相同的一对一和多对多博弈,以及各个对手可选择的策略类型不同的博弈,这叁种情形下收益函数的代数表达式;进而,研究其相应的最优控制问题的求解方法.通过引入值函数和证明最优性原理,建立了矩阵半张量积下的多值网络的动态规划算法;最后,针对一人一机、多人多机和混合值动态逻辑的最优控制问题,应用所给出的算法计算了几个实例.本论文的创新点在于:多值逻辑网络的演化过程是用网络中各节点根据其更新规则来刻画,一般很难用逻辑表达式来刻画;在演化博弈的过程中,博弈双方的收益也是通过收益矩阵来描述的,也难写出收益函数的表达式;但引入逻辑变量的半张量积表达以后,我们很容易导出演化方程和收益函数的代数表达式,从而建立了求解这一类问题的动态规划方法.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

动态最优控制论文参考文献

[1].仙阿曼.燃料电池电动汽车动态工况能量管理最优控制研究[J].国外电子测量技术.2019

[2].符繁强.一类多值逻辑动态系统的最优控制问题[D].贵州民族大学.2019

[3].安毅.基于自适应动态规划的可重构机械臂的分散保代价最优控制方法研究[D].吉林大学.2019

[4].谭飞,曹立佳.基于改进动态变异差分进化的最优PID控制[J].控制工程.2019

[5].薛木森.考虑价格外生时的易逝品动态广告最优投入控制模型[J].价值工程.2019

[6].逯九利,袁朝辉,罗科训.基于近似动态规划的飞机刹车自适应最优控制[J].计算机仿真.2018

[7].洪成文,富月.基于自适应动态规划的非线性鲁棒近似最优跟踪控制[J].控制理论与应用.2018

[8].张冰战,李开放.基于动态规划的插电式混合动力汽车全局最优控制策略研究[J].汽车技术.2018

[9].董婕逊.基于贝叶斯网络的银行支付系统动态安全风险评估和最优控制决策[J].信息与电脑(理论版).2018

[10].胡怀中,张建博,杨清宇.采用最优状态估计的主蒸汽温度动态矩阵控制方法[J].控制与决策.2019

标签:;  ;  ;  ;  

动态最优控制论文-仙阿曼
下载Doc文档

猜你喜欢