论文摘要
本文研究了随机系统的学习与优化理论及其在金融工程中的应用。采用基于灵敏度分析的随机系统优化方法,重点分析了受约束的线性二次型最优控制和博弈问题,以及金融机构风险传染优化问题。基于灵敏度分析的随机系统优化方法是学习和优化领域中的重要理论和方法,其核心是性能差分公式,在此基础上,可以进一步推导获得控制系统的最优性条件和相应的策略迭代等优化算法。相比于传统的最优控制方法,基于灵敏度分析的随机系统优化方法具有推导简洁直观的特点,并且在许多复杂问题的研究上,取得了大量创新的研究成果。在本文中,基于灵敏度分析的随机系统优化方法为投资组合和风险管理等金融工程优化问题提供了统一的建模框架和有力的分析工具。在投资组合方面,金融市场中往往存在诸多市场限制,受市场因素限制的投资组合问题可以用受约束标量状态随机线性二次型(LQ)最优控制问题进行描述,该问题在金融风险管理等领域有着广泛的应用。然而,在控制变量上的线性约束破坏了经典LQ问题最优解的解析结构。因此,本文重点研究了受约束的线性二次型最优控制和博弈问题的最优解析控制策略。首先将控制系统建模为马尔可夫决策过程(MDP)问题,并结合这类模型特有的状态分离性质,采用基于灵敏度的随机系统优化方法,推导出性能差分公式,获得控制策略的最优性条件,即扩展的Riccati方程,最优控制策略的解析形式是关于状态的分段线性仿射函数,可以通过离线计算扩展的Riccati方程获得。本文将有限时域的结果扩展到了无穷时域。在无穷时域问题中,基于灵敏度分析的随机系统优化方法重点研究了与最优控制策略有关的条件概率参数,在此基础上分析了受约束的随机LQ控制问题与确定性最优控制问题之间的关系;开发出基于策略迭代的优化算法,而无穷时域问题的仿真案例也体现出该算法的收敛性和高效性。在风险管理方面,金融机构之间因为互相的借贷关系联结在一起,而这种联结性成为了金融危机蔓延的关键因素。以银行系统为例,一个银行破产,可能会导致其债权人破产,从而进一步将风险传导至上游机构(风险传染)。本文重点研究了破产清算机制对金融系统总财富的影响,以及如何抑制金融机构的系统风险传染。本文将该问题建模为一个带有均衡约束的非线性优化问题,提出最小化系统损失的清算方案。首先,将模型等效转化为一个马尔可夫决策过程,采用基于灵敏度分析的随机系统优化方法,推导出性能差分公式,在此基础上推导系统的最优解,提出结合策略迭代与性能梯度的迭代算法。本文的研究工作为抑制金融机构系统风险传染提供了新的方向,体现出基于灵敏度分析的随机系统优化方法,这一起源于离散时间动态系统领域的优化方法,在非线性优化问题上的优势。
论文目录
文章来源
类型: 博士论文
作者: 叶祥深
导师: 曹希仁
关键词: 马尔可夫决策过程,灵敏度分析,随机线性二次型,策略迭代,风险传染
来源: 上海交通大学
年度: 2019
分类: 基础科学,经济与管理科学
专业: 数学,金融,证券,投资
单位: 上海交通大学
分类号: O232;F830.9
DOI: 10.27307/d.cnki.gsjtu.2019.000732
总页数: 136
文件大小: 4232K
下载量: 116
相关论文文献
- [1].不完全观测下非线性非齐次随机系统的参数估计[J]. 应用数学 2020(04)
- [2].具有网络攻击的随机系统状态估计研究[J]. 无线互联科技 2020(15)
- [3].随机系统概述[J]. 数学学习与研究 2020(04)
- [4].《液压与气动》关于论文标题的写作要求[J]. 液压与气动 2016(10)
- [5].《液压与气动》关于论文标题的写作要求[J]. 液压与气动 2016(12)
- [6].《液压与气动》关于论文标题的写作要求[J]. 液压与气动 2017(01)
- [7].《液压与气动》关于论文标题的写作要求[J]. 液压与气动 2017(02)
- [8].《液压与气动》关于论文标题的写作要求[J]. 液压与气动 2017(03)
- [9].伊藤型随机系统的镇定[J]. 杭州电子科技大学学报(自然科学版) 2018(05)
- [10].有限随机系统的极限概率分解[J]. 贵州大学学报(自然科学版) 2013(02)
- [11].一类带有多源异质干扰的随机系统的精细抗干扰控制[J]. 鲁东大学学报(自然科学版) 2020(02)
- [12].一类带有多源干扰的离散时间随机系统的抗干扰控制[J]. 鲁东大学学报(自然科学版) 2018(04)
- [13].特约主编寄语[J]. 南京信息工程大学学报(自然科学版) 2017(03)
- [14].不确定线性时滞随机系统的最优保性能控制[J]. 自动化技术与应用 2008(02)
- [15].一类带有非谐波扰动的随机系统的抗干扰控制[J]. 鲁东大学学报(自然科学版) 2018(01)
- [16].多用户多准则随机系统最优与最优收费[J]. 系统科学与数学 2009(01)
- [17].一类随机系统的概率密度函数形状控制[J]. 系统工程理论与实践 2016(09)
- [18].随机系统的概率密度函数形状调节[J]. 物理学报 2014(24)
- [19].随机系统预测控制稳定性分析及快速预测算法[J]. 信息与控制 2013(02)
- [20].关于非线性离散随机系统的稳定性[J]. 河南科学 2010(02)
- [21].随机系统的反馈镇定设计[J]. 河南科学 2012(05)
- [22].一类随机系统平稳分布的存在性与唯一性[J]. 数学杂志 2010(04)
- [23].一类非线性随机系统的状态反馈H_∞控制[J]. 应用数学学报 2009(03)
- [24].北京市农业执法双随机系统的构建[J]. 现代农业科技 2019(20)
- [25].网络随机系统的最优事件触发控制[J]. 电光与控制 2016(08)
- [26].基于电子化临床数据采集平台的中央随机系统特点及应用[J]. 中国新药与临床杂志 2010(09)
- [27].一类伊藤型广义随机系统的有限时间稳定性[J]. 沈阳建筑大学学报(自然科学版) 2014(03)
- [28].一类离散时滞随机系统的稳定性分析[J]. 顺德职业技术学院学报 2013(04)
- [29].基于隐马尔科夫模型的随机系统运行时安全性验证[J]. 工程科学与技术 2018(06)
- [30].考虑输入饱和的异步电机随机系统的速度控制[J]. 青岛大学学报(工程技术版) 2016(01)
标签:马尔可夫决策过程论文; 灵敏度分析论文; 随机线性二次型论文; 策略迭代论文; 风险传染论文;