导读:本文包含了马尔可夫博弈论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:马尔,可夫,图像,网络,拟态,模型,博弈论。
马尔可夫博弈论文文献综述
袁红春,余跃,梅海彬[1](2019)在《基于隐马尔可夫模型和非合作博弈的功率控制》一文中研究指出降低功耗是无线传感网研究中的重要问题之一。针对现有无线传感网存在功耗高、能量利用率低等问题,本文提出一种基于隐马尔可夫模型和非合作博弈的功率控制方法。证明了该方法中纳什均衡的存在性和唯一性以及隐马尔可夫模型(HMM)在特定条件下的广义平稳性。通过仿真实验将该算法与已有的基于非合作博弈的控制方法进行比较。仿真结果表明,该算法在能量利用率、收敛性、降低功耗方面均优于原有算法,能够有效延长网络生命周期。(本文来源于《山东农业大学学报(自然科学版)》期刊2019年04期)
张学龙,韩黎丽,覃滢樾,李锋[2](2019)在《基于马尔可夫链的供应链信任演化博弈与稳定策略》一文中研究指出文章借鉴博弈学习理论,运用离散时间马尔可夫链方法,构建供应链企业间信任演化博弈模型,研究供应链企业间信任的演化过程及演化稳定状态。引入由外部环境导致的误差项,以分别分析正向误差与反向误差对供应链信任演化均衡的影响。算例结果表明:正向误差使供应链企业间信任博弈的演化均衡为博弈双方每次博弈都选择信任策略,而反向误差使供应链企业间信任博弈的演化均衡为博弈双方每次博弈都选择背叛策略;外部环境向好可促进企业间的信任,而外部环境变差则会恶化企业间的信任;通过利用或控制外部环境的影响因素,可持续地改善或防止恶化外部环境来改善供应链信任。(本文来源于《统计与决策》期刊2019年10期)
张兴明,顾泽宇,魏帅,沈剑良[3](2018)在《拟态防御马尔可夫博弈模型及防御策略选择》一文中研究指出网络拟态防御通过冗余执行体动态性、多样性以及裁决反馈机制增强了主动防御顽健性,而对于其安全性评估尚缺少有效的分析模型,基于经典博弈模型无法满足于其多状态、动态性特点,不具有通用性等问题,提出拟态防御Markov博弈模型分析攻防状态间的转移关系以及安全可靠性度量方法,通过非线性规划算法计算攻防博弈均衡,以确定考虑防御代价的最佳防御策略。实验与多目标隐藏技术对比,结果表明拟态防御具有更高的防御效果,结合具体案例给出了针对利用系统漏洞攻击的具体攻防路径,验证了防御策略算法有效性。(本文来源于《通信学报》期刊2018年10期)
王瑾雯[4](2018)在《基于马尔可夫博弈的竞争云平台定价策略研究》一文中研究指出随着互联网的发展,云计算技术日益成熟,其蕴含的巨大商业前景吸引了越来越多的企业进入云计算市场提供云服务,从而形成多云平台共存的竞争市场。在这个市场中,多个云平台互相竞争吸引用户,并通过收取费用来获得收益。在竞争环境下,云平台需要合理的定价策略来最大化收益。通过查阅大量文献,目前相关研究中没有考虑到激烈竞争环境下存在多个主动定价的云平台,且将其定价问题构建为重复博弈的情况。基于此,本文对竞争环境下云平台定价策略进行分析。在云计算市场中,多个云平台互相竞争,其定价策略互相影响,从而会周期性地不断更新最优定价,因此竞争云平台定价问题是一个复杂的马尔可夫博弈问题,本论文将基于两种多智能体强化学习算法—Nash Q-learning和Minimax-Q来解决此问题。本文主要研究工作如下:(1)首先根据云平台激烈竞争的特点,给出博弈的基本设定,包括云用户选择行为的推导、云平台成本的设定和云平台期望收益的计算方法。(2)在马尔可夫博弈的框架下,从直观上将多个云平台在每个周期的竞争定价过程看作一般和博弈,结合均衡策略,使用Nash Q-learning算法分析了竞争云平台的均衡定价策略。由于Nash Q-learning算法存在多个纳什均衡选择的问题,而相关文献并没有给出具体且有效的选择方法,因此,本文首先根据期望收益和Fictitious Play(FP)算法提出了四种纳什均衡选择方式,并根据这四种方式训练得到了四种不同的均衡定价策略。然后通过这四种均衡策略的相互对比,以及与云计算市场两种实际情景下的定价策略的比较,发现由FP算法得到的两种均衡策略具有相对更好的表现。(3)由于云平台激烈竞争的特性,因此在马尔可夫博弈的框架下,基于市场中只存在两个主动定价的云平台这一设定,从零和博弈的角度,使用MinimaxQ算法分析了竞争云平台的定价策略。首先使用Minimax-Q算法和联合Qlearning算法训练云平台得到了四种不同的定价策略。然后在云计算市场的叁种实际情景下,将这四种策略与其它定价策略进行了对比分析,发现由MinimaxQ算法得到的两种Minimax策略在每种情景下都占有主导地位且表现稳定。最后将两种Minimax策略与由Nash Q-learning算法得到的四种均衡定价策略进行了对比,发现Minimax-Q算法在本文云平台激烈竞争的设定下具有更突出的表现。此外,实验发现由Minimax-Q算法和联合Q-learning算法得到的四种定价策略选择低价格的概率较低。实验结果证明了价格战的方式并不利于提高长期收益,而且充分验证了Minimax-Q算法更适合于研究本文激烈竞争设定下的云平台定价策略,为实际环境中竞争云平台定价策略的优化提供了指导。(本文来源于《武汉理工大学》期刊2018-04-01)
张恺[5](2015)在《基于马尔可夫随机场和博弈论的机载电子板卡红外图像分割》一文中研究指出电路板红外图像存在着噪声大,芯片发热区域交叉等特点,现有的图像分割算法大多针对可见光图像或医学图像,而对于电路板红外图像的专用分割算法较少,因此需要对传统的分割算法做出优化和改进,从而更好的实现对PCB板红外图像的分割。本文首先介绍了电路板红外图像的特性,现有的多种图像分割算法,及红外图像在分割时的重点与难点;然后介绍传统的马尔可夫模型,对基于该模型下的分割算法进行了研究,通过仿真实验,分析了传统方法的优势和劣势以及在处理红外图像上的不足。本文将博弈理论的概念与基于Markov随机场的MMD算法结合,提出基于博弈理论的MRF红外图像分割算法,将图像分割的过程演变为像素间的博弈,通过寻找博弈的纳什均衡点找到分割的最优解。通过实验可知:新算法能够很好地完成电路板红外图像的分割,将芯片的核心区域分割出来,达到将目标与背景分离的目的,并且核心发热区域的边缘细节也很清晰,较完整地体现芯片的发热区域和发热位置,效果要明显优于传统的Gibbs采样法、ICM算法。本文将博弈理论与传统的ICM、SA算法相结合,提出基于两方法博弈的分割算法,通过两种优化策略之间的博弈,形成了具有强互补性的分割模块,弥补了ICM算法容易陷入局部最优,SA算法运算时间较长的缺点。通过大量的仿真,证明了新算法对于解决PCB板红外图像分割问题是行之有效的。(本文来源于《中国民航大学》期刊2015-04-29)
王坤,张恺,王力,诸葛晶昌[6](2015)在《基于两方法博弈的马尔可夫随机场红外图像分割算法》一文中研究指出电路板红外图像芯片提取是电路板红外故障检测系统中的重要环节,已成为红外图像分割领域关注的一个重点。针对红外图像的特性及传统分割算法效率和精度不足的缺陷,提出一种基于两种优化策略博弈的马尔可夫随机场红外图像分割方法。首先通过OTSU算法对图像进行初始分割;然后利用马尔可夫随机场理论建立图像分割模型;最后,通过SA、ICM优化策略间的博弈对图像进行分割,将两种优化策略视为博弈的两个局中人,通过寻找博弈的纳什均衡点来实现分割;实验结果表明,算法能够无人工干预地准确提取电路板红外图像所有芯片发热区域,并且很好地抑制噪声,准确处理边缘信息,具有一定的实用性和鲁棒性。(本文来源于《红外技术》期刊2015年02期)
王坤,张恺,王力,诸葛晶昌[7](2014)在《结合博弈论的马尔可夫随机场红外图像分割》一文中研究指出电路板红外图像芯片提取是电路板红外图像故障检测系统中的重要环节,已成为红外图像分割领域关注的一个重点。传统的芯片发热区域提取方法大多需要人工干预,且分割效果不理想,容易丢失边缘信息,导致细节特征不明显。针对以上缺陷提出一种结合博弈论的改进马尔可夫随机场分割算法。首先用现有的OTSU算法对图像进行粗分割,将图像分为两个子集(背景域和目标域),然后利用马尔可夫随机场(MRF,Markov Random Field)理论建立图像分割模型,最后利用结合博弈理论的MMD(Modified Metropolis Dynamics)算法,根据模型分别对每个子集进行细致分割,提取核心发热区域。实验表明,改进算法应用在电路板芯片发热区域提取时,能够较好地抑制噪声,准确处理边缘信息,与传统算法相比,在视觉效果和客观数据上都有很大的提高,具有一定的准确性和鲁棒性。(本文来源于《红外技术》期刊2014年10期)
朱江,张玉平,彭祯珍[8](2014)在《基于隐马尔可夫预测的非对称信息功率博弈机制》一文中研究指出为了解决无线资源竞争中功率博弈的博弈者获得的环境信息具有非对称性问题,提出了一种基于隐马尔可夫预测的功率博弈机制。该机制通过建立隐马尔可夫预测模型(HMPM)判断博弈的对手是否参与博弈,从而提高博弈的信息准确度;然后利用预测获得的信息通过代价函数计算最佳发射功率。仿真结果表明,与最大后验概率法(MAP)和不预测法(NP)相比,基于隐马尔可夫预测的功率博弈模型能够在满足目标容量的同时,较好地提高非授权用户的功率效率。(本文来源于《计算机应用》期刊2014年04期)
朱怀念,张成科[9](2013)在《基于博弈论方法的线性马尔可夫跳变系统H_∞控制》一文中研究指出应用微分博弈理论研究了噪声依赖于状态x(t)、控制u(t)和干扰v(t)的Ito型线性马尔可夫跳变系统H∞鲁棒控制设计问题.首先将系统的控制变量u(t)视为博弈的一方,随机性干扰v(t)视为博弈的另一方,从而把H∞鲁棒控制问题转化为一个二人零和微分博弈问题,然后通过分析此微分博弈问题得到了H∞鲁棒控制存在的条件等价于相应的矩阵Riccati代数方程存在解,同时给出了H∞鲁棒控制策略的显式表达式,最后给出数值算例验证了其可行性.(本文来源于《信息与控制》期刊2013年04期)
董荣胜,马争先,郭云川,古天龙[10](2013)在《一种基于马尔可夫博弈的能量均衡路由算法》一文中研究指出针对无线传感器网络中耗能不均问题,引入马尔可夫博弈理论,构建了无线传感器网络的马尔可夫博弈模型.在能量均衡路由分析的基础上,给出了一种基于马尔可夫博弈的能量均衡路由算法,该算法从无线传感器网络整体耗能出发,兼顾节点之间的合作.定义了能量和信誉值的二元收益函数,给出了节点转发的状态转移概率,根据收益函数进行能量调节,求解出能量和收益之间的均衡系数——纳什均衡,实现了节点能量的均衡消耗,延长了网络的生命周期.使用PRISM概率仿真工具进行仿真,验证了该博弈模型存在纳什均衡点,同时表明该模型能促进节点之间合作,最大化无线传感器网络的生命周期.(本文来源于《计算机学报》期刊2013年07期)
马尔可夫博弈论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
文章借鉴博弈学习理论,运用离散时间马尔可夫链方法,构建供应链企业间信任演化博弈模型,研究供应链企业间信任的演化过程及演化稳定状态。引入由外部环境导致的误差项,以分别分析正向误差与反向误差对供应链信任演化均衡的影响。算例结果表明:正向误差使供应链企业间信任博弈的演化均衡为博弈双方每次博弈都选择信任策略,而反向误差使供应链企业间信任博弈的演化均衡为博弈双方每次博弈都选择背叛策略;外部环境向好可促进企业间的信任,而外部环境变差则会恶化企业间的信任;通过利用或控制外部环境的影响因素,可持续地改善或防止恶化外部环境来改善供应链信任。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
马尔可夫博弈论文参考文献
[1].袁红春,余跃,梅海彬.基于隐马尔可夫模型和非合作博弈的功率控制[J].山东农业大学学报(自然科学版).2019
[2].张学龙,韩黎丽,覃滢樾,李锋.基于马尔可夫链的供应链信任演化博弈与稳定策略[J].统计与决策.2019
[3].张兴明,顾泽宇,魏帅,沈剑良.拟态防御马尔可夫博弈模型及防御策略选择[J].通信学报.2018
[4].王瑾雯.基于马尔可夫博弈的竞争云平台定价策略研究[D].武汉理工大学.2018
[5].张恺.基于马尔可夫随机场和博弈论的机载电子板卡红外图像分割[D].中国民航大学.2015
[6].王坤,张恺,王力,诸葛晶昌.基于两方法博弈的马尔可夫随机场红外图像分割算法[J].红外技术.2015
[7].王坤,张恺,王力,诸葛晶昌.结合博弈论的马尔可夫随机场红外图像分割[J].红外技术.2014
[8].朱江,张玉平,彭祯珍.基于隐马尔可夫预测的非对称信息功率博弈机制[J].计算机应用.2014
[9].朱怀念,张成科.基于博弈论方法的线性马尔可夫跳变系统H_∞控制[J].信息与控制.2013
[10].董荣胜,马争先,郭云川,古天龙.一种基于马尔可夫博弈的能量均衡路由算法[J].计算机学报.2013