论文摘要
当前运用随机博弈的网络攻防分析方法采用完全理性假设,但在实际的网络攻防对抗中攻防双方很难达到完全理性的高要求,降低了现有方法的准确性和指导价值.从网络攻防对抗实际出发,分析有限理性对攻防随机博弈的影响,在有限理性约束下构建攻防随机博弈模型.针对网络状态爆炸的问题,提出一种基于攻防图的网络状态与攻防动作提取方法,有效压缩了博弈状态空间.在上述基础上引入强化学习中的WoLF-PHC算法进行有限理性随机博弈分析并设计了具有在线学习能力的防御决策算法.该算法通过学习可以获得针对当前攻击者的最优防御策略,所得策略在有限理性下优于现有攻防随机博弈模型的纳什均衡策略.通过引入资格迹改进WoLF-PHC算法,进一步提高了防御者的学习速度.通过实验验证了所提方法的有效性与先进性.
论文目录
文章来源
类型: 期刊论文
作者: 杨峻楠,张红旗,张传富
关键词: 随机博弈,网络攻防,防御决策,有限理性
来源: 计算机研究与发展 2019年05期
年度: 2019
分类: 信息科技,基础科学
专业: 数学,互联网技术
单位: 中国人民解放军战略支援部队信息工程大学
基金: 国家“八六三”高技术研究发展计划基金项目(2014AA7116082,2015AA7116040)~~
分类号: O225;TP393.08
页码: 942-954
总页数: 13
文件大小: 3112K
下载量: 229