基于随机博弈与改进WoLF-PHC的网络防御决策方法

论文摘要

当前运用随机博弈的网络攻防分析方法采用完全理性假设,但在实际的网络攻防对抗中攻防双方很难达到完全理性的高要求,降低了现有方法的准确性和指导价值.从网络攻防对抗实际出发,分析有限理性对攻防随机博弈的影响,在有限理性约束下构建攻防随机博弈模型.针对网络状态爆炸的问题,提出一种基于攻防图的网络状态与攻防动作提取方法,有效压缩了博弈状态空间.在上述基础上引入强化学习中的WoLF-PHC算法进行有限理性随机博弈分析并设计了具有在线学习能力的防御决策算法.该算法通过学习可以获得针对当前攻击者的最优防御策略,所得策略在有限理性下优于现有攻防随机博弈模型的纳什均衡策略.通过引入资格迹改进WoLF-PHC算法,进一步提高了防御者的学习速度.通过实验验证了所提方法的有效性与先进性.

论文目录

1 研究现状

2 基于随机博弈的攻防对抗建模

2.1 网络攻防对抗问题描述与分析

2.2 攻防随机博弈模型

2.3 基于攻防图的网络状态与攻防动作提取方法

1) 网络安全要素

2) 攻击模板

3) 防御模板

3 基于WoLF-PHC的博弈分析与策略选取

3.1 WoLF-PHC算法原理

3.1.1 Q-learning算法

3.1.2 PHC算法

3.1.3 WoLF-PHC算法

3.2 基于资格迹的改进WoLF-PHC及防御决策算法

4 实验分析

4.1 实验场景描述

4.2 构建实验场景的AD-SGM

4.3 测试与分析

4.3.1 参数测试与分析

4.3.2 与典型博弈方法对比测试

4.3.3 有无资格迹的对比测试

4.4 方法综合比较

5 结束语

文章来源

类型: 期刊论文

作者: 杨峻楠,张红旗,张传富

关键词: 随机博弈,网络攻防,防御决策,有限理性

来源: 计算机研究与发展 2019年05期

年度: 2019

分类: 信息科技,基础科学

专业: 数学,互联网技术

单位: 中国人民解放军战略支援部队信息工程大学

基金: 国家“八六三”高技术研究发展计划基金项目(2014AA7116082,2015AA7116040)~~

分类号: O225;TP393.08

页码: 942-954

总页数: 13

文件大小: 3112K

下载量: 229

基于随机博弈与改进WoLF-PHC的网络防御决策方法

论文摘要

论文目录

文章来源

相关论文文献

猜你喜欢