复杂网络下多智能体合作演化动力学机制研究

复杂网络下多智能体合作演化动力学机制研究

论文摘要

多传感器信息融合使得合作工作变得愈来愈复杂,多智能体如何在真实复杂的环境下相互协调完成不同的任务,也成为了新的研究热点。智能体之间的相互合作是保证其能在一起工作的核心。合作不仅能提高智能体所形成的智能系统的性能,亦能增强其解决实际问题的能力。因此研究多智能体相互之间的合作是开发多智能体系统的必然需求。近年来,通过博弈论研究多实体合作行为的实验,对于智能体的合作研究产生了深远影响。例如:马克斯-普朗克研究所的米林斯基合作演化博弈实验,瑞士苏黎世大学和圣加伦大学进行的公共物品博弈实验,乃至大卫·兰德的重复性囚徒困境实验等。这些研究对进化动力学、合作演化、群体内资源分配均有着一定的贡献。本文借鉴了以上关于多智能体合作演化的研究,以复杂网络博弈动力学为核心,通过在复杂网络中引入动态博弈机制,以网络内的智能群体合作为研究对象,仿真分析了多智能体间的合作演化过程。本文主要工作有:1.首先研究多智能体中的行为一致性对囚徒困境博弈合作演化的影响。研究表明:在智能群体中引入行为一致性机制,能够使群体合作率的变化幅度变小,且能够使得多智能体在合作演化中有着更高的合作密度。2.考虑声望机制对于合作演化的影响,在网络上仿真分析存在一定程度的惩罚和奖励的公共物品博弈实验。研究表明:道德约束能促进群体凝聚力,以抑制智能群体中的背叛行为。并进一步在BA网络中进行铲雪博弈实验,在合作个体初始化时数量不变的情况下,考虑群体间的强互惠行为,通过对相邻个体声望值进行判断,并以此为依据对背叛行为进行惩罚,可以使参与铲雪博弈的智能个体产生一定程度的合作。并在后续中研究了对高声望个体进行惩罚这一行为对多智能体合作演化的影响。3.在囚徒困境博弈仿真实验中,分析强互惠机制和行为一致性机制对群体合作演化的影响。研究表明:在BA无标度社区网络中,存在行为一致性机制时,智能个体可以在网络中演化出一定程度的合作现象。在强互惠个体的影响下,能使演化博弈在达到演化均衡状态时具有着更高的合作密度,然而更高的合作密度需要个体支出一定的增益来维持。以上均以复杂网络为基础,采用立体连接的方式,将智能个体相联系。并在智能群体间,进行博弈演化仿真实验。通过对仿真所得的数据进行分析,研究强互惠机制和行为一致性机制对多智能体合作的内在影响。对于未来多智能体系统的开发有着一定的意义。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景与意义
  •   1.2 国内外研究现状
  •   1.3 论文内容与组织结构
  • 第二章 行为一致性对于多智能体合作演化的影响
  •   2.1 行为一致性和囚徒困境博弈
  •   2.2 仿真研究
  •   2.3 结论
  • 第三章 基于道德的双过程理论下公共物品博弈研究
  •   3.1 双过程理论和公共物品博弈
  •   3.2 PGG仿真实验
  •     3.2.1 系统1仿真实验
  •     3.2.2 奖励惩罚机制
  •     3.2.3 仅考虑惩罚机制的PGG
  •   3.3 结论
  • 第四章 强互惠机制对合作演化的影响
  •   4.1 强互惠理论简介
  •   4.2 过程分离研究
  •   4.3 强互惠的惩罚范围对于铲雪博弈中合作演化的影响
  •     4.3.1 铲雪博弈简介
  •     4.3.2 BA无标度网络模型
  •     4.3.3 仿真研究
  •     4.3.4 结论
  •   4.4 满足高斯假说的声望机制对合作的影响
  •     4.4.1 高斯假说
  •     4.4.2 异质网络简介
  •     4.4.3 仿真研究
  •     4.4.4 结论
  • 第五章 强互惠机制和行为一致性机制对演化的影响
  •   5.1 强互惠机制和行为一致性机制对演化的影响
  •   5.2 无标度社区网络模型的介绍和构建方式
  •   5.3 仿真分析
  •   5.4 结论
  • 第六章 总结与展望
  •   6.1 总结
  •   6.2 展望
  • 参考文献
  • 致谢
  • 攻读学位期间主要工作
  • 文章来源

    类型: 硕士论文

    作者: 柴自东

    导师: 张彦波

    关键词: 多智能体,演化动力学机制,行为一致性,强互惠,声望

    来源: 河南大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,自动化技术

    单位: 河南大学

    分类号: O157.5;TP18

    总页数: 65

    文件大小: 6878K

    下载量: 300

    相关论文文献

    • [1].基于蒙特卡洛Q值函数的多智能体决策方法[J]. 控制与决策 2020(03)
    • [2].多智能体深度强化学习研究综述[J]. 计算机工程与应用 2020(05)
    • [3].多智能体路径规划研究进展[J]. 计算机工程 2020(04)
    • [4].数据驱动的多智能体网络鲁棒包容控制[J]. 控制理论与应用 2020(09)
    • [5].基于雷达观测的多智能体编队协作式目标跟踪[J]. 指挥信息系统与技术 2020(04)
    • [6].基于多智能体的配电台区智能决策系统研究[J]. 信息技术 2020(10)
    • [7].多智能体集合的人机交互指控系统架构研究[J]. 中国管理信息化 2020(20)
    • [8].多智能体聚集问题研究综述[J]. 计算机应用研究 2019(06)
    • [9].多智能体强化学习综述[J]. 计算机科学 2019(08)
    • [10].基于多智能体的编队控制一致性研究[J]. 科技创新与应用 2016(35)
    • [11].新时期物联网环境下多智能体决策信息技术[J]. 山西农经 2016(14)
    • [12].牵引控制间歇通讯多智能体网络的一致性[J]. 信息与控制 2017(02)
    • [13].基于切换拓扑的多智能体协作控制研究综述[J]. 计算机应用研究 2019(04)
    • [14].基于事件触发机制的多智能体网络平均一致性研究[J]. 计算机应用研究 2017(03)
    • [15].多智能体协调控制的演化博弈方法[J]. 系统科学与数学 2016(03)
    • [16].多智能体模型用于土地利用演变模拟研究进展[J]. 江西科学 2015(01)
    • [17].具有多变时滞的多智能体复杂动态网络的平均一致性[J]. 郧阳师范高等专科学校学报 2013(06)
    • [18].分布式优化的多智能体方法[J]. 控制理论与应用 2019(11)
    • [19].一种基于多智能体强化学习的流量分配算法[J]. 北京邮电大学学报 2019(06)
    • [20].一种高效率的多智能体协作学习通信机制[J]. 信息安全研究 2020(04)
    • [21].基于时滞脉冲控制的二阶多智能体一致性分析[J]. 莆田学院学报 2020(02)
    • [22].正实特征值切换拓扑的一般线性多智能体动态系统稳定性[J]. Engineering 2020(06)
    • [23].支持强化学习多智能体的网电博弈仿真平台[J]. 指挥与控制学报 2019(01)
    • [24].鲁棒优化与多智能体协调的电梯群控调度[J]. 中国新通信 2017(12)
    • [25].基于多智能体遗传算法的配电网节能降耗综合管理系统[J]. 湖南大学学报(自然科学版) 2016(04)
    • [26].事件触发控制背景下的二阶多智能体一致性探究[J]. 数学学习与研究 2019(03)
    • [27].主从多智能体网络快速随机一致性[J]. 山东大学学报(理学版) 2014(01)
    • [28].大规模多智能体仿真平台设计方法的研究[J]. 中国科学技术大学学报 2012(08)
    • [29].离散时间混合多智能体的拟平均一致性控制[J]. 智能系统学报 2012(04)
    • [30].基于多智能体社会的僵尸网络协同防御模型[J]. 微电子学与计算机 2011(03)

    标签:;  ;  ;  ;  ;  

    复杂网络下多智能体合作演化动力学机制研究
    下载Doc文档

    猜你喜欢