人工智能与“星际争霸”:多智能体博弈研究新进展

人工智能与“星际争霸”:多智能体博弈研究新进展

论文摘要

多智能体博弈游戏具有实时对抗、群体协作、非完全信息博弈、庞大的搜索空间、多复杂任务和时间空间推理等特点,是当前人工智能领域极具挑战的难题。同时,该领域研究成果在社会管理、智能交通、经济、军事等领域有广阔的应用前景。以具有代表性的多智能体博弈游戏"星际争霸"为主要研究对象,通过分析研究难度、总结研究方法、介绍研究环境及数据集与竞赛资源,对近年来该领域人工智能研究成果进行了梳理和总结,并对该领域未来可能的发展方向进行预测,为相关研究工作的开展提供可借鉴参考信息。

论文目录

  • 1 引言
  • 2 星际争霸和人工智能
  •   2.1 实时策略游戏——星际争霸
  •   2.2 星际争霸研究的难点及其对人工智能研究的挑战
  • 3 相关研究和成果
  • 4 研究方法
  •   4.1 基于规则
  •   4.2 经典机器学习
  •     4.2.1 快速搜索与规划
  •     4.2.2 对手策略建模和作战模型
  •     4.2.3 降低不确定性
  •     4.2.4 行为知识提取和利用
  •   4.3 深度学习
  •   4.4 强化学习
  •     4.4.1 Q学习及其变体
  •     4.4.2 Actor-Critic结构及其变体
  •     4.4.3 分布式多智能体强化学习
  •   4.5 其它有潜力的方向
  • 5 相关资源
  •   5.1 开源研究平台
  •     5.1.1 完整星际争霸学习环境
  •     5.1.2 类似的AI学习环境
  •   5.2 开源数据集
  •     5.2.1 基于星际争霸II的数据集
  •     5.2.2 基于星际争霸I的数据集
  •   5.3 竞赛
  •     5.3.1 AIIDE
  •     5.3.2 CIG
  •     5.3.3 SSCAIT
  • 6 未来研究趋势
  • 文章来源

    类型: 期刊论文

    作者: 张宏达,李德才,何玉庆

    关键词: 多智能体,实时策略,人工智能,对抗博弈,深度强化学习

    来源: 无人系统技术 2019年01期

    年度: 2019

    分类: 信息科技,基础科学

    专业: 数学,自动化技术

    单位: 中国科学院沈阳自动化研究所机器人学国家重点实验室,中国科学院大学

    基金: 国家自然科学基金(91748208),国家自然科学基金联合基金(U1608253),中国科学院联合基金(6141A01061601)

    分类号: TP18;O225

    页码: 5-16

    总页数: 12

    文件大小: 1967K

    下载量: 1028

    相关论文文献

    • [1].基于蒙特卡洛Q值函数的多智能体决策方法[J]. 控制与决策 2020(03)
    • [2].多智能体深度强化学习研究综述[J]. 计算机工程与应用 2020(05)
    • [3].多智能体路径规划研究进展[J]. 计算机工程 2020(04)
    • [4].数据驱动的多智能体网络鲁棒包容控制[J]. 控制理论与应用 2020(09)
    • [5].基于雷达观测的多智能体编队协作式目标跟踪[J]. 指挥信息系统与技术 2020(04)
    • [6].基于多智能体的配电台区智能决策系统研究[J]. 信息技术 2020(10)
    • [7].多智能体集合的人机交互指控系统架构研究[J]. 中国管理信息化 2020(20)
    • [8].多智能体聚集问题研究综述[J]. 计算机应用研究 2019(06)
    • [9].多智能体强化学习综述[J]. 计算机科学 2019(08)
    • [10].基于多智能体的编队控制一致性研究[J]. 科技创新与应用 2016(35)
    • [11].新时期物联网环境下多智能体决策信息技术[J]. 山西农经 2016(14)
    • [12].牵引控制间歇通讯多智能体网络的一致性[J]. 信息与控制 2017(02)
    • [13].基于切换拓扑的多智能体协作控制研究综述[J]. 计算机应用研究 2019(04)
    • [14].基于事件触发机制的多智能体网络平均一致性研究[J]. 计算机应用研究 2017(03)
    • [15].多智能体协调控制的演化博弈方法[J]. 系统科学与数学 2016(03)
    • [16].多智能体模型用于土地利用演变模拟研究进展[J]. 江西科学 2015(01)
    • [17].具有多变时滞的多智能体复杂动态网络的平均一致性[J]. 郧阳师范高等专科学校学报 2013(06)
    • [18].分布式优化的多智能体方法[J]. 控制理论与应用 2019(11)
    • [19].一种基于多智能体强化学习的流量分配算法[J]. 北京邮电大学学报 2019(06)
    • [20].一种高效率的多智能体协作学习通信机制[J]. 信息安全研究 2020(04)
    • [21].基于时滞脉冲控制的二阶多智能体一致性分析[J]. 莆田学院学报 2020(02)
    • [22].正实特征值切换拓扑的一般线性多智能体动态系统稳定性[J]. Engineering 2020(06)
    • [23].支持强化学习多智能体的网电博弈仿真平台[J]. 指挥与控制学报 2019(01)
    • [24].鲁棒优化与多智能体协调的电梯群控调度[J]. 中国新通信 2017(12)
    • [25].基于多智能体遗传算法的配电网节能降耗综合管理系统[J]. 湖南大学学报(自然科学版) 2016(04)
    • [26].事件触发控制背景下的二阶多智能体一致性探究[J]. 数学学习与研究 2019(03)
    • [27].主从多智能体网络快速随机一致性[J]. 山东大学学报(理学版) 2014(01)
    • [28].大规模多智能体仿真平台设计方法的研究[J]. 中国科学技术大学学报 2012(08)
    • [29].离散时间混合多智能体的拟平均一致性控制[J]. 智能系统学报 2012(04)
    • [30].基于多智能体社会的僵尸网络协同防御模型[J]. 微电子学与计算机 2011(03)

    标签:;  ;  ;  ;  ;  

    人工智能与“星际争霸”:多智能体博弈研究新进展
    下载Doc文档

    猜你喜欢