人工智能与“星际争霸”:多智能体博弈研究新进展

论文摘要

多智能体博弈游戏具有实时对抗、群体协作、非完全信息博弈、庞大的搜索空间、多复杂任务和时间空间推理等特点,是当前人工智能领域极具挑战的难题。同时,该领域研究成果在社会管理、智能交通、经济、军事等领域有广阔的应用前景。以具有代表性的多智能体博弈游戏"星际争霸"为主要研究对象,通过分析研究难度、总结研究方法、介绍研究环境及数据集与竞赛资源,对近年来该领域人工智能研究成果进行了梳理和总结,并对该领域未来可能的发展方向进行预测,为相关研究工作的开展提供可借鉴参考信息。

论文目录

1 引言

2 星际争霸和人工智能

2.1 实时策略游戏——星际争霸

2.2 星际争霸研究的难点及其对人工智能研究的挑战

3 相关研究和成果

4 研究方法

4.1 基于规则

4.2 经典机器学习

4.2.1 快速搜索与规划

4.2.2 对手策略建模和作战模型

4.2.3 降低不确定性

4.2.4 行为知识提取和利用

4.3 深度学习

4.4 强化学习

4.4.1 Q学习及其变体

4.4.2 Actor-Critic结构及其变体

4.4.3 分布式多智能体强化学习

4.5 其它有潜力的方向

5 相关资源

5.1 开源研究平台

5.1.1 完整星际争霸学习环境

5.1.2 类似的AI学习环境

5.2 开源数据集

5.2.1 基于星际争霸II的数据集

5.2.2 基于星际争霸I的数据集

5.3 竞赛

5.3.1 AIIDE

5.3.2 CIG

5.3.3 SSCAIT

6 未来研究趋势

文章来源

类型: 期刊论文

作者: 张宏达,李德才,何玉庆

关键词: 多智能体,实时策略,人工智能,对抗博弈,深度强化学习

来源: 无人系统技术 2019年01期

年度: 2019

分类: 信息科技,基础科学

专业: 数学,自动化技术

单位: 中国科学院沈阳自动化研究所机器人学国家重点实验室,中国科学院大学

基金: 国家自然科学基金(91748208),国家自然科学基金联合基金(U1608253),中国科学院联合基金(6141A01061601)

分类号: TP18;O225

页码: 5-16

总页数: 12

文件大小: 1967K

下载量: 1028

相关论文文献

[1].基于蒙特卡洛Q值函数的多智能体决策方法[J]. 控制与决策 2020(03)
[2].多智能体深度强化学习研究综述[J]. 计算机工程与应用 2020(05)
[3].多智能体路径规划研究进展[J]. 计算机工程 2020(04)
[4].数据驱动的多智能体网络鲁棒包容控制[J]. 控制理论与应用 2020(09)
[5].基于雷达观测的多智能体编队协作式目标跟踪[J]. 指挥信息系统与技术 2020(04)
[6].基于多智能体的配电台区智能决策系统研究[J]. 信息技术 2020(10)
[7].多智能体集合的人机交互指控系统架构研究[J]. 中国管理信息化 2020(20)
[8].多智能体聚集问题研究综述[J]. 计算机应用研究 2019(06)
[9].多智能体强化学习综述[J]. 计算机科学 2019(08)
[10].基于多智能体的编队控制一致性研究[J]. 科技创新与应用 2016(35)
[11].新时期物联网环境下多智能体决策信息技术[J]. 山西农经 2016(14)
[12].牵引控制间歇通讯多智能体网络的一致性[J]. 信息与控制 2017(02)
[13].基于切换拓扑的多智能体协作控制研究综述[J]. 计算机应用研究 2019(04)
[14].基于事件触发机制的多智能体网络平均一致性研究[J]. 计算机应用研究 2017(03)
[15].多智能体协调控制的演化博弈方法[J]. 系统科学与数学 2016(03)
[16].多智能体模型用于土地利用演变模拟研究进展[J]. 江西科学 2015(01)
[17].具有多变时滞的多智能体复杂动态网络的平均一致性[J]. 郧阳师范高等专科学校学报 2013(06)
[18].分布式优化的多智能体方法[J]. 控制理论与应用 2019(11)
[19].一种基于多智能体强化学习的流量分配算法[J]. 北京邮电大学学报 2019(06)
[20].一种高效率的多智能体协作学习通信机制[J]. 信息安全研究 2020(04)
[21].基于时滞脉冲控制的二阶多智能体一致性分析[J]. 莆田学院学报 2020(02)
[22].正实特征值切换拓扑的一般线性多智能体动态系统稳定性[J]. Engineering 2020(06)
[23].支持强化学习多智能体的网电博弈仿真平台[J]. 指挥与控制学报 2019(01)
[24].鲁棒优化与多智能体协调的电梯群控调度[J]. 中国新通信 2017(12)
[25].基于多智能体遗传算法的配电网节能降耗综合管理系统[J]. 湖南大学学报(自然科学版) 2016(04)
[26].事件触发控制背景下的二阶多智能体一致性探究[J]. 数学学习与研究 2019(03)
[27].主从多智能体网络快速随机一致性[J]. 山东大学学报(理学版) 2014(01)
[28].大规模多智能体仿真平台设计方法的研究[J]. 中国科学技术大学学报 2012(08)
[29].离散时间混合多智能体的拟平均一致性控制[J]. 智能系统学报 2012(04)
[30].基于多智能体社会的僵尸网络协同防御模型[J]. 微电子学与计算机 2011(03)

标签：多智能体论文; 实时策略论文; 人工智能论文; 对抗博弈论文; 深度强化学习论文;

人工智能与“星际争霸”:多智能体博弈研究新进展

论文摘要

论文目录

文章来源

相关论文文献

猜你喜欢