论文摘要
多智能体博弈游戏具有实时对抗、群体协作、非完全信息博弈、庞大的搜索空间、多复杂任务和时间空间推理等特点,是当前人工智能领域极具挑战的难题。同时,该领域研究成果在社会管理、智能交通、经济、军事等领域有广阔的应用前景。以具有代表性的多智能体博弈游戏"星际争霸"为主要研究对象,通过分析研究难度、总结研究方法、介绍研究环境及数据集与竞赛资源,对近年来该领域人工智能研究成果进行了梳理和总结,并对该领域未来可能的发展方向进行预测,为相关研究工作的开展提供可借鉴参考信息。
论文目录
文章来源
类型: 期刊论文
作者: 张宏达,李德才,何玉庆
关键词: 多智能体,实时策略,人工智能,对抗博弈,深度强化学习
来源: 无人系统技术 2019年01期
年度: 2019
分类: 信息科技,基础科学
专业: 数学,自动化技术
单位: 中国科学院沈阳自动化研究所机器人学国家重点实验室,中国科学院大学
基金: 国家自然科学基金(91748208),国家自然科学基金联合基金(U1608253),中国科学院联合基金(6141A01061601)
分类号: TP18;O225
页码: 5-16
总页数: 12
文件大小: 1967K
下载量: 1028
相关论文文献
- [1].基于蒙特卡洛Q值函数的多智能体决策方法[J]. 控制与决策 2020(03)
- [2].多智能体深度强化学习研究综述[J]. 计算机工程与应用 2020(05)
- [3].多智能体路径规划研究进展[J]. 计算机工程 2020(04)
- [4].数据驱动的多智能体网络鲁棒包容控制[J]. 控制理论与应用 2020(09)
- [5].基于雷达观测的多智能体编队协作式目标跟踪[J]. 指挥信息系统与技术 2020(04)
- [6].基于多智能体的配电台区智能决策系统研究[J]. 信息技术 2020(10)
- [7].多智能体集合的人机交互指控系统架构研究[J]. 中国管理信息化 2020(20)
- [8].多智能体聚集问题研究综述[J]. 计算机应用研究 2019(06)
- [9].多智能体强化学习综述[J]. 计算机科学 2019(08)
- [10].基于多智能体的编队控制一致性研究[J]. 科技创新与应用 2016(35)
- [11].新时期物联网环境下多智能体决策信息技术[J]. 山西农经 2016(14)
- [12].牵引控制间歇通讯多智能体网络的一致性[J]. 信息与控制 2017(02)
- [13].基于切换拓扑的多智能体协作控制研究综述[J]. 计算机应用研究 2019(04)
- [14].基于事件触发机制的多智能体网络平均一致性研究[J]. 计算机应用研究 2017(03)
- [15].多智能体协调控制的演化博弈方法[J]. 系统科学与数学 2016(03)
- [16].多智能体模型用于土地利用演变模拟研究进展[J]. 江西科学 2015(01)
- [17].具有多变时滞的多智能体复杂动态网络的平均一致性[J]. 郧阳师范高等专科学校学报 2013(06)
- [18].分布式优化的多智能体方法[J]. 控制理论与应用 2019(11)
- [19].一种基于多智能体强化学习的流量分配算法[J]. 北京邮电大学学报 2019(06)
- [20].一种高效率的多智能体协作学习通信机制[J]. 信息安全研究 2020(04)
- [21].基于时滞脉冲控制的二阶多智能体一致性分析[J]. 莆田学院学报 2020(02)
- [22].正实特征值切换拓扑的一般线性多智能体动态系统稳定性[J]. Engineering 2020(06)
- [23].支持强化学习多智能体的网电博弈仿真平台[J]. 指挥与控制学报 2019(01)
- [24].鲁棒优化与多智能体协调的电梯群控调度[J]. 中国新通信 2017(12)
- [25].基于多智能体遗传算法的配电网节能降耗综合管理系统[J]. 湖南大学学报(自然科学版) 2016(04)
- [26].事件触发控制背景下的二阶多智能体一致性探究[J]. 数学学习与研究 2019(03)
- [27].主从多智能体网络快速随机一致性[J]. 山东大学学报(理学版) 2014(01)
- [28].大规模多智能体仿真平台设计方法的研究[J]. 中国科学技术大学学报 2012(08)
- [29].离散时间混合多智能体的拟平均一致性控制[J]. 智能系统学报 2012(04)
- [30].基于多智能体社会的僵尸网络协同防御模型[J]. 微电子学与计算机 2011(03)