多智能体机器人系统论文开题报告文献综述

多智能体机器人系统论文开题报告文献综述

导读:本文包含了多智能体机器人系统论文开题报告文献综述、选题提纲参考文献,主要关键词:智能,机器人,系统,视觉,算子,无线通信,足球比赛。

多智能体机器人系统论文文献综述写法

刘强[1](2016)在《基于智能体的多机器人系统学习方法研究》一文中研究指出与单个机器人相比较,多机器人(MRS)具有很多优势和良好的发展前景,已经成为机器人领域中的研究热点。多机器人系统是一个复杂的动态系统,在设计机器人控制策略的时候,通常不能够预先为每个机器人设定好所有的最优行为。基于行为的方法能够让多机器人系统呈现出一些智能的特点,完成比较复杂的任务,极大地促进了多机器人系统的发展。但是仅采用基于行为的方法还不能完全适应不断变化的外界环境和不同任务的需求,让多机器人系统具有自主的学习能力,同时避免单一学习方法的局限性,从而不断提高个体机器人之间的协调协作能力是多机器人系统的重要发展方向。因此研究将不同的机器学习方法与基于行为的多机器人系统相结合具有很好的研究意义。本文采用智能体理论对多机器人系统进行研究,其主要的研究内容包括:首先,研究了智能体及多智能体系统的理论,分析了单机器人和多机器人系统的几种体系结构,提出将基于行为的方法和基于学习的方法相结合来探索多机器人协同的研究思路,同时设计了基于行为的机器人编队和足球系统。在多机器人系统众多的研究内容中,学习能力占据了重要位置。基于行为的方法具有鲁棒性强、灵活的特点,相对于其它的方法能更好地使机器人完成任务。本文以基于行为的方法为基础,结合不同的机器学习方法,针对多机器人系统的两个主要应用平台:机器人编队和足球,在机器人仿真软件Mission Lab和Teambots的基础上,设计了基于行为的多机器人系统,从而可以对本文提出的几种算法进行验证。其次,研究了粒子群优化算法(PSO)和基于案例的推理(CBR)方法,针对这两种方法各自的优势,提出了一种融合PSO与CBR的混合系统方法。传统的基于行为的方法虽然具有很多优点,但是其固定的行为参数难以适应外界复杂的环境。CBR作为人工智能中的一项重要技术,因为其具有易于检索和存储的特点,很适合为不同的行为提供相应的参数。但是传统的CBR方法缺乏有效的学习能力,因此本文提出将PSO作为CBR的优化器,让CBR不断得到更好的案例,同时PSO也可以通过CBR获得更好的初始种群。与遗传算法(GA)相比较,PSO也是一种群智能方法,但是具有结构更简单、实时性强和适合对连续问题进行优化的特点,可以说遗传算法能够解决的问题,粒子群优化算法都能够解决。本文将PSO算法与CBR方法相结合,不仅克服了CBR的缺点,同时也满足了实时性和对连续问题进行优化的需求。同时以基于行为的机器人编队为测试平台,与标准的粒子群优化算法相比较,验证了该方法的有效性。然后,研究了强化学习的基本理论和典型的Q-学习方法,针对传统Q-学习在多机器人系统中应用的缺点:缺乏信息交流和结构信度分配问题,提出了一种采用经验共享和滤波技术的改进Q-学习算法,从而改善了学习性能、提高了学习效率。Q-学习算法的理论基础是马尔可夫决策过程,直接把Q-学习应用到多机器人系统中虽然破坏了这个前提,但是Q-学习因为具有运算简单、状态-动作空间规模小的特点,在机器人学习中还是得到了广泛应用。与多智能体强化学习方法相比较,传统的Q-学习算法缺乏与其它智能体的信息交流,因此本文提出了采用经验共享的方式,每个智能体共享其它智能体的Q值信息,在学习的过程中采用了渐进的学习方式,利用?-Greedy策略以1-?的概率来选取其它智能体的学习经验。同时为了加速Q-学习的收敛,不同于简单地把回报信号统一分配给每个智能体,本文将卡尔曼滤波技术运用到回报信号的分配中,即把接收到的回报信号看作是真实的回报信号与噪声信号的结合,在一定程度上解决了结构信度分配问题。以机器人足球为测试平台,与传统的Q-学习算法相比较,验证了该方法的有效性。最后,研究了几种典型的多智能体强化学习算法Minimax-Q、Nash-Q、FFQ和CE-Q和基于后悔理论的学习方法,针对传统的CE-Q算法收敛速度慢的缺点:缺乏有效的行为探索策略,提出了一种采用无悔策略的新型CE-Q学习算法。马尔可夫对策理论为多智能体强化学习提供了很好的理论基础,纳什均衡在多智能体强化学习中起到了重要作用,因此这些算法也被称作基于均衡的学习算法。与Nash-Q学习算法中计算纳什均衡相比较,计算CE-Q中的相关均衡更容易,因此CE-Q有着更好的应用前景。但是传统的CE-Q学习方法缺乏有效的行为探索策略,因此影响了CE-Q学习方法的收敛速度。从无悔策略的理论中得到启发,如果每个智能体都选择减少平均后悔值的方法作为行为探索策略,那么所有智能体的行为将趋向于收敛到一组没有后悔值的集合点,这组集合点也被称为粗糙相关均衡集合。同时经过分析得到,纳什均衡和相关均衡在本质上都属于粗糙相关均衡。因此本文提出了采用减少平均后悔值的新型CE-Q学习算法,加快CE-Q学习方法的收敛速度。最后以机器人足球为测试平台,与传统的CE-Q学习算法相比较,验证了该方法的有效性。(本文来源于《哈尔滨工业大学》期刊2016-12-01)

梁家海,陆丽丹[2](2016)在《智能体机器人足球比赛模拟系统》一文中研究指出【目的】实体机器人足球比赛系统成本高、技术难度大,而智能体(Agent)机器人模拟足球比赛系统可以为实体机器人足球比赛系统的设计提供参考。【方法】根据实体机器人的特点,用智能体模拟实体机器人,将机器人足球比赛的控制算法建立在智能体上,对智能体设置运动速度、射门速度、能量、避碰等能力及意图,再利用网络技术,建立一个多种影响参数的足球机器人比赛模拟系统。【结果】该系统能有效按研究者设定的参数(条件)进行比赛,比赛结果与实际基本相符。【结论】智能体足球机器人比赛模拟系统不仅可以作为实体机器人足球比赛的模拟平台,还可以作为实体机器人足球比赛策略和相关参数的研究平台。(本文来源于《广西科学院学报》期刊2016年01期)

邹海洋[3](2015)在《多智能机器人群体嗅觉系统的设计》一文中研究指出嗅觉系统作为机器人智能化的一方面,主要应用于灾难中对遇难者的搜索,有害和有毒气体泄漏的排除和检测等各个方面。通过机器人对人类视觉系统和嗅觉系统的模仿,利用交叉识别模式来完成对气味源搜索、定位、识别,在算法中我们首先通过贝叶斯定理判断出采集到的气味是属于气味源、非气味源,障碍物中的那种情况;随后利用流体力学理论计算出气体源的浓度信息;最后利用领航者机器人的视觉系统同嗅觉系统相结合的交叉识别模式,迅速找出气味源的具体位置。(本文来源于《电脑知识与技术》期刊2015年33期)

邹海洋[4](2015)在《多智能机器人群体中领航者视觉系统的设计》一文中研究指出视觉系统是我们感知外部世界的重要途径,要使机器人具有智能化的功能,视觉系统是必不可少的。在算法设计中,我们在领航者上利用两台固定的摄像机模拟成人类的眼睛,通过这两台摄像机分别获取同一目标的左右两幅图像,然后利用注意机制原理求出位移量,最终确定视差信息,从而实现目标在叁维空间中的建模;最后在通过SIFT算法求出图像中像素点的特征值,通过对这些特征值的描述及匹配,实现对目标的精确定位。(本文来源于《中国西部科技》期刊2015年12期)

邹海洋[5](2015)在《多智能机器人群体中跟随者视觉系统的设计》一文中研究指出视觉系统是我们感知外部世界的重要途径,我们同外界的交流中,大约有70%信息是通过视觉系统实现的,要使机器人具有智能化的功能,视觉系统是必不可少的。在现实生活的灾难中,如何在有效的72小时的黄金时间内,利用机器人群体的智能化来实现灾难损失和伤害的最小化。人类视觉系统为我们提供了启示,人类视觉系统具有强大的数据筛选功能,如果把视觉系统引入到多智能机器人群体中,会对机器人实现真正的智能化提供了较好的理论及现实意义。(本文来源于《电脑知识与技术》期刊2015年06期)

代冀阳,殷林飞,杨保建,王村松[6](2015)在《基于GA的多智能机器人合作的物流配送系统研究》一文中研究指出针对物流系统中物流配送的路径规划问题,首先,建立叁级物流配送模型,采用遗传算法和爬山算子进行分组和路径规划,选择对应的枢纽网点和客户网点,使得其总费用最优。然后,编写相应的Android智能机器人应用APK程序,并通过多机器人系统进行实现。多Android智能机器人能自主实现简单的局部任务规划和执行总台的指令,从而证明了采用遗传算法和爬山算子相结合在物流配送系统中的可行性和可靠性。(本文来源于《计算机应用与软件》期刊2015年12期)

刘鑫,于振中,郑为凑,惠晶[7](2014)在《多机器人远程监控系统的多智能体控制结构》一文中研究指出针对多机器人远程监控系统信息错综复杂、协作不稳定的问题,建立基于多智能体(Multi-Agent)技术的系统体系结构,描述系统各组件之间的信息交互关系,优化人-机智能分配。分析系统物理结构的特点,提出一种基于Multi-Agent技术的共享控制系统分层体系结构,结合黑板结构和点对点结构,给出Multi-Agent的混合通信模型。针对遥操作系统的特点,设计一种混合型Agent体系结构,举例研究Agent的实现方法。通过多操作者控制机器人保持队形的实验,验证了该混合型Agent体系结构的实用性和有效性。(本文来源于《计算机工程》期刊2014年02期)

周坤龙[8](2013)在《基于多智能体强化学习的足球机器人决策系统研究与设计》一文中研究指出如何使智能体模拟人类思维方法做出决策是人工智能的要义ˋ智能体能够通过强化学习方法ˋ对环境进行试错性的学习ˋ从而为求解马尔可夫决策过程描述的大规模不确定环境下的决策问题提供了方法RoboCup机器人足球世界杯是国际上一项为促进以多智能体系统及分布式人工智能为主的相关领域发展的国际比赛及学术活动其中ˋRobocup2D仿真比赛是以多球员智能体决策为重点的比赛项目本文以多智能体强化学习为基础ˋ以基于MAXQ分层强化学习及球员协作动作学习为主要方法ˋ以Robocup2D仿真比赛为实验平台ˋ对多智能体强化学习及决策问题进行研究ˋ并将其应用于球员个人及协作行为决策首先ˋ对多智能体决策问题及强化学习方法进行了归纳与总结接着ˋ针对强化学习系统状态复杂ˋ维度灾难问题ˋ引入CMAC神经网络进行泛化ˋ加快收敛速度ˋ提高学习准确度使用模拟退火策略ˋ使学习过程跳出局部最优解ˋ通过探索获取全局最优解同时引入MAXQ分层学习方案ˋ通过分层的结构将球员决策任务根据系统环境及任务复杂度进行划分ˋ将大维度的空间划分为一系列小维度状态空间ˋ降低状态空间维度ˋ使用启发式信息进行完成函数的估值ˋ实现分层学习的在线优化最后ˋ在仿真足球比赛平台中ˋ设计了球员的决策模型及相关功能模块ˋ引入动态势能场模型作为启发式ˋ使球员智能体能够根据所获取的球场及球员的位置ˋ做出适应的收益判断并更新估值函数通过前向树搜索对队友行为进行规划实现球员间的协作ˋ并利用强化学习得到的估值函数对其行为评估ˋ使球员选择最优策略ˋ完成行为决策ˋ提高球员之间的协作能力本文将提出的方法应用到了仿真平台球队ˋ以截球任务及分组对比的形式对算法进行分析以比赛的形式ˋ与其他队伍进行比较ˋ并对实验结果进行分析ˋ验证了本文提出方法的正确性及有效性(本文来源于《哈尔滨工业大学》期刊2013-12-01)

苏倩[9](2012)在《基于ZigBee的多智能机器人无线通信系统的硬件平台研究》一文中研究指出基于ZigBee无线通信系统,对多智能机器人系统协作控制中的信息无线传输进行了软硬件平台设计和构建,实现了多智能机器人运动时的信息交互。主要工作如下:(1)分析了通信需求,设计了机器人系统基于ZigBee无线网络的通信方案;(2)对ZigBee技术的组网进行了多角度研究,设计并实现了四种组网方式;(3)研究了ZigBee协议栈,针对通信需求在应用层平台上进行了开发;(4)搭建了无线通信系统的硬件平台,进行了设计、实现、调试并分析结果;(5)对通信中出现问题进行了原因分析,并给出改进方法。综上,本文主要设计了ZigBee无线通信模块及连接电路,实现了无线通信系统的组网及通信,对机器人运动过程中的信息进行实时收发,完成了多智能机器人无线通信硬件平台的搭建。(本文来源于《西安电子科技大学》期刊2012-01-01)

高延增,叶家玮,龚幼[10](2010)在《基于粒子群优化的多智能体强化学习算法在水下机器人定位系统中的应用》一文中研究指出提出一种融合多传感器的超小型远程操纵型水下机器人(ROV)快速定位系统。利用基于粒子群优化的多智能体强化学习算法融合水下机器人超短基线定位声纳及位姿传感器信号,可提高ROV的定位速度。给出ROV定位系统试验平台硬件结构以及多线程、模块化的软件系统搭建方案。在船模实验池中进行ROV的定位验证,结果表明该算法满足ROV对定位速度的要求。(本文来源于《机床与液压》期刊2010年19期)

多智能体机器人系统论文开题报告范文

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

【目的】实体机器人足球比赛系统成本高、技术难度大,而智能体(Agent)机器人模拟足球比赛系统可以为实体机器人足球比赛系统的设计提供参考。【方法】根据实体机器人的特点,用智能体模拟实体机器人,将机器人足球比赛的控制算法建立在智能体上,对智能体设置运动速度、射门速度、能量、避碰等能力及意图,再利用网络技术,建立一个多种影响参数的足球机器人比赛模拟系统。【结果】该系统能有效按研究者设定的参数(条件)进行比赛,比赛结果与实际基本相符。【结论】智能体足球机器人比赛模拟系统不仅可以作为实体机器人足球比赛的模拟平台,还可以作为实体机器人足球比赛策略和相关参数的研究平台。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多智能体机器人系统论文参考文献

[1].刘强.基于智能体的多机器人系统学习方法研究[D].哈尔滨工业大学.2016

[2].梁家海,陆丽丹.智能体机器人足球比赛模拟系统[J].广西科学院学报.2016

[3].邹海洋.多智能机器人群体嗅觉系统的设计[J].电脑知识与技术.2015

[4].邹海洋.多智能机器人群体中领航者视觉系统的设计[J].中国西部科技.2015

[5].邹海洋.多智能机器人群体中跟随者视觉系统的设计[J].电脑知识与技术.2015

[6].代冀阳,殷林飞,杨保建,王村松.基于GA的多智能机器人合作的物流配送系统研究[J].计算机应用与软件.2015

[7].刘鑫,于振中,郑为凑,惠晶.多机器人远程监控系统的多智能体控制结构[J].计算机工程.2014

[8].周坤龙.基于多智能体强化学习的足球机器人决策系统研究与设计[D].哈尔滨工业大学.2013

[9].苏倩.基于ZigBee的多智能机器人无线通信系统的硬件平台研究[D].西安电子科技大学.2012

[10].高延增,叶家玮,龚幼.基于粒子群优化的多智能体强化学习算法在水下机器人定位系统中的应用[J].机床与液压.2010

标签:;  ;  ;  ;  ;  ;  ;  

多智能体机器人系统论文开题报告文献综述
下载Doc文档

猜你喜欢