论文摘要
车辆跟驰行为决策研究对于车辆跟驰驾驶技术的发展至关重要,以深度强化学习方法研究车辆低速跟驰场景,提出了一种改进型DDPG决策算法,该算法在DDPG算法的基础上,结合了CBF控制器以进行安全补偿控制与策略探索指导;同时,设计了符合低速跟驰期望目标的奖励函数。在对比实验中,通过高斯过程模型模拟跟驰车队系统,分别用DDPG算法和DDPG-CBF改进算法控制其中一辆车的跟驰行为,实验结果表明,相比于DDPG算法,DDPG-CBF改进算法可以更有效地保证跟驰决策的安全性,同时具有更高的学习效率,能够应用于车辆低速跟驰场景。
论文目录
文章来源
类型: 期刊论文
作者: 罗颖,秦文虎,翟金凤
关键词: 车辆低速跟驰,深度强化学习,高斯过程模型
来源: 测控技术 2019年09期
年度: 2019
分类: 信息科技,工程科技Ⅱ辑
专业: 公路与水路运输,自动化技术
单位: 东南大学仪器科学与工程学院
分类号: TP18;U491
DOI: 10.19708/j.ckjs.2019.09.004
页码: 19-23
总页数: 5
文件大小: 251K
下载量: 348