基于改进DDPG算法的车辆低速跟驰行为决策研究

基于改进DDPG算法的车辆低速跟驰行为决策研究

论文摘要

车辆跟驰行为决策研究对于车辆跟驰驾驶技术的发展至关重要,以深度强化学习方法研究车辆低速跟驰场景,提出了一种改进型DDPG决策算法,该算法在DDPG算法的基础上,结合了CBF控制器以进行安全补偿控制与策略探索指导;同时,设计了符合低速跟驰期望目标的奖励函数。在对比实验中,通过高斯过程模型模拟跟驰车队系统,分别用DDPG算法和DDPG-CBF改进算法控制其中一辆车的跟驰行为,实验结果表明,相比于DDPG算法,DDPG-CBF改进算法可以更有效地保证跟驰决策的安全性,同时具有更高的学习效率,能够应用于车辆低速跟驰场景。

论文目录

  • 1 强化学习理论基础
  • 2 基于改进DDPG算法的车辆低速跟驰行为决策
  •   2.1 DDPG算法原理
  •   2.2 高斯过程与奖励函数设定
  •   2.3 CBF方法
  •   2.4 DDPG-CBF改进算法
  • 3 仿真实验结果分析
  • 4 结束语
  • 文章来源

    类型: 期刊论文

    作者: 罗颖,秦文虎,翟金凤

    关键词: 车辆低速跟驰,深度强化学习,高斯过程模型

    来源: 测控技术 2019年09期

    年度: 2019

    分类: 信息科技,工程科技Ⅱ辑

    专业: 公路与水路运输,自动化技术

    单位: 东南大学仪器科学与工程学院

    分类号: TP18;U491

    DOI: 10.19708/j.ckjs.2019.09.004

    页码: 19-23

    总页数: 5

    文件大小: 251K

    下载量: 348

    相关论文文献

    标签:;  ;  ;  

    基于改进DDPG算法的车辆低速跟驰行为决策研究
    下载Doc文档

    猜你喜欢