论文摘要
针对汽车纵向自动驾驶决策过程的因果关联问题,建立了车辆跟驰行为的马尔可夫决策过程模型,利用真实驾驶员驾驶模拟器实验数据与驾驶风险原则确定了模型中的状态集和动作集,并根据车辆的行驶状态设计了相应的回报函数,进而基于增强Q学习算法对该模型进行求解,提出了以上决策过程的因果推理机制。最终,通过在随机工况下的仿真测试,验证了该方法的可行性与有效性。
论文目录
文章来源
类型: 期刊论文
作者: 高振海,孙天骏,何磊
关键词: 车辆工程,自动驾驶,决策算法,马尔科夫决策过程,增强学习算法
来源: 吉林大学学报(工学版) 2019年05期
年度: 2019
分类: 工程科技Ⅱ辑
专业: 汽车工业
单位: 吉林大学汽车仿真与控制国家重点实验室
基金: 国家自然科学基金项目(51775236,51675224,U1564214),科技部国家重点研发项目(2017YFB0102600)
分类号: U463.6
DOI: 10.13229/j.cnki.jdxbgxb20190078
页码: 1392-1404
总页数: 13
文件大小: 2846K
下载量: 384
相关论文文献
标签:车辆工程论文; 自动驾驶论文; 决策算法论文; 马尔科夫决策过程论文; 增强学习算法论文;