论文摘要
图像语义分割是现代自动驾驶系统的一个必要部分,因为对汽车周围场景的准确理解是导航和动作规划的关键。为提高自动驾驶场景的图像语义分割准确率,且考虑到当下流行的基于卷积神经网络的语义分割模型(DeepLab v3+)无法有效地利用注意力信息,导致分割边界粗糙等问题,提出一种融合底层像素信息与通道、空间信息的语义分割神经网络。在卷积神经网络中插入注意力模块,提取出图像语义级别的信息,通过学习图像的位置信息和通道信息得到更加丰富的特征;从卷积神经网络输出的各类别得分值计算出单点势能,且从初步分割图和原图得到成对势能,以便全连接条件随机场对图像的全部像素进行建模,并且优化图像的局部细节;全连接条件随机场通过迭代得到语义分割的最终结果。在CityScapes数据集上进行了测试,与DeepLab v3+相比较,改进后的模型分别提高了均交并比和均像素精度等关键指标1.07%和3.34%。它能够更加精细地分割目标,较好地解决分割边界粗糙,有效地抑制边界区域分割的过度平滑和不合理孤岛等问题。
论文目录
文章来源
类型: 期刊论文
作者: 王中宇,倪显扬,尚振东
关键词: 自动驾驶,图像语义分割,卷积神经网络
来源: 光学精密工程 2019年11期
年度: 2019
分类: 工程科技Ⅱ辑,信息科技
专业: 汽车工业,计算机软件及计算机应用,自动化技术
单位: 北京航空航天大学仪器科学与光电工程学院,河南科技大学机电工程学院
基金: 北京市自然科学基金资助项目(No.3172020)
分类号: TP391.41;TP183;U463.6
页码: 2429-2438
总页数: 10
文件大小: 491K
下载量: 423