基于DBSCAN算法和多源数据的缺失公交到站数据修补

基于DBSCAN算法和多源数据的缺失公交到站数据修补

论文摘要

针对缺失公交到站信息修补方法考虑因素较少、准确度低、鲁棒性差的现状,提出了基于DBSCAN算法和多源数据的缺失公交到站数据修补方法。该方法使用公交全球定位系统(GPS)、公交集成电路卡(IC)等多源数据进行缺失到站信息的修补。对于缺失的到站名称、到站经纬度数据,用已有完整到站数据和静态线路信息关联分析进行修补。对于缺失的到站时刻数据,则按以下步骤进行修补:首先,对每一个缺失数据站点与其最近的未缺失数据站点,将这两站点间历史完整到站数据的行程时间和班次时序进行基于DBSCAN算法的聚类;其次,判断研究班次的两个相邻的数据完整的班次所属簇是否为同一个簇,若为同一个簇则不作改变,否则将两个簇合并;最后,将簇中点对应最大行程时间作为缺失行程时间判断是否有乘客在该站点上车刷卡,若有则由乘客开始刷卡时刻推算到站时刻,若无则将簇中点对应最大、最小行程时间的均值作为缺失行程时间推算到站时刻。以厦门市公交到站数据为例,在缺失到站名称、经纬度修补中,基于GPS数据聚类的方法、基于极大概率估计的方法和所提方法皆可进行100%的修补;在缺失到站时刻修补中,所提方法的平均相对误差比两种对比方法分别低0.030 1%和0.000 4%,相关系数比对比方法分别高0.005和0.007 5。实验结果表明,所提算法在缺失公交到站数据修补中能有效提高修补的准确度,降低缺失站点个数变化对于准确度的影响。

论文目录

  • 0 引言
  • 1 问题描述及分析
  •   1.1 公交到站数据介绍
  •   1.2 刷卡数据及线路数据介绍
  •   1.3 公交到站数据的缺失情况
  • 2 缺失公交到站数据修补
  •   2.1 缺失到站名称、经纬度修补
  •   2.2 缺失到站时刻修补
  •   2.3 缺失公交到站数据修补流程
  •   2.4 算法的理论分析与比较
  • 3 实验与结果
  •   3.1 数据集介绍
  •   3.2 检验方法和评价标准
  •   3.3 缺失公交到站数据修补结果
  •   3.4 结果分析
  • 4 结语
  • 文章来源

    类型: 期刊论文

    作者: 王成,崔紫薇,杜梓林,高悦尔

    关键词: 缺失到站数据修补,算法,到站经纬度,到站时刻,多源数据

    来源: 计算机应用 2019年11期

    年度: 2019

    分类: 信息科技,工程科技Ⅱ辑

    专业: 公路与水路运输

    单位: 华侨大学计算机科学与技术学院,华侨大学建筑学院

    基金: 国家自然科学基金青年基金资助项目(51608209),福建省自然基金面上项目(2017J01090),福建省引导性计划项目(2019H0017),泉州市科技计划项目(2018Z008),华侨大学研究生科研创新能力培育计划项目(17013083017)~~

    分类号: U491.17

    页码: 3184-3190

    总页数: 7

    文件大小: 885K

    下载量: 166

    相关论文文献

    标签:;  ;  ;  ;  ;  

    基于DBSCAN算法和多源数据的缺失公交到站数据修补
    下载Doc文档

    猜你喜欢