基于GBDT算法的地铁IC卡通勤人群识别

基于GBDT算法的地铁IC卡通勤人群识别

论文摘要

随着公交IC卡的应用和普及,从IC卡数据中挖掘通勤用户,为下阶段采取分流措施缓解早晚高峰压力,优化票价制定等具有重要意义。以广州市地铁数据为依托,选取合适的特征属性,提出了一种基于梯度提升树(gradient boosting decision tree,GBDT)机器学习算法为基础的通勤人群识别方法。首先以周工作日的首末次平均刷卡时间、首末次平均刷卡时长、首末次刷卡时长波动程度、刷卡次数总和等5个特征来制定调查问卷的数据格式。然后利用处理过的带标签(通勤/非通勤)的调查问卷数据去训练GBDT分类器模型,测试样本的通勤识别的准确率高达94.16%。最后利用该模型对广州地铁IC卡数据通勤人群进行识别,结果显示广州地铁刷卡数据中通勤人群数量为131万左右,占总地铁刷卡出行人数32%左右。

论文目录

  • 0 引言
  • 1 地铁IC卡数据和特征属性
  •   1.1 数据介绍和预处理
  •   1.2 通勤特征属性选择与处理
  • 2 通勤筛选方法介绍
  •   2.1 GBDT算法介绍
  •   2.2 基于调查问卷的GBDT分类模型的构建
  •   2.3 训练模型结果深度评价与分析
  • 3 地铁通勤人群筛选
  • 4 结语
  • 文章来源

    类型: 期刊论文

    作者: 翁小雄,吕攀龙

    关键词: 交通工程,城市交通,地铁卡数据,通勤识别

    来源: 重庆交通大学学报(自然科学版) 2019年05期

    年度: 2019

    分类: 工程科技Ⅱ辑

    专业: 铁路运输

    单位: 华南理工大学土木与交通学院

    基金: 国家自然科学基金项目(51578247),广州市交通委员会科技项目(GZJTRKT2016-1201),广东省交通运输厅科技项目(科技-2015-02-070)

    分类号: U293.2

    页码: 8-12

    总页数: 5

    文件大小: 194K

    下载量: 319

    相关论文文献

    标签:;  ;  ;  ;  

    基于GBDT算法的地铁IC卡通勤人群识别
    下载Doc文档

    猜你喜欢