论文摘要
随着公交IC卡的应用和普及,从IC卡数据中挖掘通勤用户,为下阶段采取分流措施缓解早晚高峰压力,优化票价制定等具有重要意义。以广州市地铁数据为依托,选取合适的特征属性,提出了一种基于梯度提升树(gradient boosting decision tree,GBDT)机器学习算法为基础的通勤人群识别方法。首先以周工作日的首末次平均刷卡时间、首末次平均刷卡时长、首末次刷卡时长波动程度、刷卡次数总和等5个特征来制定调查问卷的数据格式。然后利用处理过的带标签(通勤/非通勤)的调查问卷数据去训练GBDT分类器模型,测试样本的通勤识别的准确率高达94.16%。最后利用该模型对广州地铁IC卡数据通勤人群进行识别,结果显示广州地铁刷卡数据中通勤人群数量为131万左右,占总地铁刷卡出行人数32%左右。
论文目录
文章来源
类型: 期刊论文
作者: 翁小雄,吕攀龙
关键词: 交通工程,城市交通,地铁卡数据,通勤识别
来源: 重庆交通大学学报(自然科学版) 2019年05期
年度: 2019
分类: 工程科技Ⅱ辑
专业: 铁路运输
单位: 华南理工大学土木与交通学院
基金: 国家自然科学基金项目(51578247),广州市交通委员会科技项目(GZJTRKT2016-1201),广东省交通运输厅科技项目(科技-2015-02-070)
分类号: U293.2
页码: 8-12
总页数: 5
文件大小: 194K
下载量: 319