交通流数据自适应特征选择算法

交通流数据自适应特征选择算法

论文摘要

在交通流数据挖掘领域中,交通流预测占据着相当重要的地位。特别的,由于交通流数据具有数据量大、维度高、非线性等特征,对预测数据训练集的选取更加关键。文中以包含多影响因子的交通流数据为研究对象,综合考虑了交通流量、天气以及日期属性等交通数据特征。数据的特征较多,维度较高。基于此,在对数据进行合适的数据清洗后,提出并实现了一种梯度提升决策树的自适应选择方法,对应用于动态交通流预测模型的数据集进行特征选择。以分类和回归决策树作为基学习器,采用梯度提升决策树算法进行回归拟合。通过迭代过程中每棵决策树产生的基尼指数和分裂特征属性的次数来计算特征重要度,并采用二次下降法对特征进行自适应选择,实现对交通流数据重要特征的自动选取。最后,通过实验数据论证了提出的算法和模型。

论文目录

  • 0 引 言
  • 1 数据清洗与数据规范化
  • 2 特征重要度计算
  •   2.1 单棵CART树中特征的基尼指数和分裂次数
  •   2.2 梯度提升决策树(GBDT)模型
  • 3 基于梯度提升决策树的自适应选择算法
  • 4 实验结果和分析
  •   4.1 数据来源与评价指标
  •   4.2 实验一:数据清洗
  •   4.3 实验二:基于梯度提升决策树的自适应特征选择
  • 5 结束语
  • 文章来源

    类型: 期刊论文

    作者: 邓晶,张倩

    关键词: 特征选择,梯度提升决策树,分类与回归决策树,特征重要度,二次下降法

    来源: 计算机技术与发展 2019年12期

    年度: 2019

    分类: 信息科技,工程科技Ⅱ辑

    专业: 公路与水路运输

    单位: 南京工程学院计算机学院

    基金: 国家重点技术研发项目(2018YFC0407106)

    分类号: U491

    页码: 76-80

    总页数: 5

    文件大小: 142K

    下载量: 130

    相关论文文献

    标签:;  ;  ;  ;  ;  

    交通流数据自适应特征选择算法
    下载Doc文档

    猜你喜欢