基于集成学习方法的点击率预估模型研究

基于集成学习方法的点击率预估模型研究

论文摘要

由于互联网中积累的广告日志具有数据稀疏、特征量大、正负样本分布极其不均匀等问题,使得人工特征提取费时费力,并且单一预测模型很难得到更好的预测性能。针对这些问题,提出梯度提升树GBDT和Stacking相融合的点击率预测模型GBDT-Stacking。通过引入梯度提升树自动进行特征提取与构造,并结合Stacking集成模型对在线广告点击率进行预测,有效提高了单个预测模型的性能。在真实广告数据集上的实验结果表明,GBDT-Stacking集成模型比对比模型在AUC的取值上至少提升了4%。

论文目录

  • 1 引言
  • 2 基于GBDT-Stacking模型的点击率预测模型
  •   2.1 GBDT特征工程
  •   2.2 基于Stacking集成模型对广告点击率预测
  •   2.3 评估指标
  • 3 实证分析
  •   3.1 数据说明
  •   3.2 实验设计
  •   3.3 实验结果分析
  •     3.3.1 正负样本比例对模型预测的影响
  •     3.3.2 不同预测模型对比
  •     3.3.3 稳定性检验
  • 4 结束语
  • 文章来源

    类型: 期刊论文

    作者: 贺小娟,潘文捷,程宏

    关键词: 梯度提升树,集成学习,广告点击率

    来源: 计算机工程与科学 2019年12期

    年度: 2019

    分类: 信息科技

    专业: 互联网技术,自动化技术

    单位: 上海对外经贸大学统计与信息学院,上海立信会计金融学院统计与数学学院

    基金: 2016年上海市青年科技英才扬帆计划(16YF1415900),上海立信会计金融学院统计学一级学科建设项目

    分类号: TP393.09;TP18

    页码: 2278-2284

    总页数: 7

    文件大小: 542K

    下载量: 234

    相关论文文献

    标签:;  ;  ;  

    基于集成学习方法的点击率预估模型研究
    下载Doc文档

    猜你喜欢