基于XGBoost算法的恒星/星系分类研究

基于XGBoost算法的恒星/星系分类研究

论文摘要

机器学习在当今的诸多领域已经取得了巨大的成功.尤其是提升算法.提升算法适应各种场景的能力较强、准确率较高,已经在多个领域发挥巨大的作用.但是提升算法在天文学中的应用却极为少见.为解决斯隆数字巡天(Sloan Digital Sky Survey,SDSS)数据中恒星/星系暗源集分类正确率低的问题,引入了机器学习中较新的研究成果–XGBoost (eXtreme Gradient Boosting).从SDSS-DR7 (SDSS Data Release 7)中获取完整的测光数据集,并根据星等值划分为亮源集和暗源集.首先,分别对亮源集和暗源集使用十折交叉验证法,同时运用XGBoost算法建立恒星/星系分类模型;然后,运用栅格搜索等方法调优XGBoost参数;最后,基于星系的分类正确率等指标,与功能树(Function Tree, FT)、Adaboost (Adaptive boosting)、随机森林(Random Forest, RF)、梯度提升决策树(Gradient Boosting Decision Tree, GBDT)、堆叠降噪自编码(Stacked Denoising AutoEncoders, SDAE)、深度置信网络(Deep Belief Network, DBN)等模型进行对比并分析结果.实验结果表明:XGBoost在暗源分类中要比功能树算法的星系分类正确率提高了将近10%,在暗源集的最暗星等中比功能树提高了将近5%.同其他传统的机器学习算法和深度神经网络相比, XGBoost也有不同程度的提升.

论文目录

  • 1 引言
  • 2 斯隆数字巡天
  • 3 提升算法
  •   3.1 GBDT原理
  •   3.2 XGBoost原理
  • 4 实验测试
  •   4.1 数据集介绍
  •   4.2 实验分析
  •     4.2.1 特征重要性测试
  •     4.2.2 XGBoost模型优化
  •     4.2.3 实验方法及模型对比
  • 5 总结与展望
  • 文章来源

    类型: 期刊论文

    作者: 李超,张文辉,林基明

    关键词: 恒星基本参数,星系基本参数,技术测光,方法数据分析

    来源: 天文学报 2019年02期

    年度: 2019

    分类: 基础科学

    专业: 天文学

    单位: 桂林电子科技大学信息与通信工程学院,桂林电子科技大学认知无线电与信息处理教育部重点实验室,桂林电子科技大学广西云计算与大数据协同创新中心,桂林电子科技大学广西高校云计算与复杂系统重点实验室

    基金: 广西云计算与大数据协同创新中心,广西高校云计算与复杂系统重点实验室项目(编号1716)资助

    分类号: P152

    DOI: 10.15940/j.cnki.0001-5245.2019.02.016

    页码: 73-82

    总页数: 10

    文件大小: 290K

    下载量: 269

    相关论文文献

    • [1].科学家谈天文学重要方向 星系的演化[J]. 科学观察 2020(02)
    • [2].星系中分子气体与恒星形成的研究进展[J]. 天文学进展 2020(02)
    • [3].银河之外的星系墙[J]. 世界科学 2020(10)
    • [4].星系的生命和呼吸[J]. 世界科学 2019(10)
    • [5].星系空间取向的理论和观测研究[J]. 中国科学:物理学 力学 天文学 2017(04)
    • [6].卫星星系动力学状态对星系属性的依赖[J]. 天文学报 2017(03)
    • [7].迄今最远距地132亿光年星系“现身”[J]. 冶金企业文化 2017(04)
    • [8].怎样发现暗星系[J]. 现代物理知识 2016(03)
    • [9].双城记——星系并合和星系对[J]. 物理 2015(04)
    • [10].眼中的宽边帽星系[J]. 资源与人居环境 2015(11)
    • [11].科学家发现迄今最遥远星系[J]. 前沿科学 2015(03)
    • [12].类星体的新发现[J]. 儿童故事画报 2019(44)
    • [13].停止造星运动的古老庞大星系[J]. 中国科技教育 2020(04)
    • [14].星系也在“呼吸”[J]. 科学世界 2020(05)
    • [15].星系也要有个性[J]. 小哥白尼(趣味科学) 2019(09)
    • [16].宇宙中两个星系碰撞将会发生什么?[J]. 高中生之友 2018(Z2)
    • [17].星系大碰撞[J]. 小哥白尼(趣味科学) 2018(05)
    • [18].天线星系[J]. 科普创作 2017(01)
    • [19].外星系老师说的话[J]. 中国校园文学 2018(22)
    • [20].宇宙中的星系[J]. 少儿科学周刊(儿童版) 2017(09)
    • [21].我们的星系[J]. 少儿科学周刊(儿童版) 2017(09)
    • [22].发现距地球最遥远的星系[J]. 科学大观园 2015(22)
    • [23].发现星系合并频率正逐渐下降[J]. 科学大观园 2015(11)
    • [24].科学家发现最遥远星系与地球“时差”131亿年[J]. 科技致富向导 2013(33)
    • [25].科学家发现最遥远星系 与地球“时差”131亿年[J]. 泸州科技 2013(04)
    • [26].星系[J]. 中华少年(DK少年百科) 2012(06)
    • [27].星星树·最美舞星系[J]. 新作文(小学1-2-3年级版) 2012(Z2)
    • [28].星系撞击壮丽无比[J]. 科学之友(上旬) 2013(03)
    • [29].奇异的星系怪物[J]. 大科技(科学之谜) 2013(08)
    • [30].星系联盟赠品一览[J]. 全明星 2009(07)

    标签:;  ;  ;  ;  

    基于XGBoost算法的恒星/星系分类研究
    下载Doc文档

    猜你喜欢