利用带无标签数据的双支持向量机对恒星光谱分类

利用带无标签数据的双支持向量机对恒星光谱分类

论文摘要

恒星光谱分类是天文技术与方法领域一直关注的热点问题之一。随着观测设备持续运行和不断改进,人类获得的光谱数量与日俱增。这些海量光谱为人工处理带来了极大挑战。鉴于此,研究人员开始关注数据挖掘算法,并尝试对这些光谱进行数据挖掘。近年来,神经网络、自组织映射、关联规则等数据挖掘方法广泛应用于恒星光谱分类。在这些方法中,支持向量机(SVM)以其强大的学习能力和高效的分类性能而备受推崇。SVM的基本思想是试图在两类样本之间找到一个最优分类面将两类分开。SVM在求解时,通过将其最优化问题转化为具有(QP)形式的凸问题,进而得到全局最优解。尽管该方法在实际应用中表现优良,但为了进一步提高其分类能力,有的学者提出双支持向量机(TSVM)。该方法通过构造两个非平行的分类面将两类分开,每一类靠近某个分类面,而远离另一个分类面。TSVM的计算效率较之传统SVM提高近4倍,因此,自TSVM提出后便受到研究人员的持续关注,并出现若干改进算法。在恒星光谱分类中,一般分类算法都是根据历史观测光谱来建立分类模型,其中最关键的是对光谱进行人工标注,这项工作极为繁琐,且容易犯错。如何利用已标记的光谱以及部分无标签的光谱来建立分类模型显得尤为重要。因此,提出带无标签数据的双支持向量机(TSVMUD)用以实现对恒星光谱智能分类的目的。该方法首先将光谱分为训练数据集和测试数据集两部分;然后,在训练集上进行学习,得到分类依据;最后利用分类依据对测试集上的光谱进行验证。继承了双支持向量机的优势,更重要的是,在训练集上学习分类模型过程中,不仅考虑有标记的训练样本,也考虑部分未标记的样本。一方面提高了学习效率,另一方面得到更优的分类模型。在SDSS DR8恒星光谱数据集上的比较实验表明,与支持向量机SVM、双支持向量机TSVM以及K近邻(KNN)等传统分类方法相比,带无标签数据的双支持向量机TSVMUD具有更优的分类能力。然而,该方法亦存在一定的局限性,其中一大难题是其无法处理海量光谱数据。该工作将借鉴海量数据随机采样思想,利用大数据处理技术,来对所提方法在大数据环境下的适应性展开进一步研究。

论文目录

  • 引 言
  • 1 双支持向量机
  • 2 带无标签数据的双支持向量机
  •   2.1 最优化问题
  •   2.2 算法描述
  • 3 实验分析
  • 4 结 论
  • 文章来源

    类型: 期刊论文

    作者: 刘忠宝,雷宇飞,宋文爱,张静,王杰,屠良平

    关键词: 恒星光谱,智能分类,双支持向量机,无标签数据

    来源: 光谱学与光谱分析 2019年03期

    年度: 2019

    分类: 基础科学,信息科技

    专业: 天文学,自动化技术

    单位: 泉州信息工程学院软件学院,中北大学软件学院,中国科学院新疆天文台,辽宁科技大学理学院

    基金: 国家自然科学基金项目(U1731128,11803080),山西省自然科学基金项目(201601D011042),山西省高等学校创新人才支持计划项目(2016),中北大学杰出青年基金支持计划项目(2017)资助

    分类号: P152;TP181

    页码: 948-952

    总页数: 5

    文件大小: 146K

    下载量: 126

    相关论文文献

    • [1].基于熵学习机的恒星光谱分类(英文)[J]. 光谱学与光谱分析 2018(02)
    • [2].基于卷积神经网络的恒星光谱自动分类方法[J]. 光谱学与光谱分析 2019(04)
    • [3].一种基于卷积神经网络的恒星光谱快速分类法[J]. 光谱学与光谱分析 2019(10)
    • [4].低信噪比巡天数据中特殊恒星光谱的搜寻方法[J]. 光谱学与光谱分析 2019(02)
    • [5].一种恒星光谱分类规则后处理方法[J]. 光谱学与光谱分析 2013(01)
    • [6].A型恒星光谱线指数岭回归有效温度的预测分析[J]. 光谱学与光谱分析 2019(08)
    • [7].基于非参数回归与最近邻方法的恒星光谱自动分类[J]. 光谱学与光谱分析 2009(12)
    • [8].利用融合数据分布特征的模糊双支持向量机对恒星光谱分类[J]. 光谱学与光谱分析 2019(04)
    • [9].R语言应用于LAMOST光谱分析初探[J]. 天文研究与技术 2017(03)
    • [10].基于多类支持向量机的恒星光谱分类方法[J]. 光谱学与光谱分析 2018(07)
    • [11].基于短时傅立叶变换特征提取和卷积神经网络的LAMOST恒星光谱分类研究[J]. 云南民族大学学报(自然科学版) 2020(05)
    • [12].基于深度信念网络的LAMOST恒星光谱分类研究[J]. 大理大学学报 2019(06)
    • [13].一种基于Map/Reduce分布式计算的恒星光谱分类方法[J]. 光谱学与光谱分析 2016(08)
    • [14].自动识别发射线恒星光谱的新方法[J]. 光谱学与光谱分析 2012(06)
    • [15].早M型矮恒星光谱聚类方法与分析[J]. 光谱学与光谱分析 2017(12)
    • [16].低分辨率恒星光谱的[α/Fe]估计方法研究[J]. 天文学报 2018(04)
    • [17].基于样条函数的恒星光谱自动归一化方法[J]. 天文研究与技术 2019(03)
    • [18].基于XGBOOST的恒星光谱分类特征数值化[J]. 光谱学与光谱分析 2019(10)
    • [19].基于谱线特征匹配的恒星光谱自动识别方法[J]. 光谱学与光谱分析 2008(06)
    • [20].流形判别分析和支持向量机的恒星光谱数据自动分类方法[J]. 光谱学与光谱分析 2014(01)
    • [21].多任务Lasso回归法在恒星光谱物理参量估计中的应用[J]. 天文学报 2015(01)
    • [22].数字[J]. 发明与创新(大科技) 2014(03)
    • [23].基于Haar小波特征的恒星光谱物理参量自动估计[J]. 光谱学与光谱分析 2012(09)
    • [24].基于深度学习的恒星光谱分类[J]. 北京师范大学学报(自然科学版) 2020(01)
    • [25].一种基于约束概念格的恒星光谱数据自动分类方法[J]. 光谱学与光谱分析 2010(02)
    • [26].天文学里程碑上的女性光辉[J]. 世界科学 2017(03)
    • [27].基于t-SNE的恒星光谱降维与分类研究[J]. 光谱学与光谱分析 2020(09)
    • [28].基于分形编码的M型恒星光谱次型自动识别[J]. 光谱学与光谱分析 2013(08)
    • [29].一种基于集合运算的分类规则处理方法[J]. 太原科技大学学报 2011(02)
    • [30].数字[J]. 中学生天地(B版) 2016(02)

    标签:;  ;  ;  ;  

    利用带无标签数据的双支持向量机对恒星光谱分类
    下载Doc文档

    猜你喜欢