论文摘要
图模型是一个与图相关联的统计模型,可以清晰地表示变量之间的条件依赖关系,被广泛应用于机器学习、心理学、生物学和医学等各个领域。在这些应用问题中,图模型的模型选择问题是一个非常重要且具有挑战性的问题。对于高维数据,目前主流的方法是惩罚似然的方法,但该方法依赖于惩罚参数的选取。特别是对于含有缺失数据的高维数据,图模型的模型选择问题更加困难。例如,利用EM算法与惩罚似然集合的方法,往往很难保证算法收敛到全局最大值。本文中,我们将结合稳定性选择和多重插补的方法,考虑数据缺失时高斯图模型的模型选择问题。我们的方法有以下两个特点:第一,通过多重插补来处理缺失值,对稳定性选择进行了扩展;第二,将自助法与多重插补结合起来,可以实现对数据更加强烈的扰动,获得更准确的结果。本文提出了两种实施策略,第一种是先重抽样得到B个自助样本集,然后对B个自助样本集进行多重插补,最后利用稳定性选择得到高斯图模型的估计;第二种是先对原始样本集进行多重插补,然后再对插补数据集重抽样得到自助样本集,最后利用稳定性选择得到高斯图模型的估计。第一种策略称之为GBISS,第二种策略称之为GIBSS。在插补过程中,我们考虑基于mice软件包和miceFast软件包进行实现。本文编写了R语言代码,针对4个模型进行了模拟,考虑了多重插补次数M、调整参数λ的个数n.lambda和门限参数πthr等参数对方法的影响。并与主流的MissGlasso方法,GEMS方法进行比较。模拟结果显示:我们方法得出的mcc值大部分要高于MissGlasso方法得出的mcc值,只有极小的一部分mcc值比MissGlasso方法的mcc值小;同样的,根据mcc值判断,我们方法的结果大部分也优于GEMS方法的结果。同时,我们还将我们的方法应用到类异戊二烯(isoprenoid)基因数据中进行高斯图模型选择。
论文目录
文章来源
类型: 硕士论文
作者: 秦铭
导师: 兰民
关键词: 斯图模型自助法,缺失数据,稳定性选择
来源: 长春工业大学
年度: 2019
分类: 基础科学
专业: 数学,数学
单位: 长春工业大学
分类号: O157.5;O212
总页数: 83
文件大小: 4814K
下载量: 48
相关论文文献
- [1].分类中模型选择方法的改进[J]. 统计与决策 2020(11)
- [2].模型本无过 思想来引路[J]. 中学数学杂志 2017(06)
- [3].模型选择准则在洪水频率分析中的应用[J]. 水利学报 2010(01)
- [4].方差正则化的分类模型选择准则[J]. 计算机科学与探索 2019(03)
- [5].生态风险评价方法学研究进展与评价模型选择[J]. 城市环境与城市生态 2015(01)
- [6].一种软件可靠性增长模型选择与综合方法[J]. 计算机科学 2009(09)
- [7].RS为工程师改进其3D CAD模型选择工具[J]. 微型机与应用 2013(02)
- [8].基于均衡7×2交叉验证的模型选择方法[J]. 太原师范学院学报(自然科学版) 2013(01)
- [9].零膨胀计数资料模型选择与比较[J]. 中国卫生统计 2011(04)
- [10].基于交叉验证的模型选择中投票和平均方法的对照[J]. 数学的实践与认识 2019(09)
- [11].SAS软件在6种溶出模型选择中的应用[J]. 中医研究 2012(04)
- [12].二元非结构肥效模型构建及其田间试验验证[J]. 土壤学报 2019(04)
- [13].基于最优权重联合模型的滑坡位移预测研究[J]. 灾害学 2018(01)
- [14].不同模拟穿刺模型在超声引导穿刺技术教学中的比较研究[J]. 临床超声医学杂志 2019(07)
- [15].带有有序变量的结构方程模型中的模型选择[J]. 统计与决策 2011(14)
- [16].科技创新企业估值模型选择研究——以工业富联为例[J]. 现代金融导刊 2020(03)
- [17].交叉验证在数据建模模型选择中的应用[J]. 商业经济 2011(10)
- [18].基于贝叶斯理论的土水特征曲线模型选择与参数识别方法[J]. 应用基础与工程科学学报 2019(06)
- [19].浅析金融证券市场的最优投资及模型选择[J]. 产业创新研究 2019(11)
- [20].基于磨损公式的磨损模型适用性研究[J]. 中国农村水利水电 2019(04)
- [21].基于跨项目缺陷预测的模型选择研究[J]. 计算机产品与流通 2018(10)
- [22].基于决策支持的交通分析模型选择与应用[J]. 公路交通技术 2014(02)
- [23].有限变形下橡胶材料非线性高弹-粘弹性本构模型[J]. 橡胶工业 2017(11)
- [24].基于CMA-ES算法的支持向量机模型选择[J]. 计算机仿真 2010(04)
- [25].基于多段落排序的机器阅读理解研究[J]. 北京化工大学学报(自然科学版) 2019(03)
- [26].降脂模型研究进展[J]. 中国比较医学杂志 2020(04)
- [27].非酒精性脂肪性肝病实验模型[J]. 中国药学杂志 2019(18)
- [28].非线性GARCH族的模型平均估计方法[J]. 统计研究 2018(05)
- [29].模型选择和假设导致的臭氧相关性气候变化健康效应的变异[J]. 环境与职业医学 2013(02)
- [30].网络结构数据空间回归模型的平均估计[J]. 系统科学与数学 2018(06)