基于随机缺失函数型非参数/半参数模型的k近邻估计

基于随机缺失函数型非参数/半参数模型的k近邻估计

论文摘要

现代科学技术的发展为海量数据的收集及存储提供了技术支持,函数型数据分析(Functional data analysis,FDA)方法则作为一种专门基于高维数据的函数特性进行分析的方法,已经在环境科学、化学、生物学、经济学、水文等领域得到了广泛的应用,是统计学界近几十年的一个热门研究方向。函数型非参数回归模型以及半函数型部分线性回归模型是近年研究函数型数据统计推断的常见模型,其中,半函数型部分线性回归模型作为一种特殊的半参数模型,主要是在非参数回归模型的基础上结合了易于解释的参数部分,从而增加了模型的适应能力以及预测能力。k近邻(k-Nearest Neighbor,kNN)方法也是在函数型数据分析中的有力工具,通过离散参数k代替核回归估计中的连续参数h来选取局部自适应性窗宽,将大大提高模型的计算速度。而由于客观及主观等各种因素,数据缺失的情况广泛存在于各个领域中,如何处理实际数据中的缺失情况对于统计方法在现实领域的应用方面有很大的影响。随机缺失数据在有限维场合下已被广泛研究,但在函数型场合下还未得到较多发展,如何将kNN估计结合函数型非参数/半参数模型在响应变量存在随机缺失的情形下得到较好的结果并应用到实际场景中是一个巨大的挑战。本学位论文主要基于响应变量随机缺失的函数型非参数/半参数模型,构造了相应的kNN估计量并理论证明了估计量的渐近性质,模拟实验及真实数据分析也进一步验证了估计量良好的预测效果。主要研究内容分为以下两部分:(一)基于随机缺失函数型非参数模型的k近邻估计在响应变量随机缺失的情况下,通过kNN回归估计得到了解释变量为函数型数据的非参数回归算子的估计量,并理论证明了该估计量的渐近性质;其次通过不同样本量的模拟曲线验证了数据量以及样本量缺失率对于预测结果的影响,并展示了kNN估计相较于核回归估计的优势;最后,通过温度曲线对北京市PM2.5含量的预测分析结果检验了模型的可行性以及预测能力,阐明了用kNN方法构造估计量的实际意义。(二)基于随机缺失半函数型部分线性回归模型的k近邻估计半函数型部分线性回归模型实际上是对非参数模型的一个延伸,第四章主要工作是进一步在响应变量随机缺失的情况下,构造了半函数型部分线性回归模型中线性算子以及非参数回归算子的kNN估计量,详细梳理参数向量β估计量的渐近性质及非参数回归算子m(?)估计量的一致收敛速度两部分的证明过程后,又通过模拟实验进一步验证了样本量以及样本缺失率对于预测结果的影响,并通过与非参数模型下得到的预测结果进行对比,展示了半函数型部分线性回归模型良好的预测效果。

论文目录

  • 致谢
  • 摘要
  • abstract
  • 第一章 绪论
  •   1.1 函数型数据分析的背景及现状
  •   1.2 本文研究动机及结构安排
  • 第二章 预备知识
  •   2.1 随机变量的几种收敛
  •   2.2 相关定理
  •   2.3 相关不等式
  • 第三章 基于随机缺失函数型非参数模型的k近邻估计
  •   3.1 引言
  •   3.2 估计量的构造及主要结论
  •     3.2.1 模型及估计
  •     3.2.2 假设条件及符号标记
  •   3.3 渐近性质
  •     3.3.1 主要结论
  •     3.3.2 关于假设和结论的评注
  •   3.4 模拟研究
  •   3.5 真实数据分析
  •   3.6 引理及定理证明
  • 第四章 基于随机缺失半函数型部分线性模型的k近邻估计
  •   4.1 引言
  •   4.2 估计量的构造及主要结论
  •     4.2.1 模型及估计
  •     4.2.2 假设条件及符号标记
  •   4.3 渐近性质
  •     4.3.1 主要结论
  •     4.3.2 关于假设和结论的评注
  •   4.4 模拟研究
  •   4.5 引理及定理证明
  • 第五章 结束语
  •   5.1 论文总结
  •   5.2 研究展望
  • 参考文献
  • 攻读硕士期间的学术活动及成果
  • 文章来源

    类型: 硕士论文

    作者: 程彦茹

    导师: 凌能祥

    关键词: 函数型数据分析,随机缺失,估计,一致收敛速度,半函数型部分线性回归模型

    来源: 合肥工业大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 合肥工业大学

    分类号: O212.1

    总页数: 53

    文件大小: 5844K

    下载量: 42

    相关论文文献

    • [1].单调函数型数据半参数模型的估计(英文)[J]. 应用概率统计 2017(04)
    • [2].基于半参数模型的误差理论在数据处理中的应用[J]. 测绘与空间地理信息 2019(02)
    • [3].污染数据半参数模型估计的渐近正态性[J]. 北华大学学报(自然科学版) 2009(05)
    • [4].基于半参数模型的水准网平差[J]. 城市勘测 2019(02)
    • [5].基于半参数模型的水位数据预处理方法研究[J]. 海洋测绘 2018(02)
    • [6].加权半参数模型及其应用效果分析[J]. 大地测量与地球动力学 2014(02)
    • [7].核实数据下误差在反映变量的非线性半参数模型的降维估计[J]. 应用数学 2014(04)
    • [8].不同规模企业间创新绩效影响因素比较研究——基于面板数据半参数模型[J]. 科学学与科学技术管理 2015(02)
    • [9].半参数模型与最小二乘配置模型的比较[J]. 测绘与空间地理信息 2010(05)
    • [10].半参数模型平均估计的渐近理论[J]. 中国科学:数学 2018(08)
    • [11].半参数模型的小波估计及其在变形分析中的应用[J]. 测绘科学 2010(05)
    • [12].半参数模型中两步估计与最小二乘估计的比较[J]. 统计与决策 2008(04)
    • [13].基于半参数模型的风险度量方法及其应用[J]. 统计与决策 2019(05)
    • [14].基于随机前沿半参数模型的基金投资效率评价研究[J]. 中国会计评论 2017(01)
    • [15].基于非线性半参数模型的城市群似大地水准面系统误差研究[J]. 现代测绘 2013(01)
    • [16].基于非线性半参数模型的似大地水准面系统误差研究[J]. 科技广场 2013(03)
    • [17].半参数模型对我国白银期货风险价值的估计[J]. 营销界 2019(22)
    • [18].误差为线性过程时半参数模型的估计[J]. 纯粹数学与应用数学 2010(01)
    • [19].半参数模型估计的正则核方法[J]. 测绘科学技术学报 2008(04)
    • [20].时空变系数半参数模型的轮廓最小二乘估计[J]. 哈尔滨师范大学自然科学学报 2018(05)
    • [21].基于偏最小二乘回归的半参数模型在大坝安全监测系统中的应用研究[J]. 工程勘察 2012(05)
    • [22].单参数指数模型在医药数据分析中的应用研究[J]. 中国卫生统计 2011(04)
    • [23].基于半参数模型的Kuznets“倒U假说”再检验[J]. 统计与信息论坛 2010(08)
    • [24].带有Berkson测量误差的非线性半参数模型的渐近性质[J]. 北京工业大学学报 2009(11)
    • [25].一种Partial EIV半参数模型的系统误差处理方法[J]. 测绘学报 2018(01)
    • [26].半参数二阶段估计参数的渐近正态性[J]. 湖北师范学院学报(自然科学版) 2016(01)
    • [27].金融发展促进了经济增长吗?——基于半参数模型的分析[J]. 南京师大学报(社会科学版) 2014(02)
    • [28].半参数模型处理多波束测深数据系统误差关键问题的研究[J]. 中国水运(下半月) 2013(06)
    • [29].基于半参数估计的非随机缺失样本分类[J]. 统计与决策 2018(08)
    • [30].半参数模型处理系统误差的可行性分析[J]. 水利与建筑工程学报 2013(06)

    标签:;  ;  ;  ;  ;  

    基于随机缺失函数型非参数/半参数模型的k近邻估计
    下载Doc文档

    猜你喜欢