基于观测数据的线性结构因果模型估计

基于观测数据的线性结构因果模型估计

论文摘要

如今,人们在科学、娱乐、商业和工业各领域收集和挖掘大量数据,并对其进行研究和应用.就像Rutherford D.Rogerd等人所讲:“这个世界淹没在了数据中,我们淹没在了信息的海洋里,却渴求着知识”.海量信息亟待整理,取其精华去其糟粕.人们渴求仅用较少参数恢复一组数据的基础信息,实现挖掘数据隐含的因果机制.近年来,人们提出了从非实验数据中发现因果结构的一些方法.这些方法对数据生成过程进行了各种假设,以便纯粹从观测数据中估计因果关系.本文以提高大数据背景下连续变量的因果推断能力作为研究目标,并且从客观地估计因果顺序、估计隐变量、构建因果模型新框架、提出非线性因果结构等四方面展开研究.本文基于观测数据的因果关系学习,为该研究领域中正确学习因果结构和估计因果效应提供了有效补充.主要内容和创新点如下:1.路径分析作为描述变量之间因果依赖关系的主要方法,被广大研究者采用.针对路径分析采用人为给定因果排序的缺陷,以及“几乎没有一种方法能研究和推断所有因果关系”的观点,本文提出了一个集成的因果路径识别方法.首先,对清洗之后的原始数据本文采用一个直接的线性非高斯无环模型(DirectLiNGAM)方法客观估计变量之间的因果顺序和初始连接强度矩阵.针对初始连接强度矩阵不便于模型解释的现象,本文采用线性模型选择方法中的Adaptive lasso削减冗余有向边,重新获得连接强度矩阵.根据消减后的连接强度矩阵,递归模型和因果路径图分别被建立和绘制.通过对因果路径图检验,找到了未通过模型拟合度检验的有向边和变量,经过改变方向、删除变量等方法,获得了拟合度高于前者的因果模型和因果路径图,并且估计了变量之间的直接、间接效应和总效应.2.在上面路径分析中因果路径识别方法的基础上,本文接着研究了隐变量存在情况下,隐变量与观测变量、观测变量与观测变量之间的因果推断问题.文章基于探索性因子分析(EFA)理论和路径分析(PA)思想,提出一个用EFA-PA建立隐变量与观测变量、观测变量与观测变量之间的线性结构因果模型框架的方法.EFA-PA方法与结构方程模型(SEM)建立线性因果模型的思想接近,但是与结构方程模型相比具有3个优点:一是基于主成分分析方法的EFA清晰地识别了隐变量并估计了隐变量的个数,易于建立测量模型(即隐变量与观测变量之间的线性结构因果模型);二是基于PA方法估计了观测变量之间的线性结构因果模型,弥补了SEM没有充分挖掘观测变量之间因果关系的空缺;三是减少了SEM在拟合度不高时调整因果路径的盲目性.进一步,针对现实中观测变量之间的因果关系不完全都是线性模型的现象,本文释放EFA-PA中观测变量之间线性因果结构的限定,提出了观测变量之间关系为非线性(包括线性)时的因果模型,即广义非线性可加因果模型(GNACM),并给出了GNACM的定义、估计方法及优点.3.针对传统SEM在大数据与统计机器学习背景下的三方面缺陷,文章提出了一个扩展的SEM方法,即ESEM.ESEM框架由三类模型构成:(1)结构模型(隐变量之间的线性结构因果模型);(2)测量模型(隐变量与观测变量之间的线性结构因果模型);(3)观测模型(观测变量之间的线性结构因果模型).ESEM的优点在于补充了隐变量因果方向的识别、添加了观测变量因果关系估计、充分挖掘了观测变量所隐含的科学信息.最后本文通过在实验中利用多种拟合指标对ESEM模型进行检验、调试,获得拟合度较好的ESEM模型,并得到在观测数据服从高斯分布,干扰变量服从非高斯分布时该方法的普适性.

论文目录

  • 摘要
  • ABSTRACT
  • 符号对照表
  • 缩略语对照表
  • 第一章 绪论
  •   1.1 研究背景和意义
  •   1.2 线性结构因果模型的研究现状
  •   1.3 本文的主要工作和结构安排
  • 第二章 线性结构因果模型基本概念和典型模型
  •   2.1 线性结构因果模型的相关概念
  •   2.2 因果关系与贝叶斯网络
  •   2.3 线性结构因果模型
  •   2.4 结构方程模型
  •   2.5 独立分量分析
  •   2.6 线性非高斯无环模型(LiNGAM)
  •   2.7 因子分析模型
  •   2.8 ICA-LiNGAM模型
  •     2.8.1 ICA-LiNGAM介绍
  •     2.8.2 LiNGAM估计算法
  •     2.8.3 LiNGAM算法中确定排列的有效算法
  •     2.8.4 ICA-LiNGAM的潜在问题
  •   2.9 Direct LiNGAM估计方法
  •     2.9.1 Direct LiNGAM提出背景
  •     2.9.2 基于非高斯性和独立性的外生变量识别
  •     2.9.3 Direct LiNGAM算法
  •   2.10 本章小结
  • 第三章 模型评估与选择
  •   3.1 模型评估方法
  •     3.1.1 k折交叉验证法
  •     3.1.2 AIC、BCC准则
  • 2'>    3.1.3 调整的R2
  •   3.2 线性模型选择
  •     3.2.1 岭回归
  •     3.2.2 Lasso回归
  •     3.2.3 Adaptive lasso回归
  •   3.3 本章小结
  • 第四章 路径分析中因果路径识别的集成方法
  •   4.1 研究背景与意义
  •   4.2 路径分析的基本概念与理论
  •     4.2.1 路径分析的标准模型
  •     4.2.2 路径模型
  •     4.2.3 递归路径模型的效应分解
  •     4.2.4 路径模型的应用举例
  •   4.3 因果路径识别的理论基础
  •   4.4 实验测试与结果分析
  •   4.5 本章小结
  • 第五章 隐变量存在下的线性因果关系估计
  •   5.1 研究背景及意义
  •   5.2 一个基于EFA-PA的估计因果关系方法
  •     5.2.1 EFA对隐变量的识别
  •     5.2.2 测量模型估计
  •   5.3 基于路径分析的观测变量因果关系估计
  •   5.4 EFA-PA思想在现实数据上的应用
  •   5.5 EFA-PA模型的有效性验证
  •   5.6 广义非线性可加因果模型学习
  •     5.6.1 非线性因果模型定义
  •     5.6.2 非线性因果模型估计
  •     5.6.3 广义非线性可加因果模型定义
  •     5.6.4 GNACM的拟合方法及优点
  •   5.7 本章小结
  • 第六章 扩展的结构方程模型
  •   6.1 研究背景及意义
  •   6.2 ESEM的思想
  •     6.2.1 观测模型定义
  •     6.2.2 ESEM中的DirectLiNGAM算法
  •   6.3 ESEM实验测试
  •     6.3.1 估计隐变量
  •     6.3.2 ESEM估计
  •   6.4 本章小结
  • 第七章 展望
  • 参考文献
  • 致谢
  • 作者简介
  • 文章来源

    类型: 博士论文

    作者: 费妮娜

    导师: 杨有龙

    关键词: 观测数据,线性结构因果模型,隐变量,因果路径识别,广义非线性可加因果模型

    来源: 西安电子科技大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 西安电子科技大学

    分类号: O212.1

    DOI: 10.27389/d.cnki.gxadu.2019.000076

    总页数: 110

    文件大小: 2249K

    下载量: 161

    相关论文文献

    • [1].动态因果模型的研究综述[J]. 电脑开发与应用 2013(07)
    • [2].基于动态因果模型对颞叶癫痫活动传播的初步研究[J]. 生物物理学报 2009(02)
    • [3].基于因果模型的耗能机电产品性能匹配方法研究[J]. 机电产品开发与创新 2019(02)
    • [4].药物临床应用风险因果模型的构建与探讨[J]. 中国药物警戒 2013(09)
    • [5].动态因果模型及其参数估计理论在脑功能成像中的应用[J]. 中国组织工程研究与临床康复 2008(30)
    • [6].运用动态因果模型探究精神分裂症异常有效连接[J]. 中国临床心理学杂志 2014(06)
    • [7].基于fMRI数据的Granger因果模型的定阶探讨[J]. 周口师范学院学报 2017(05)
    • [8].动态因果模型的基本原理及其在脑功能磁共振成像中的应用[J]. 中国医学影像技术 2009(01)
    • [9].因果模型视角下的文学经典翻译——以《三国演义》虞苏美译本为例[J]. 湖北第二师范学院学报 2018(03)
    • [10].人脑默认网络方向图:基于7TfMRI的动态因果模型[J]. 生物化学与生物物理进展 2018(05)
    • [11].海堤渗压监测因果模型基本结构和因子选择[J]. 上海交通大学学报 2008(11)
    • [12].因果模型与传递性[J]. 自然辩证法通讯 2020(08)
    • [13].基于动态因果模型的运动执行和运动想象脑网络研究[J]. 电子科技大学学报 2010(03)
    • [14].基于概率因果模型的核动力系统故障诊断[J]. 科技创新导报 2015(26)
    • [15].含隐变量非高斯无环因果模型的估计算法[J]. 计算机工程 2010(09)
    • [16].工作幸福感:概念、测量水平与因果模型[J]. 心理科学进展 2015(04)
    • [17].概率因果模型结合改进遗传算法的核动力系统故障分析[J]. 数学的实践与认识 2014(07)
    • [18].免疫遗传法结合概率因果模型诊断变压器故障[J]. 高电压技术 2008(11)
    • [19].基于动态因果模型研究盐酸哌甲酯对大脑默认网络效应连接的调制作用[J]. 生理学报 2016(03)
    • [20].应用动态因果模型研究阅读神经网络背、腹侧通路的协作机制[J]. 心理科学进展 2015(05)
    • [21].创业决策形成的微观机制:因果模型检验[J]. 科学学研究 2009(03)
    • [22].小儿和成人复发缓解型多发性硬化症发病时运动网状系统功能和结构的连接性[J]. 国际医学放射学杂志 2010(02)
    • [23].组织定向的人因失误因果模型及影响关系研究[J]. 中国安全科学学报 2010(04)
    • [24].基于因果关系归类的理论与研究方法[J]. 心理科学 2010(04)
    • [25].Gauss因果模型中因果效应识别方法的比较[J]. 数学物理学报 2008(05)
    • [26].基于动态因果模型的视觉工作记忆任务脑效应网络研究[J]. 航天医学与医学工程 2017(02)
    • [27].顾客忠诚因果模型研究[J]. 生产力研究 2008(04)
    • [28].因果模型在类比推理中的作用[J]. 心理学报 2010(08)
    • [29].非线性因果模型辨识方法[J]. 计算机应用与软件 2015(09)
    • [30].组织中的领地性研究:文献评述与研究展望[J]. 科技进步与对策 2017(24)

    标签:;  ;  ;  ;  ;  

    基于观测数据的线性结构因果模型估计
    下载Doc文档

    猜你喜欢