论文摘要
社会经济发展需要真实、准确、全面的统计数据,数据的质量是各行业发展的一面镜子,质量的高低决定了镜子的清晰程度。统计数据的质量是数据质量的核心部分,尤其是医疗行业中的统计数据关系到患者的切身利益,其质量更要得到重视。为了了解复杂的医疗费用数据的构成情况,以及寻找影响其统计数据质量的原因所在,本研究特选取具有高昂医疗费用的慢性肾病作为研究对象,通过诊断其数据成分,从而判断出影响其数据质量的问题,以达到有效诊断数据,优化数据处理,科学管理医疗数据的目的。针对实际数据没有满足既定假设,使得分析结果不可靠等问题,越来越多的统计学者通过数学模型和方法对我国的统计数据进行诊断。在此背景下,本文借助慢性肾病住院费用的数据进行合理的统计诊断。研究从疾病患者的原始数据及实际现状出发,着眼于数据质量管理控制的理论基础,对影响慢性肾病住院费用影响因素进行分析,使用自变量选择的方法对影响因素进行初步筛选,通过SAS运行得出最优子集并建立回归模型;然后,基于数据删除模型和局部影响分析的理论基础,运用SPSS判断异常点,用R软件进行数据参数估计、统计推断等环节的多维度分析;最后,以实例认证进行模型拟合优度的数据对比,并进行数据变换处理,得出提高数据质量的结论。文章的研究目的是希望通过诊断数据点对回归模型的影响,寻找提高模型优化的切入点,以透过实际数据反映的问题来探索提升数据质量的本质,为现实中高昂的慢性肾病治疗费用的统计数据管理提供政策建议。
论文目录
摘要Abstract第一章 绪论 1.1 研究背景 1.2 研究意义 1.2.1 理论意义 1.2.2 现实意义 1.3 研究现状 1.3.1 国外研究现状 1.3.2 国内研究现状 1.3.3 文献评述 1.4 研究主要内容 1.5 创新之处第二章 基本概念及相关理论 2.1 统计数据质量的基本概念 2.1.1 统计数据 2.1.2 统计数据的质量 2.2 统计数据质量的管理 2.2.1 国际上统计数据管理体系 2.2.2 统计数据质量评估框架的国际标准 2.3 异常点和影响点 2.3.1 异常点 2.3.2 影响点 2.3.3 数据删除模型 2.3.4 均值漂移模型第三章 慢性肾病医疗费用的模型建立 3.1 模型准备 3.1.1 数据来源 3.1.2 预备知识 3.2 数据预处理 3.2.1 数据转换处理 3.2.2 正态性检验 3.3 模型的构建 3.3.1 寻找最优子集 3.3.2 模型分析及检验 3.4 本章小结第四章 统计诊断 4.1 统计诊断概述 4.2 基于数据删除模型的统计诊断 4.2.1 残差统计量 4.2.2 距离统计量 4.2.3 影响统计量 4.2.4 异常点检验理论 4.3 局部影响分析 4.3.1 线性回归中的局部影响分析 4.3.2 方差扰动模型 4.3.3 自变量扰动模型 4.4 本章小结第五章 慢性肾病住院费用数据质量的实例分析 5.1 慢性肾病住院费用的统计数据质量 5.2 总体影响分析 5.2.1 数据删除模型的实证分析 5.2.2 诊断结果分析 5.2.3 逐步影响回归分析 5.3 局部影响分析 5.3.1 影响点的检测方法 5.3.2 方差扰动下的局部影响分析 5.3.3 自变量扰动下的局部影响分析 5.4 数据变化 5.5 本章小结第六章 结论与展望 6.1 结论 6.2 对策建议 6.3 局限性及展望致谢参考文献附录A附录B攻读硕士期间发表论文
文章来源
类型: 硕士论文
作者: 董梦雨
导师: 张彪
关键词: 数据质量,统计诊断,慢性肾病数据,实证研究
来源: 昆明理工大学
年度: 2019
分类: 基础科学,社会科学Ⅱ辑
专业: 数学,社会学及统计学
单位: 昆明理工大学
分类号: C8
DOI: 10.27200/d.cnki.gkmlu.2019.000653
总页数: 75
文件大小: 2721K
下载量: 16
相关论文文献
标签:数据质量论文; 统计诊断论文; 慢性肾病数据论文; 实证研究论文;
数据质量的统计诊断实证研究 ——以慢性肾病住院费用数据为例
下载Doc文档