医保大数据资金预测模型的研究与实现

医保大数据资金预测模型的研究与实现

论文摘要

随着医院费用的快速增长,国内很多地区的医保基金出现了财政赤字。为了保证医保基金的安全性和可持续性发展,2012年,人社部出台了《关于开展基本医疗保险付费总额控制的意见》,要求医保机构依据总额控制政策给定点医院设置定额,控制其医疗费用的不合理增长。因此,医院作为医保基金的主要消费者,医保机构需要考虑其基金收入和医院消费能力来分配可用基金。但是,医疗保险机构现有的分配方式缺乏科学依据,分配往往是基于固定增长率,这很可能导致分配不合理和资源浪费。以统计学的角度,医院费用预测可以看作是多元时间序列分析问题。但是,外部因素的加入可能会削弱模型对时间序列自身趋势的模拟。在多元时间序列中,如何加强模型对目标序列模拟成为需要研究和解决的问题。在数据存在不确定性或系统不稳定的情况下,点预测会受到其不良解释的影响。人们往往都是通过预测区间或置信区间来描述真实值的取值范围,量化这种不确定性。通过描述医院费用的取值范围可以更加精确的设置医保基金分配方案。然而,医保业务人员在做决策时,不仅要考虑定点医院的消费能力,还要考虑医保的收入,以“以收定支”的原则将可用基金分配给各个医院,所以只是准确预测医院费用是远远不够的。同时,研究结果最终是面向用户的,如何将研究结果快速且有效地展示给指定用户,设计并实现一个系统是最佳选择。本文针对以上各种问题进行了深入的研究:1.提出一种基于多元时间序列的医院费用预测模型。首先以灰色关联分析法选择重要特征作为基础特征集。然后提出一种时间序列相似性快速搜索算法(SFS),算法能够快速的搜索到历史相似序列,再从相似序列中提取出新的特征。将新的特征加入基础特征集组成更丰富的特征集,最后在基础特征集和新特征集基础上分别使用三种不同时间粒度统计多元时间序列,同时分别应用SARIMAX和LSTM对六种序列进行实验论证,选择最合适的特征集、时间粒度和预测算法。2.提出一个基于集成学习的时间序列预测区间回归模型(PIBS)。通过预测医院费用的区间量化其不确定性,主要应用线性回归、SVR和LSTM等模型作为Stacking的初级学习器和次级学习器。首先本文提出了一个季节性历史区间构建方法,该方法将序列周期内和周期外的不确定性结合并构建历史区间。然后在CWC准则的基础上提出一种区间的综合评价准则(CWCR),并且构建回归模型的特征集。最后应用综合评价准则改进回归模型的损失函数,同时使用Stacking综合多个回归模型的预测结果。3.提出一种医保基金优化分配模型。如何合理的分配医保基金是模型的主要目标,首先根据前两个模型的预测结果,在医院的消费能力和医院费用可能取值的范围的基础上,量化定额与医院费用之间差异作为损失函数。再根据医保业务人员可能要考虑到的情况设置不同的约束条件,求各医院的定额与其实际医院费用差异最小的定额组合。同时,根据医院之间可能还存在的治疗效率的差异,通过优化现有的患者分布优化医保和医院的资源分配,求出患者分布的变化与医保支出之间的关联关系。4.设计并实现了一个医保大数据资金预测平台的原型。本文从医保和医院的业务需求出发,设计并实现了一个医保大数据资金预测平台,将研究过程中的统计信息和研究结果通过平台展示给医保相关人员和医院相关人员。通过上述的研究,本文实现了对医院费用的准确预测,且通过预测区间评价预测值。在医院费用准确预测的基础上,考虑医保支出等其他情况求出医保基金最优分配方案:同时设计并实现了一个医保大数据资金预测平台展示预测结果和分配方案,为相关业务人员提供辅助决策支撑。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  •   1.1 选题背景及意义
  •   1.2 研究内容和主要工作
  •   1.3 本文的组织结构
  • 第2章 相关研究
  •   2.1 引言
  •   2.2 时间序列预测方法
  •     2.2.1 一元时间序列预测方法
  •     2.2.2 多元时间序列预测方法
  •     2.2.3 时间序列相似性搜索
  •   2.3 区间预测
  •   2.4 预算分配
  •   2.5 本章小结
  • 第3章 基于多元时间序列的医院费用预测模型
  •   3.1 引言
  •   3.2 医院费用预测模型
  •   3.3 特征工程
  •     3.3.1 基础特征
  •     3.3.2 特征提取
  •   3.4 模型介绍
  •     3.4.1 SARIMAX
  •     3.4.2 LSTM
  •   3.5 实验评估
  •     3.5.1 实验介绍和参数设置
  •     3.5.2 数据描述和性能度量
  •     3.5.3 结果分析
  •   3.6 本章小结
  • 第4章 基于集成学习的时间序列预测区间回归模型
  •   4.1 引言
  •   4.2 问题描述和算法介绍
  •     4.2.1 问题定义
  •     4.2.2 简单线性回归
  •     4.2.3 支持向量机回归
  •   4.3 模型框架
  •     4.3.1 区间构建
  •     4.3.2 特征工程
  •     4.3.3 区间生成
  •   4.4 实验评估
  •     4.4.1 实验介绍和参数设置
  •     4.4.2 数据描述和性能度量
  •     4.4.3 结果分析
  •   4.5 本章小结
  • 第5章 医保基金优化分配模型
  •   5.1 引言
  •   5.2 问题描述
  •     5.2.1 二维矩形条带装箱问题
  •     5.2.2 问题形式化
  •   5.3 医保基金分配算法
  •   5.4 医院资源优化算法
  •     5.4.1 医院患者总量预测
  •     5.4.2 优化资源
  •   5.5 实验评估
  •     5.5.1 实验数据
  •     5.5.2 结果分析
  •   5.6 本章小结
  • 第6章 医保大数据资金预测平台的设计与实现
  •   6.1 引言
  •   6.2 需求分析
  •   6.3 系统设计
  •     6.3.1 系统架构设计
  •     6.3.2 系统功能模块设计
  •     6.3.3 数据库设计
  •   6.4 系统实现
  •     6.4.1 系统开发环境
  •     6.4.2 身份验证模块
  •     6.4.3 用户注册模块
  •     6.4.4 医保模块
  •     6.4.5 医院模块
  •   6.5 系统测试
  •     6.5.1 系统登录测试
  •     6.5.2 医保模块测试
  •     6.5.3 医院模块测试
  •   6.6 本章小结
  • 第7章 总结与展望
  •   7.1 总结
  •   7.2 展望
  • 参考文献
  • 致谢
  • 硕士期间主要学术成果
  • 硕士期间参与科研项目
  • 学位论文评阅及答辩情况表
  • 文章来源

    类型: 硕士论文

    作者: 李净

    导师: 史玉良

    关键词: 医保基金,多元时间序列,相似性搜索,区间预测,预算分配

    来源: 山东大学

    年度: 2019

    分类: 基础科学,医药卫生科技,信息科技

    专业: 数学,医药卫生方针政策与法律法规研究,计算机软件及计算机应用

    单位: 山东大学

    分类号: TP311.13;O212.1;R197.1

    总页数: 98

    文件大小: 7271K

    下载量: 213

    相关论文文献

    • [1].基于非稳态时间序列的生理控制模型研究[J]. 系统工程理论与实践 2020(02)
    • [2].基于多样化top-k shapelets转换的时间序列分类方法[J]. 计算机应用 2017(02)
    • [3].时间序列趋势预测[J]. 现代计算机(专业版) 2017(02)
    • [4].基于分型转折点的证券时间序列分段表示法[J]. 商 2016(31)
    • [5].基于ARMA模型的股价预测及实证研究[J]. 智富时代 2017(02)
    • [6].《漫长的告别》(年度资助摄影图书)[J]. 中国摄影 2017(04)
    • [7].王嵬作品[J]. 当代油画 2017(07)
    • [8].基于模糊时间序列的计算机信息粒构建研究[J]. 粘接 2020(10)
    • [9].基于时间序列挖掘的合成旅装备维修保障能力预测[J]. 系统工程与电子技术 2020(04)
    • [10].风速时间序列混沌判定方法比较研究[J]. 热能动力工程 2018(07)
    • [11].土壤退化时间序列的构建及其在我国土壤退化研究中的意义[J]. 土壤 2015(06)
    • [12].基于信息颗粒和模糊聚类的时间序列分割[J]. 模糊系统与数学 2015(01)
    • [13].不确定时间序列的降维及相似性匹配[J]. 计算机科学与探索 2015(04)
    • [14].时间序列的异常点诊断方法[J]. 中国卫生统计 2011(04)
    • [15].基于独立成分分析的时间序列谱聚类方法[J]. 系统工程理论与实践 2011(10)
    • [16].面向不确定时间序列的分类方法[J]. 计算机研究与发展 2011(S3)
    • [17].一种基于频繁模式的时间序列分类框架[J]. 电子与信息学报 2010(02)
    • [18].超启发式组合时间序列预报模型[J]. 福建电脑 2020(08)
    • [19].基于深度学习的时间序列算法综述[J]. 信息技术与信息化 2019(01)
    • [20].基于时间序列符号化模式表征的有向加权复杂网络[J]. 物理学报 2017(21)
    • [21].基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用 2016(19)
    • [22].基于期货市场行为的时间序列切分及表示方法研究[J]. 中国管理信息化 2015(19)
    • [23].基于形态特征的时间序列符号聚合近似方法[J]. 模式识别与人工智能 2011(05)
    • [24].基于模糊时间序列对我国对外贸易中的进口水平的预测[J]. 统计与决策 2010(23)
    • [25].模糊变量时间序列及其应用[J]. 辽宁工程技术大学学报(自然科学版) 2010(06)
    • [26].时间序列流的分层段模型[J]. 小型微型计算机系统 2009(04)
    • [27].发动机转速时间序列分形特征分析[J]. 机械科学与技术 2008(11)
    • [28].基于HDAD的异构航空数据异常检测的研究[J]. 计算机仿真 2020(03)
    • [29].重庆藕塘滑坡地下水位时间序列混沌性判别与预测[J]. 人民长江 2020(S1)
    • [30].基于能量过滤的不确定时间序列数据清洗方法[J]. 智能计算机与应用 2019(04)

    标签:;  ;  ;  ;  ;  

    医保大数据资金预测模型的研究与实现
    下载Doc文档

    猜你喜欢