在大数据时代,数据治理已逐步成为政府进行智慧决策的重要基础,能够帮助政府在复杂的市场活动中,快速高效地处理分析海量的数据信息,针对各种情况制定切实有效的政策。基于此,本文以河北省工业和信息化厅统计监测和信息管理平台(以下简称“统计监测平台”)为探讨对象,阐述数据治理运用于其中的重要意义,集中分析如何通过数据治理,提高数据质量,并且为如何保障数据有效治理提供了一定的应对策略。
河北省工信厅统计监测和信息管理平台已经实现了省、市、县、乡、企业及机构数据一体化分平台管理,进行数据统一记录、归纳和整理,实现了数据快速、有效、高质量采集和汇总,解决了基层单位和企业多头报送、负担重的问题,为了解企业运行情况提供了有力的技术保障,进一步节约了人力和物力资源,提高了监测管理的总体效率。
伴随统计监测平台的广泛运用,对其中存在潜在的数据问题,如何正确理解这些数据?如何行之有效地对汇集的数据进行“精准治理”,提高数据质量,使数据可用、可信,提升对数据的管理和运用能力,成了日常工作中的要点、难点。
我国是农业大国,应该提高农业的信息化水平,实现农业现代化发展。农业信息化需要以人为本,发展农村经济科学,形成良性发展态势。农村经济是我国经济的主体,发展农村经济是增加农民收入、加快农村建设的重要保障,同时也是实现现代社会主义新农村建设的需要,农村经济管理科学化是社会发展对农村经济发展提出的新要求[1]。
一、统计监测平台概述
(一)统计监测平台的涵义
统计监测平台是建立在互联网和云上的综合监测管理网络平台。具体来说,是以企业自行报送为基本需求的数据采集、处理、查询、汇总的平台软件。通过互联网信息采集和处理,实现报表的定义、发布、填报、审核、汇总和查询等管理的一体化业务处理,通过控制系统功能权限,实现不同级别用户的报表需求和数据管理。该系统将信息采集、处理、分析和内容整合等多种先进科学技术用于统计监测工作,为全面掌握企业发展情况、及时反映企业运行动态、科学研判发展趋势和领导决策提供数据支撑;为加快企业转型升级、破解社会经济发展难题提供科学依据;为全省政府主管部门的工作提供全面数据和信息支撑,从而提高工作效率,不断提升服务经济发展的水平和能力。
(二)统计监测平台的特点
首先我们基于数据资产目录建立数据质量规则,定义关键数据项的质量检测规则,依据对业务的理解对不同数据项建立完整性评价、规范性评价、逻辑性评价、及时性评价、重复性评价、外建关联性、波动分析、平衡分析等不同的质量检查规则。
为能处理复杂的报表格式及采集流程,满足当代社会数据来源多样化的特点,支持多种报送方式,统计监测平台主要解决以下问题:
数据治理的目标总体来说就是提高数据质量、在降低风险的同时实现数据资产价值的最大化。由此,数据治理从本质上看就是对一个机构(政府部门或企业)的数据从收集融合到分析管理和利用进行评估、指导和监督(EDM)的过程,通过提供不断创新的数据服务为企业创造价值。
■ 对数据时效性高,管理人员应能快速编辑报表、发布报表、快速回收数据;
干旱分区的指标与分区的等级单位有密切关系。一般高等级分区如全国一级干旱分区,以反映影响干旱及其灾害的地带性自然因素为主要依据;低等级分区主要以反映非地带和社会因素的综合作用为主导指标,较常用的是以反映水利条件和农业生产状况为主的社会因素指标来进行划分。
■ 对数据的质量要求较高,应提供强大的运算和审核引擎、二次审批、数据锁定等多种质量控制措施;
■ 对工作的效率要求较高,应能由系统自动完成大部分审核、汇总、退回、导入、催报、导出等数据管理工作;
统计监测平台涉及的业务面众多,比如电子信息、中小企业、民营经济、融资担保等企业运行数据,如果缺少统一的标准进行约束,容易导致在数据计算、处理和整合的差异,从而导致不可信数据的产生。
首先针对统计平台各业务系统的数据资源进行调研,了解数据情况,梳理数据调研报告。随后根据数据调研情况,从数据标准规划、元数据管理和数据质量管理等方面着手逐步开展数据治理工作。
■ 对数据的安全性要求高,能够严格控制数据的访问权限。
统计监测平台采用报表来归纳、整理和统计数据信息,它将面向技术的数据库表以业务的形式呈现给用户,并通过业务的方式进行数据查看、操作和管理。
燃料在锅炉内燃烧产生的烟气中常伴有NOX、SOX等酸性气体和CO2等温室气体,若直接排放至大气中会造成环境污染,而在冷凝式锅炉中,由于会产生冷凝水,酸性气体和温室气体会溶于水中,从而降低了负面气体的直接排放,减弱对环境的污染。
二、数据治理的必要性
2016年4月19日,习近平总书记在网络安全和信息化工作座谈会上进一步指出:“信息是国家治理的重要依据,要发挥其在这个进程中的重要作用”;要“统筹发展电子政务,构建一体化在线服务平台,分级分类推进新型智慧城市建设,打通信息壁垒,构建全国信息资源共享体系,更好利用信息化手段感知社会态势、畅通沟通渠道、辅助科学决策”。在大数据时代,数据正在呈指数级增长,世界上的许多国家都把大数据上升到国家战略的高度,实施国家大数据战略,为政府治理的变革和创新开拓新局面。以“精准”为口号的数据治理为提升各政务部门的公共服务、市场监管、宏观调控、科学决策、资源配置等提供了契机。在这种现实的需求下,探寻统计监测平台数据治理具有十分重要的意义。
信息汇集是省工信厅重要的基础性工作。面向重点联系企业开展企业主要经济指标月度调查、年度调查、企业经济效益指标完成情况、企业产销存情况、企业出口情况的调查等,对掌握企业生产、节能、节水、环保、装备水平、研发水平等与企业生产经营、转型升级发展密切相关的指标,了解这些情况对掌握企业发展情况具有重要意义。但有许多因素会导致这些数据出现“真实性”问题,比如脏数据、错误数据、异常值数据、重复数据,数据精度不够、数据前后逻辑不对、数据标准没有统一,编码不统一、缺少相关规范、对数据理解的不充分等等。这导致我们对数据进行汇总分析和数据挖掘时,分析的结果有很大的偏差,为决策者带来了负面影响。
三、数据治理的研究
IBM对于数据治理的定义是:“数据治理是一种质量控制规程,用于在管理、使用、改进和保护组织信息的过程中添加新的严谨性和纪律性。”。
■ 数据来源的形式不统一,支撑人工填报、文件导入等多种数据采集方式,支持C/S、B/S多种应用架构体系;
数据治理的处理对象是海量的分布在各个系统中的数据,这些不同系统的数据往往存在一定的差异:数据代码标准不一样、数据格式不一样、数据标识不一样,甚至可能存在错误的数据。这就需要建立一套标准化的体系,对这些存在差异的数据统一标准,符合行业的规范,使得在同样的指标下进行分析,保证数据分析结果的可靠性。
统计监测平台以建立数据标准规范为基础,运用数据处理、数据清洗、数据分析、数据可视化等技术建立数据综合治理体系,从前期数据调研规划、到中期建立数据标准、后期持续数据质量改进管理等工作,来逐步提高数据的真实性、完整性、规范性、一致性、逻辑性,来降低数据管理成本,减少因数据不可用导致的分析挖掘的偏差和损失,实现数据的“精准治理”,为深度挖掘数据的价值奠定坚实的基础。
元数据规划工作主要包括:元数据定义、元数据采集和查询、来源和影响分析等。
(一)数据调研
2010年七夕情人节那天,两人的聊天记录长达十八页。李辉嗟叹:“我改变不了她,怎么办?她完全不是我想象的样子……”吴霞也很失落地说:“每次情人节、女人节、圣诞节、结婚纪念日,我都好像和自己心爱的人一起过,可江帆大多数时候都抛下我,陪客户应酬。到底是钱重要,还是我重要?江帆也不禁汗颜:“我对妻子实在呵护不够,她出轨我有责任。”
数据标准规划工作主要包括:标准设计定义、标准设计发布、标准查询等。
综上所述,老年肺炎患者在发病早期血清中PCT、hs-CRP及D-Dimer水平就会升高,血清PCT、hs-CRP及D-Dimer水平与肺炎严重程度存在正相关性,病情越严重,其浓度亦越高,在疾病早期检测上述3项指标,有利于评估疾病的严重程度,及时指导临床用药。对于控制病情,降低病死率具有较高的临床意义。但因本研究样本量偏少,可能使数据分析产生一定偏倚,为减少这种偏倚,后续将开展更加深入及更大规模的研究。
数据质量规划工作主要包括:质量检查规则定义、质量检查方案定义、质量检查评估、质量问题分析及报告等。
通过上述工作,可以从整体上对平台中的数据概念、标准和质量进行全面梳理规划,并能够确保后续的数据治理清晰、有序。
(二)标准规划
■ 业务的需求变化较快,采集的指标口径、流程应能随着业务需求变化快速适应和调整,并能自动完成系统和数据的动态升级;
数据标准工作就是对资源信息进行定义、评估、分析,实现信息的描述和格式化,达到对数据标准管理工作,为元数据管理提供相应的业务元数据信息,为数据治理提供相应的治理标准,大大降低数据治理人工成本。
先以元数据为基础,构建数据资源管理体系。从数据应用的角度说清楚统计监测平台数据有哪些,哪些数据能够使用。基于第一步形成的数据资源管理体系,梳理、整合各业务系统的数据资源,建立了数据资产目录树,对不同数据类型制定相应的规范约束,对相应的数据指标项行梳理和制定规范要求。
(三)质量管理
在数据治理过程中,最重要的是要建立数据质量管理体系,来有效识别统计监测平台的各类数据质量问题、找出数据质量原因、监控问题发展趋势,并提供问题明细查询和质量改进建议,全面提升数据完整性、准确性、及时性,一致性以及合法性等方面的问题。
在当下数据已成为政务部门、企事业单位的宝贵资产,随着互联网技术的迅猛发展,数据的采集、传输、分析、展示等问题越来越重要,在企业和政府日常生产和工作过程中,会产生海量的数据,但这些数据往往没有统一的记录、归纳和整理,或者录入了系统却分散在不同部门而未持续归集,无法为后期的数据应用和分析挖掘提供服务。
然后依据质量规则制定数据质量检查方案,包括检查的范围、检查的时间、检查的规则、评分的规则、检查的责任人等,对统计监测平台汇集的数据按照制定的方案进行检查。
随着我国农业科研体制机制不断发展完善,我国农业科技自主创新能力和科技成果转化能力大大提高。农业科研管理是农业科技工作的重要组成部分,对促进农业科技创新的发展具有重要作用。要理论联系实际,提高农业科研管理水平和效益,全面推进农业科学研究,进一步促进农业科技创新可持续发展,为农业生产和收入增长、农村繁荣注入强大动力。在农业科研管理具体工作中,要适应新环境、抓住新机遇、提高工作技能、创新工作方法。
最后根据检查结果、数据质量管理和监控要求,对问题数据进行统计分析,并对检查产生的结果通过界面、邮件、短信等方式告警,找出问题数据出现的原因,采取手段持续改进,避免问题重复出现,周而复始,逐步提高数据质量。
最近发展区理论是由维果茨基提出的,他认为每个学生都有两种认知水平,一种是现有认知水平,一种是通过数学学习可能达到的数学水平,而处于这两种认知水平之前的区域便是最近发展区。小学生十分脆弱、敏感,极易被失败打击,也会被成功感染。设计符合小学生最近发展区水平的数学问题可以最大限度地丰富小学生的成功经验,增强小学生的学习效能感。从这个层面来说,设计出符合学生最近发展区水平的数学问题便成为优化小学数学课堂提问的基本前提。
四、确保数据“精准治理”的有效措施
(一)建立组织
想要开展数据治理工作,就必须先建立相应的组织机构,开展统一的治理工作,组建治理委员会,制定监管政策,明确如果数据出了问题是谁负责,在各部门、各应用系统中落实责任,保障组织间高效的沟通。
(二)制度建设
制定数据管理的办法、管理的流程、治理的规则、治理的要求、岗位要求、角色人员、奖惩措施、保密措施等,保证支撑治理工作正常、有序、有效、及时的开展。
(三)规范约束
加强数据的规范约束,能有效提高采集数据的质量,对核心业务数据项定义完整性、规范性、可度量等标准规范约束规则,主要针对元数据、主数据等制定相应的数据规范。
我把碗搁在床头柜上,在二丫的后背塞了个枕头。去拉二丫的手,我像烫着了一样又缩回来——这手太像莲米的手了,也是一把干柴!我说:“二丫,细婶儿给你炖了鸡汤,吃口呵。”
(四)系统保障
采购和开发相应的数据管理软件系统,解决数据治理过程中遇到的问题,通过系统,提高元数据管理、数据资产管理、数据标准管理、数据质量管理、数据问题分析等能力,来保障数据治理工作的顺利开展。
总之,在各类政府服务数字化转型过程中,越来越多的数据被汇集整合,统计监测平台有效的保障了各类数据信息汇集和处理,符合管理的实际需要,应长期推广。
3.1.5 体位改变 对照组机械通气的患儿床头抬高15°,而观察组机械通气的患儿床头抬高30°。王文秋等[15]研究表明,平卧位患者VAP发生率最高,床头升高25°者可明显降低呼吸机相关性肺炎的发生率。有研究显示,对于机械通气尤其伴有肠内营养的患者,除非有禁忌证,如颈椎、骨盆骨折及血液动力学极不稳定的患者,否则均将其床头抬高超过30°~45°,可以有效地预防误吸及胃内容物反流[16]。减少口咽部细菌定植和误吸的发生,从而降低VAP的发生率。
● 遥信:实时回传或轮巡路灯设备的故障和自诊断信息,便于管理部门及时处理,偏离预定阈值及时报送告警信息。
数据治理的核心目标就是在降低风险的同时增加价值,合理的数据治理能够建立规范的数据应用标准,消除数据的不一致性,提高数据质量,推动数据广泛共享,充分发挥数据对政府及企业的业务、管理、以及战略决策的重要作用。
未来数据的“精准治理”将为各政务部门提供更及时更准确更全面的数据,在及时了解情况、惠企服务、科学研判等方面提供的数据支撑,更好支撑政务工作的开展。■
参考文献:
[1] 人民论坛理论研究中心.政府数据治理的三个重要内涵.[J]前沿理论,2016.27(002)
[2] 张绍华,潘蓉,宗宇伟.大数据治理与服务.[M].第一版,上海:上海科学技术出版社,2016.1-224
[3] 吴信东,董丙冰,堵新政,杨威.数据治理技术.[J].软件学报,2019, 30(9):1-27
[4] 杜小勇,卢卫,张峰.大数据管理系统的历史、现状与未来.[J].软件学报,2019, 30(1):127-141
作者单位:河北省工业和信息化厅信息中心、机械工业信息中心
标签:数据论文; 质量论文; 平台论文; 标准论文; 企业论文; 社会科学总论论文; 统计学论文; 世界各国统计工作论文; 《互联网天地》2019年第9期论文; 河北省工业和信息化厅信息中心论文; 机械工业信息中心论文;