摘要:大数据的快速发展对传统统计工作产生了巨大影响,对传统统计与大数据的特征进行了比较分析,总结二者的区别和内在联系,在此基础上开展了大数据背景下传统统计的SWOT分析,剖析了大数据时代传统统计的优势和劣势,以及面临的机遇和挑战,认为在大数据背景下传统统计具有数据来源稳定、数据标准统一等优势,同时具有范围相对狭窄、数据来源单一等劣势。在这样的背景下,传统统计面临着拓展数据来源、促进质量提升等机遇,同时面临统计生产方式变革、统计职能弱化等挑战。
关键词:大数据;传统统计;SWOT
现代信息社会已经进入了大数据时代,2013年被媒体称为“大数据元年”。大数据改变着人们的生活和工作,也改变着企业的经营和运作,个人和组织的行为信息通过物联网、互联网等进行记录、存储,并且数据量呈指数级的增长,产生的信息量远非传统统计分析所能企及。在向后工业转变过程中,大数据将信息技术的发展推向前所未有的高度,它不但成为一种技术,而且是一种资源和能力,并为新一轮的政府治理变革带来革命性的影响[1]。国家层面对大数据的重视程度也是前所未有,2017年12月8日,习近平在中共中央政治局第二次集体学习时再次强调要:实施国家大数据战略,加快建设数字中国[2],2013 年,国家统计局局长马建堂指出大数据对我国统计工作的机遇与挑战,无论如何强调都不过分,甚至都不够。如何应对大数据时代带来的机遇和挑战并主动顺应大数据时代进行政府统计工作改革,是现阶段政府统计部门面临的重大课题[3]。
本文对传统统计与大数据的特征进行了比较分析,总结二者的区别和内在联系,在此基础上开展了大数据背景下传统统计的SWOT分析,剖析了大数据时代传统统计的优势和劣势,以及面临的机遇和挑战。
1 传统统计与大数据的特征比较分析
传统统计与大数据在统计范围、统计标准、数据来源、分析技术等方面都存在很大的区别,然而二者之间又是相通的,在核心思想、核心方法上是一致的。
1.1 特征比较
1.1.1 统计范围
1)传统统计范围。目前,我国政府官方统计分布在各个部门,以统计部门为主,统计部门的统计范围主要包括国民经济核算、工业统计、能源统计、投资及房地产统计、贸易统计、人口和就业、科技和社会统计、农业统计、价格统计、住户调查、服务业和PMI统计等类别。其他部门根据工作需求制定自己的统计制度,例如科技部的科研机构统计调查、教育部的教育统计等。
2)大数据范围。相对于传统统计,大数据更显得无处不在,企业、个人、机构等每个个体所参与的社会经济活动的特征,都会以计算机数据的形式被记录和存储,这些数据都可以通过大数据手段进行搜集、整理、分析。
从当年“三天建一层楼”的“深圳速度”,到今天破旧立新的自贸区探索,都是“一个汗珠摔八瓣”拼出来的。不做光说不练的“假把式”,争当脚踏实地的“实干家”,“撸起袖子加油干”就是成就改革事业的“硬道理”。
1.1.2 数据获取技术
1)传统统计获取数据方式。传统统计获取数据主要依靠统计调查,调查方法主要包括统计报表制度、普查、抽样调查、重点调查、典型调查和科学推算。
总之,提升医学留学生辅导员职业能力,建设一支内涵丰富、能力突出的辅导员队伍,需要各方共同努力,推动医学留学生管理工作再上新台阶。
在用偏最小二乘法建立模型时,最重要的是确定建模所需要的主因子数,采用的主因子数过多或过少,都会使拟合的精度降低,预测效果变差[11]。本实验比较不同预处理方法在PLS建模下的主成分数以及和RMSECV的值,并选择主成分相对较小的校正R2模型作为预测模型,再根据交互验证的R2和RMSECV值来选择最佳预测模型。
(3)思考:根据“何由以知其所以然”的“几何之务”,按照“启发学者,示以思维之道”的教材编写要求,我们可以对上述教材提出如下问题:
目前传统统计依靠调查报表获取数据的频次包括月、季度、半年、年度,其中年度统计数据居多。
1)传统统计来源。传统统计的数据大多来源于统计报表,各类报表分布在不同的部门,主要包括统计局、科技部、教育部等机构。报表填报主体涉及企业、高校、科研机构、各类创新基地等单位。
建筑施工的周转材料租赁属于重资产投入,而施工项目的工作环境的各种不确定因素将直接对承租方和租赁方带来巨大的经济损失,例如甲方对项目图纸的变更、现场工人的施工水平及项目管理不当,都会对租赁单位的周转材料带来损耗,为此,租赁商往往在项目施工完毕后对所出租的材料进行定损工作,同时为了保证自己的材料能够最大周转起来,也会对材料进行维修保养,为了方便维修保养,供应商往往希望在施工项目上即可按照材料的规格种类进行分类打包,便于返厂维修,但是目前的施工现场由于管理模式大部分采用专业分包模式或者施工场地有限制,导致供应商的材料在施工现场退场过程中并没有按照规格分类打包,从而造成损失。
2)大数据来源。从数据来源上看,大数据手段获取的数据主要有三类:行政记录、商业记录、互联网数据[4]。行政记录数据主要来源于政府部门,包括个人信息记录数据、单位信息记录数据、自然和资源记录数据、其他管理记录数据。商业记录数据包括电子商务交易数据、企业生产经营数据、信息咨询报告数据。互联网数据包括搜索引擎数据、媒体数据、社交网数据。
1.1.4 统计标准
传统统计经过长期的实践,在全国乃至全世界范围内已经形成了统一的数据标准,例如:R&D活动在全球范围内基本采用统一的分类标准,按照活动类型分为基础研究、应用研究和试验发展三类;国民经济行业分类在我国有统一的分类标准,且根据经济发展状况进行周期性修订。这样统一的数据标准保证了统计数据在根源上的一致性,为后期的数据分析处理奠定基础。
大数据发展时间较短,且主要是从“民间”走向“官方”,在数据产生之初没有统一的指导标准,不同行业、不同企业的数据千差万别,例如淘宝网与京东网两大电商的商品属性数据在分类上完全不同,这就造成了同类数据的不同标准,对后期数据的应用是很大的障碍。
大力支持国家可持续发展战略和新能源发展战略,发挥塑料管道独特的优点,结合可再生能源技术、废水回收利用技术、能源回收利用技术,实现建筑物的采暖、制冷、热水供应、通风等功能。在地板采暖系统、地源热泵系统、太阳能热水系统、中水雨水回收利用系统等领域,大量推进应用。
传统统计经过几百年的发展,具有一套非常成熟的分析方法,并且经过长时间的实践检验,在各行各业已得到普遍应用,在理论和实践上都具有扎实的基础。而大数据对软硬件的要求都较高,很多采用自动化处理,必然存在技术风险,技术上的微小故障都可能带来严重的错误。此外,大数据正处在快速发展,未来的发展速度更是无法预测,可能研究出新方法后不久就过时了。
传统统计数据主要来源于统计报表,报表中的数据基本都是结构化数据,视频、音频、图片等非结构化数据非常少。
在大数据手段获取的数据中,结构化和非结构化数据都大量存在,并且随着互联网的飞速发展,商业纪录数据和互联网数据中非结构化数据会越来越多,其中所隐含的信息更是结构化数据所不能提供的。
1.1.6 数据频次
1.1.3 数据来源
大数据手段可以实现实时获取数据并进行存储,例如“双十一”购物节,全国数亿人同时网络购物,在阿里计算中心可以实时采集并展示购物的数量、金额、品类、地区等各类信息。
1.1.7 分析方法
1)传统统计分析方法。统计学作为一门系统的科学已有300余年的历史,其理论基础和社会实践应用非常深厚和广泛。从根本上讲,统计分析就是从数据中找到事物发展的规律,揭示事物特征和发展趋势。核心方法是量化分析,即必须通过定性或定量的数据分析得到结果。
具体的分析方法是非常多的,常用的有图表分析方法、基本统计描述、均值检验和方差分析、相关分析和回归分析、时间序列分析、非参数检验等。
2)大数据分析方法。大数据分析与传统统计分析面临的数据量有天壤之别,采用简单的统计分析方法无法处理,多采用复杂的计算机模型,常见分析方法有多维分析、漏斗分析、留存分析、用户路径、用户分群、点击分析等,不同的数据分析方法适用于不同的场景。
1.2 内在联系
通过上述对概念、统计范围、数据获取技术、数据来源、数据形式、数据频次、分析方法的比较可见,传统统计与大数据之间存在着很大的区别,这种区别从根本上是由数据量的大小造成的。但这种区别不应理解为传统统计与大数据是毫无关联的两个学科(或领域),恰恰相反,从二者的概念可知,传统统计与大数据本质上是相通的,主要体现在三个方面:
“把国防教育渗透到各科教学之中。根据不同学科、不同课文的知识点,把国防教育引入课堂教育激发学生的兴趣。如思品课、语文课教材中的一些课文,我们尽可能地把革命英雄主义教育贯穿在这类课文中。”程主任畅谈着国防校本课程的开发思路。
一是,二者核心思想一致,都是以数据探索事物发展规律。从本质上讲,传统统计与大数据都是人们开展的以数据为基础的探索事物发展规律的活动,只是在数据来源、采集方法、分析方法等方面各不相同。传统统计在探索事物规律时,主要是应用概率论方法建设数学模型,对数据进行分析,发现事物发展现状和趋势。大数据方法能够使人们深入获取数据层次,能够利用系统数据和完整数据,全面探索事物的内在规律,获取更多新的知识和方法。
二是,二者核心方法相同,都是量化分析。从传统统计和大数据的分析方法看,无论采用如何复杂的模型,其核心思想都是量化分析,即将现有的各类现象转化为数据开展分析。传统统计的数据量有限,分析模型也相对简单,大数据分析的数据量大,分析模型也相对复杂,但二者都必须将现象转化为数据开展量化分析。
2.1.4 成本相对较低
2 大数据时代传统统计的优势和劣势分析
2.1 大数据时代传统统计的优势
尽管目前大数据呈现出迅速发展的势头,但还处于起步阶段,没有成熟到可以在各行各业广泛推广应用的阶段,传统统计的优势仍是不可替代的,依然是我国官方统计的主流。在大数据背景下,传统统计的优势主要体现在以下几个方面:
2.1.1 数据来源稳定
传统统计以报表制度为基础,统计范围、统计对象、填报单位、统计内容等受统计法保护,统计数据在口径、指标上具有较强的可延续性。大数据主要来源于行政记录、商业记录和互联网数据,行政记录存在于不同的政府部门,数据来源相对稳定,但是商业记录和互联网数据不确定性较大,例如共享单车,兴起之时记录、存储了大量的用户数据,若干年后随着行业的逐渐衰落,用户数据自然大幅缩减。因此,相对于大数据而言,传统统计具有更加稳定的数据来源,且具有法律保障。
2.1.2 数据标准统一
传统统计在全国乃至全世界范围内已经形成了统一的数据标准,大数据主要是从“民间”走向“官方”,在数据产生之初没有统一的指导标准,不同行业、不同企业的数据千差万别,短期内实现标准的统一难度较大。统一的数据标准保证了统计数据在根源上的一致性,是后期开展数据分析应用的基石。传统统计在数据标准上的优势是大数据在短期内无法赶超的。
2.1.3 数据质量可控
传统统计在进行调查时,需要对报表进行收集审核、整理编码、平衡检查、复核等操作,在以计算机自动根据平衡关系进行数据质量审核的基础上,加以人工辅助审核,提高数据质量。大数据在产生数据信息时,没有统一的规范,数据量大是其根本特征,但这也为数据质量控制造成了困难,人工辅助审核更是难上加难。
1.1.5 数据形式
三是,大数据分析的核心基础是统计学。任何事物的兴起都不是偶然现象,必然有其赖以发展的基础,大数据的兴起和快速发展离不开传统统计的长期积淀。大数据是统计与计算机相结合发展的过程,即通过对经济社会活动与经济社会关系的定量、定性的观测与实验等过程,引入科学的技术和方法,达到对各种规律的有效把控、利用和管理的目的[5]。从信息角度讲,大数据仅仅告知信息,但不解释信息,必须通过系统的方法进行提炼。提炼的过程,就是数据分析的过程,提炼的工具就是统计学。大数据背景下,必须要具有统计思维,在分析过程中,对现代科技中的一些高科技技术和手段进行应用,只有这样才能做好相应的统计研究[6]。大数据时代,统计学依然是数据分析的灵魂。
2)大数据获取数据方式。大数据的数据采集方法主要包括网络数据采集方法、系统日志采集方法和其他数据采集方法。
传统统计的成本相对较低主要体现在数据获取和数据分析两方面。
数据获取成本方面,传统统计通过调查方式获取数据,具有固定的流程和渠道,具有非常强的延续性,每个调查周期所需的时间和人力成本相对固定,在调查经费预算上也相对较低。而大数据是二手数据,其拥有权不是政府统计部门,获得这些大数据需要政府机构同各个数据的所有者进行沟通和谈判,因此大数据可获得性差、时间和经济成本都很高。
数据分析成本方面,传统统计具有一套系统的分析方法,统计工作人员也都经过专业的培训,具备符合工作要求的分析技能,在数据分析方面基本可以做到有求必应。而大数据的数据处理、数据分析需要具有扎实的计算机软件编程、复杂模型等基础,虽说这些分析技巧也是以传统统计为核心基础,但由于起步晚,发展历史尚短,目前这类人才还相对紧缺,传统统计分析人员需要经过专业学习、培训和实践训练才能从事大数据分析工作,这在成本上是非常高的。
2.1.5 分析方法扎实稳定
数据的存在形式包括结构化和非结构化两类。
2.3 siRNA能显著抑制lncRNA ASB16-AS1的表达 因为lncRNA ASB16-AS1在先前的研究中已经确定在肿瘤组高表达,并且与肿瘤分期分级显著相关。因此本研究选择使用siRNA抑制lncRNA ASB16-AS1的表达以观测细胞功能改变。LN382细胞和U87MG细胞在转染24~48 h后用qPCR验证转染效率,结果显示应用抑制剂后lncRNA ASB16-AS1表达量明显降低(见图2A)。这说明本实验中所使用的siRNA能有效抑制lncRNA ASB16-AS1的表达。
2.2 大数据时代传统统计的劣势
2.2.1 数据范围相对狭窄
柴胡(批号:161201)、当归(批号:160501)、白芍(批号:160601)、白术(批号:160401)、茯苓(批号:161001)、炙甘草(批号:160601)、牡丹皮(批号:160801)、栀子(批号:160701)和薄荷(批号:160901)药材均购自山东百味堂中药饮片有限公司,经山东省中医药研究院林慧彬研究员鉴定为真品。
传统统计数据主要通过统计调查获取,报表制度中的填报单位、调查对象、指标等事项都有统一明确的规定,且报表制度在几年内甚至几十年内都相对固定,即使调整也是微调,因此获取的调查数据范围是固定的、有限的。以工业企业统计报表制度为例,例行年报的调查对象仅包括规模以上工业企业,规模以下企业需要在经济普查年份才有完整的数据。大数据的数据采集不受这种限制,已有数据可实施实时采集,新出现的数据通过开发相应的数据采集程序也能很快开展采集工作,可以说大数据的范围是没有限制的,只要有数据产生就可进行采集。
2.2.2 数据来源单一
传统统计数据主要来源于报表制度,数据的基础是报表中的各项指标,报表中的指标是相对固定的,每个调查周期可能会有微调。目前经济社会形势发展迅速,一成不变的调查指标很难满足实际工作对数据的需求,但根据目前全国统计报表制度的管理现状,大幅度的增加调查指标很难实现,这就造成了数据来源的相对单一。从统计内容上看,传统统计是先明确要调查什么,再确定内容,而大数据背景下内容已经存在了,看统计怎么选择,任何来源的数据都可进行采集、处理和分析。
2.2.3 数据形式单一
传统统计的数据基本是结构化数据,其采集渠道、采集手段、分析方法等特点都无法支持开展半结构化和非结构化数据的采集和处理。大数据手段获取的数据中,结构化和非结构化数据都大量存在,且非结构化数据可能会越来越多。
在“人人会执法、人人懂应急”的理念主导下,朝阳区食品药品监管局创建了“全局参与、5人24时制”的应急事件处置体系,先后成功地处理了81起食品药品应急突发事件,并承担了北京市食品药品监管局交付的2016年京津冀食品药品监管系统联合应急演练任务。
2.2.4 实时性相对滞后
目前传统统计依靠调查报表获取数据的频次包括月、季度、半年、年度,其中年度统计数据居多,且大部分年度统计数据在下年的四季度才能获取,实时性较差,面对当前经济社会的飞速发展,相对滞后的统计数据可能会带来一些误判。大数据手段可以实现实时获取数据并进行存储和分析,能够更为及时的反映现在的发展变化情况。
3 大数据时代科技统计面临的机遇和挑战分析
3.1 大数据时代科技统计面临的机遇
3.1.1 拓展数据来源
大数据在数据获取方面具有很大的优越性,可以采集各种数据,不受固定范围的限制,提供了大量真实、完整、及时的原始数据,这对传统科技统计是非常有益的补充,可作为数据源的第二轨。此外,在我们的统计工作中,也可以充分利用大数据的最新研究成果,丰富我们的统计产品,也是促使大数据服务于统计的一个重要途径。
文本本身具有一定的思想内涵,能呈现出来的小学课本一定是经过精挑细选筛选出来的精华,但是文本自己不会讲话,学生需要通过阅读文本,理解文本,领悟文本,经过自己的内化,文本才会有价值。人教版小学语文教科书中表现亲情的选文有15篇,这些篇目表现的是人与人之间的爱、奉献、亲情,一部分传达是父母对于子女的爱,一部分是子女对于父母的感恩。如五年级上册《地震中的父子》,学生通过自己与文本的对话,体悟文章中传达的深厚父子感情,学生在文本的启发之下,通过与现实生活的融合不仅能够体会文本所给予的父子情深,也能加深自己对于亲情的理解,从而学会换位思考,以自己的实际行动去感恩父母。
以科研院所统计为例,科研院所的统计仅涉及纳入事业编制的科研机构,共300家左右。全球科技发展日新月异,北京也不例外,各种研发机构雨后春笋般出现,如外资研发机构、新型研发机构等,且越来越成为未来科研的重要力量,目前科研机构的年报调查只是其中的一部分,并不能完全反映科研机构的发展情况。如果运用技术手段进行科研机构数据搜集和数据挖掘工作,可以大量补充科研机构统计数据,提高数据的全面性。
3.1.2 促使技术升级
大数据分析技术的核心基础是统计学,但其数据量与传统统计的数据量是天壤之别,数据模型和分析技术也要复杂得多,“工欲善其事,必先利其器”,要更好的利用大数据为统计服务,必先提高数据挖掘分析能力的技术、工具和方法。
3.1.3 促进统计设计标准化
目前大数据处于快速发展时期,数据量呈指数式倍增,但是大数据发展时间较短,没有统一的数据标准,不同行业、不同企业的数据千差万别,如果仅是进行数据的采集、存储,得到的也仅是数据而已,并不会产生有用的信息,要对这些数据进行分析利用,必须将其标准化,而数据产生之后再进行标准化整合是非常困难的,因此统计部门必须制定和规范数据标准,引导大数据在统一的标准下产生,这样才能开展有效的整合利用,因此大数据将促进统计设计的标准化。
3.1.4 促进数据质量提升
大数据时代的数据记录、存储等工作都是通过物联网和互联网设备自动实现,与传统统计人工填报数据相比,降低了数据出错的概率,也可在一定程度上避免人为编造、篡改数据的行为。
此外,大数据采集的数据信息与传统统计在渠道和来源上不尽相同,大数据可为传统统计提供总体性、非结构化、丰富真实的原始资料,可利用其验证传统统计数据,有利于提高统计数据质量。
2)在本研究中,商品价格对医药B2C平台顾客忠诚度的影响值为 0.23,相对其他影响因素而言最低。对于顾客而言,商品价格能影响顾客做出的选择,但并非主要因素。
3.2 大数据时代科技统计面临的挑战
3.2.1 统计生产方式面临变革
大数据的迅速发展已经对传统统计带来了很多影响,必将带来统计工作的变革。大数据是客观存在的,传统官方统计必须对其加以利用,否则官方统计的主体地位势必削弱。大数据应用到统计工作中,是贯穿整个统计生产过程,因此在统计工作中,统计制度、统计标准、数据采集、数据存储、数据处理、数据分析等各个环节都要根据大数据的发展情况作出相应的一整套调整升级,统计体系面临变革。
3.2.2 传统统计职能弱化
习近平指出:“做好宣传思想工作必须全党动手”,“要树立大宣传的工作理念,动员各条战线各个部门一起来做。”[1]宣传教育工作是一项复杂的系统工程,需要统筹规划、协调各方,树立大宣传的工作理念,全党动手齐抓共管发挥各方面的优势,才能形成大合力,调动起各方面的积极性。
大数据未出现之前,传统官方统计是唯一权威、可靠的数据来源,从涉及国家经济社会形势的宏观数据,到关乎人民生活的微观数据,都是由传统官方统计统一出口。随着大数据的日益兴起,企业、个人、机构等各种行为信息都可以通过物联网和互联网进行采集,甚至很多数据是传统统计中不存在的,或者在实时性上远胜于传统统计,并且目前社会公众对一些企业发布的大数据统计结果相当认可,这在一定程度上弱化了传统官方统计的职能。
3.2.3 数据处理能力面临挑战
大数据的数据量与传统统计的数据量天壤之别,数据模型和分析技术更为复杂、更为专业化,这对数据处理的软硬件及人员都提出了更高的要求。目前,传统统计在软件和硬件上都无法满足大数据分析的需求,统计工作人员的技能水平也存在较大差距,传统统计在数据处理能力方面面临着很大的挑战。
3.2.4 数据质量更受关注
对着社会公众接受信息量的扩大,人们对数据的质量和细化程度需求也不断提升。大数据时代,传统官方统计不再是统计数据的唯一来源渠道,很多企业也会发布大数据分析结果,有些甚至比传统官方统计更为超前,例如根据淘宝交易数据测算的价格指数,在这样的情况下,传统官方统计的数据质量、权威性必然受到质疑和挑战。
参考文献
[1] 黄其松,刘强强.大数据与政府治理革命[J].行政论坛,2019(1):56-64
[2] 实施国家大数据战略加快建设数字中国[EB/OL].(2017-12-09)[2018-01-15].http://cpc.people.com.cn/n1/2017/1209/c64094-29696290.html.
[3] 马建堂.大数据在政府统计中的探索与应用[M].北京:中国统计出版社,2013.
[4] 马建堂.大数据政府统计的新机遇[M].北京:中国统计出版社,2015.
[5] 赵彦云.对大数据统计设计的思考[J].统计研究,2015,32(6):3-10.
[6] 陈宇秋.小议大数据与统计新思维[J].财经界:学术版,2016(2):288-289.
SWOTAnalysisofTraditionalStatisticsintheBackgroundofBigData
PANG Li-yan
(Beijing Research Center for Science of Science,Beijing 100089,China)
Abstract:The rapid development of big data has a tremendous impact on the traditional statistics.This paper makes a comparative analysis of the characteristics of traditional statistics and big data,summarizes the differences and internal links between them,and on this basis carries out SWOT analysis of traditional statistics under the background of big data,and analyses the advantages and disadvantages of traditional statistics in the era of big data,as well as the opportunities and challenges faced by traditional statistics.According to the background,traditional statistics has the advantages of stable data sources and unified data standards,and has the disadvantages of relatively narrow scope and single data sources.In this context,traditional statistics is faced with the challenges of expanding data sources and promoting quality improvement,as well as the transformation of statistical production mode and weakening of statistical functions.
Keywords:big data;traditional statistics;SWOT
中图分类号:G301
文献标志码:A
文章编号:1671-1807(2019)05-0095-05
收稿日期:2019-02-19
作者简介:庞立艳(1983—),女(满族),河北秦皇岛人,北京科学学研究中心,助理研究员,硕士,研究方向:科技统计。
标签:数据论文; 传统论文; 方法论文; 统计数据论文; 来源论文; 社会科学总论论文; 统计学论文; 世界各国统计工作论文; 《科技和产业》2019年第5期论文; 北京科学学研究中心论文;