王晓娟:大数据时代应用统计学的发展模式探究——基于湖北大学的个案分析论文

王晓娟:大数据时代应用统计学的发展模式探究——基于湖北大学的个案分析论文

[摘 要]近年来,数据分析专业人才需求高涨,各大高校纷纷开设大数据研究等相关专业,大数据时代对应用统计学的发展提出了更高的要求。学校可以通过对统计数据认识、搜集和分析的变化分析,结合统计学教育内容、教学模式和考核方式的变化应对统计学教育面临的挑战。

[关键词]应用统计学;大数据时代;发展模式改革

一、大数据的定义及特征

随着信息化时代的发展,“大数据”已成为当下人们使用频率最高的词语。无论新兴行业还是传统行业,都想从大数据中获得新的能量,以创造更好的行业发展契机。大数据专业人才供不应求,各大高校纷纷开设“大数据研究”等相关专业,国家也越来越重视大数据方面的人才培养。

大数据的概念可以追溯到2001年,世界知名咨询公司Gartner发布的一份咨询报告里首次提出“Big Data”并提出了“3V模型”。意思是大数据在数量(volume)、速度(velocity)和种类(variety)三个维度上都很“大”。经过数年的积淀,伴随着计算机和数据分析技术的兴起,大数据终于迎来了它的黄金时代。2012年,畅销书《大数据时代》更是令“大数据”一词迅速走红,各行各业都对大数据技术跃跃欲试,大数据在互联网等行业的应用日新月异。

目前,比较权威的大数据的定义是Cartner给出的,大数据是一种信息资源,其特点是具备对海量数据的决策力、洞察力及流程优化的能力,除此之外它的数据同样具有高增长性、高储存性和多样性。这个定义包含了大数据的三个典型特征:新形态——大数据具有高增长性、高储存性和多样性;新模式——大数据需要新处理模式的支持;新能力——大数据具备对海量数据的决策力、洞察力及流程优化的能力。这也为我国专业人才的培养提供了思考方向。数据处理和数据分析的重要性在各行各业得以体现,大数据分析已经成为当今社会热门的技术岗位,也是各大企业争相获取的数据资源优势。

二、大数据与统计学的发展

大数据的本质是大量的数据资料,而应用统计学则是一门将数据分析方法应用于各个领域,以推断目标研究对象的性质,甚至是对研究对象的未来进行预测和决策的综合性学科。了解大数据和应用统计学各自的定义和特点,明白它们之间存在的联系和差异,有助于大数据与应用统计学之间的研究体系的建立,也有助于对应用统计学的未来发展模式的更深入的研究。

大数据与应用统计学之间有着紧密的联系,具体表现为以下几点。首先,构成大数据的巨型数据集虽然与通常的结构化数据不一样,但它的本质仍然属于数据,统计处理也同样将大数据作为对目标进行研究分析的起点。其次,大数据对数据的一般处理流程为:数据采集→数据分析→数据挖掘→筛选有用信息,而统计应用的大致步骤则是:统计设计→数据采集→数据整理→统计分析→挖掘数据关系。虽然这两者处理的各个环节不尽相同,可许多步骤的原理和方法非常类似,很明显它们内部保持着某种紧密的关系。最后,大数据和应用统计的研究方法可以相互借鉴,大数据的新兴性要求专业人员在对对象的研究和处理模式上与时俱进,这为应用统计学的研究指引了不同的新方向。与此同时,大数据的研究不可能脱离对数据分析的基本方法,这些重要的基本理论也正是来自应用统计学科知识。

苏轼偏爱饮茶,所以对茶道也很有研究,对烹茶的每一道程序都有自己独特的看法。在《试院煎茶》中有“蟹眼已过鱼眼生,飕飕欲作松风鸣。蒙茸出磨细珠落,眩转绕瓯飞雪轻”,这几句话刻画了诗人在考试的庭院中细致煎茶的场景,他仔细聆听茶的沸腾之声,看着飞雪般的泡沫来慢慢煎茶,创造了一种随遇而安,乐观豁达的境界。

大数据分析与应用统计学的区别则主要体现在研究目的、数据处理对象和数据分析技术上。首先,大数据的目标在于发现和获取数据价值,追求数字回报,而应用统计学则以发现数据的规律和关系及其背后反映的事物的某种本质为研究目的。其次,大数据的数据处理对象可以遍及金融投资、保险、消防、互联网空间、建筑设计和实时交通等各个领域,其数据形式为巨量的非结构化数据和半结构化数据,而应用统计学处理的数据类型主要为规模不大的结构化数据。最后,大数据分析需要复杂的网络技术和工具,其基础的技术包含数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面,而应用统计学的研究方法主要包括市场调查、统计推断、回归分析、综合评价等。[1-3]

1.3 规范化 规范化主要分为位置规范化、大小规范化和笔画细化处理,位置规范化和大小规范化在纸质文字转化为数字图像时,就已规范化,每个单体文字图像像素为长宽各130像素。对于细化方面,细化是指对于一个给定的模式图像,抽取其“中心骨架”的过程,细化算法可分为非迭代算法和迭代算法,而迭代算法又分为串行算法和并行算法,本文的细化处理是在不破坏原有结构配置和给定笔画连接位置关系的基础上,采取迭代扫描并删减边界像素点来完成。笔画细化方法中经典的有基于标记的并行细化算法〔14〕,改进的有自动矢量化算法〔15〕。细化后的文字消减了很多手写字体的个性化特征,为特征提取创造了有利条件。

三、大数据时代应用统计人才的需求与挑战

(一)市场对统计人才的需求

近年来,我国大数据产业从无到有,全国各地发展大数据积极性较高,行业应用得到快速推广,市场规模增速明显。2017年我国包括大数据核心软硬件产品和大数据服务在内的市场规模超过2600亿元,与2016年相比,增长了49%。2017年1月,工信部发布了《大数据产业发展规划2016~2020年》,进一步明确了促进我国大数据产业发展的主要任务、重大工程和保障措施。国家政策的接连出台为推动大数据产业快速成长提供了良好的发展环境,未来2~3年市场规模的增长率将保持在50%左右。预计2020年,我国大数据市场规模将超过8000亿元,预计未来中国将成为全球数据中心。

从大数据人才的需求来看,当前高层次复合型人才是市场竞相追逐的对象:他们熟悉数学、统计学、机器学习等专业领域,并能把各种语言处理与统计应用融合起来。各行各业都在与大数据时代接轨,其发展也自然离不开大数据人才的参与。因此,培养适应时代潮流和社会需求的大数据人才,是我国当前高校教育工作的重中之重。

休闲制约协商更加强调人对制约因素的积极能动作用,进一步拓展了休闲制约的研究内容。当然,如何检验和测量休闲制约协商过程中的各种干预因素也成为研究难点,同时是推动研究向纵深方向发展的关键点。

(二)近年来我国高校在大数据领域的发展

表1 2013—2018年成立的大数据研究院或开设大数据相关专业的高校数

年份201320142015201620172018高校数51020283649

表1显示,我国开设应用统计学专业的高校,近年来成立大数据研究院或者开设大数据相关专业的数量不断攀升。各大高校都想抓住大数据发展的时代潮流,纷纷投入到统计学与大数据的发展融合中,为满足市场需求输出更多优质的大数据人才。大数据时代推动着应用统计学专业的发展,也对应用统计学的发展提出了新的挑战。

(三)应用统计学教育面临的挑战

数据科学的发展,冲击了传统统计学的发展,也使高等教育事业担负起新的责任和挑战,应用统计学专业的发展模式和课程改革显得尤为必要。目前,很多高校的应用统计学专业建设时间比较短,其人才培养经验不足,不切合实际,脱离了经济发展的实际需求,这带来的后果可能就是限制了学生的发展空间,或者导致培养的学生不具有统计学专业人才应有的专业素养。在全球大数据化的冲击下,应用统计学教育必然会面临以下挑战。

1.教育内容的变化

现阶段应用统计学专业的主要课程设置有数理统计、抽样技术、回归分析、统计预测与分析、计量经济学、时间序列、多元统计、非参数统计等,这些经典课程仍然是应用统计学的专业必修课。除此之外,面对大数据时代海量数据处理的需求,学校也要开设一些顺应大数据时代潮流的新课,比如数据挖掘、探索性数据分析、统计计算等。

2.教学模式的变化

大数据时代,大部分数据信息源于网络,人们很难追溯其根源,从信息来源方向上看,数据信息的目的性很模糊。大数据时代的数据类型不同于传统统计学中样本的完全结构类型,其多半属于半结构、异结构、非结构类型,其数据类型更加复杂。在统计研究中要想根据这些数据形成样本,还要在量化方式上依靠大量的相关理论基础。因此,相关研究人员应该对数据信息进行详细的汇总和分类整理,简化统计过程,充分发挥大数据的实际优势,建立能为自己所用的立体的数据信息模型,促进统计工作的实施。

式中,ωD和ωR是与粒子间距离有关的权重函数,vij=vi-vj,ζij是随机涨落变量,满足如下条件:

3.考核方式的变化

传统的考核方式大多采用试卷考试的形式。随着教学内容和教学模式的革新,传统的考核方式已不能满足发展需求。从数据处理方面看,大数据的统计计算与数据分析,往往需要借助计算机操作;从实际应用上看,要解决实际问题需要进行分组讨论等其他写作。因此,在大数据相关科目中,上机考试和分析报告将替代传统的试卷考核。

四、大数据时代应用统计学专业的发展模式探索

(一)大数据时代的统计思维新变化

当今社会,研究中对于大数据运用的优势逐步显现,它所渗透的范围也越来越大。所以,大数据环境下,传统的统计思维必然会发生适应性的改变。[4]

以上三个话题的深层架构可以概括为:“敌人架构”“失信架构”和“生存架构”,该语料的深层架构反映出英国盟友对特朗普政府新政策的态度:警惕、不再信任美国政府且感到生存受到威胁。而这一系列的深层架构又可以与美国至上政策对应起来:抛弃意识形态,从美国自身利益出发制定对外政策;逆全球化,实施贸易保护;全球收缩,不再承担国际责任。此外,以上政策的制定也与共和党的“严父道德模式”中的深层架构吻合:追求自身利益、强调竞争、自负其责等。(Lakoff 2002)

1.统计数据认识思维的变化

当前,应用统计学的授课模式大多是理论讲解为主,辅以统计计量软件的操作。而随着互联网教育业的发展,当前国内外高校纷纷推出在线视频教学。这些视频教学资源从各种不同的角度剖析某一方面的专业知识,比起传统的教育方式,更加生动活泼,又因互动方便而受众面广。应用统计学的教学模式也渐渐向在线授课倾斜。

2.统计数据搜集思维的变化

大数据思想的渗透,使人们越来越关注数据处理与数据分析。本研究试图探索能够满足大数据分析需求的人才培养模式,着力提高应用统计学专业学生的数据分析技能。具体表现在以下三个方面:一是调整现有应用统计专业人才培养方案,传统的数据收集和数据分析的知识结构已不能满足大数据时代的要求;二是探索能够满足大数据分析需求的人才培养模式,改变传统单一的课堂授课模式,将翻转课堂的理念渗透到统计课程教学当中;三是将数据分析与计算机技术、数据库技术等专业领域逐步融合起来,更充分地发挥应用统计的数据处理与数据挖掘的功能。

3.统计数据分析思维的变化

1.培养目标的转变

(二)湖北大学应用统计学人才的培养方案探索

统计学作为一门研究数据的科学,其传统的数据收集和数据分析的知识结构已不能满足大数据时代的高要求,其培养方向已经在与计算机技术、数据库技术等专业领域逐步融合。从学科发展趋势上来看,高校需要对高层次统计专业人才进行培养,以适应大数据背景下对数据处理的需求和发展。对此,湖北大学从2011年开始招收应用统计专业硕士,并从2015年开始招收应用统计专业本科生,旨在培养应用型的统计人才,以适应大数据时代对数据分析人才的需求。

传统分析思维一般是对样本进行“定性—定量—再定性”的分析,这种思维的分析方法在数据不足或有缺失值的情况下是依照统计研究人员的经验进行判断的。大数据时代,数据信息高度丰富,如果人们延用这种分析方式就很难保证分析结果的准确性与科学性。目前,统计分析更需要人们对大量真实数据进行科学分析与信息方向的整体把握,同时能够对所分析数据进行假设和推断,最大限度地保障分析数据信息的完整性。

搜集统计数据的基本方法主要有观察法、报告法、访问法等。不同的搜集方法有不同的特点和其适合的条件,人们应该根据调查对象的特点、研究目的和任务及统计调查的条件灵活选择搜集方法。统计数据的搜集工作一定要严格按照调查方案进行。数据搜集思维的变化,很大程度上影响着数据的选取和对数据的具体应用,良好的搜集思维能够高效完善统计工作,推进统计工作的实施进程。

基于转移系数和换流站—支路灵敏度系数将故障后支路潮流表示为故障前相关参数的线性关系,实现了故障前、故障后、换流站快速调节三个过程的统一。通过对上述模型的求解,保证了故障前的最优运行状态是充分考虑了VSC换流站调节能力的最优解,其计算结果与PSCOPF相比具有更好的经济性。

2.教学内容的改革

在教材教辅资料的选择方面,教师在当前采用的各类统计学专业教材的基础上,编排统计与经济、金融相结合的教学案例,用来做教学的辅助讲解和演示,将专业知识渗透到实际应用当中去;在教学内容方面,教师借鉴经典案例,关注学术前沿,除了专业知识介绍之外,还要注意实际应用的介绍,理论与实践相结合,使学生的专业视野更开阔。

3.教学模式的改革

(3)施工方案执行。井队队长作为施工总方案执行的主要责任人,协调方案落实和执行。钻井工程师、钻井液工程师为分方案执行的负责人,钻井工程师负责钻头、钻具、仪器、施工参数控制(泵压、钻压等)、工程技术措施的落实把关;钻井液工程师负责钻井液各项性能的调整、处理剂加量的控制等。

在教学模式上,教师主要借助案例教学,从社会生活中的一个熟悉案例出发,引申出统计学的某个知识点,并将此案例在基本原理、研究方法及应用介绍过程中贯穿始终,使学生抱着解决问题的态度去学习知识,寓学于乐。另外,革新传统的考试考核模式,加大平时考核的力度,提升学生课堂学习的参与度,鼓励团队研究以使每位学生都参与课题研究,快速提升学生对统计方法的应用水平。

通过分析国际上有关商标混淆可能性的立法模式,可以发现以美国、欧盟、日本为代表的主要立法模式。美国的商标法将商标相似归结到了混淆可能性的内容中;日本的立法模式则是相反,在日本商标法中的商标近似性的范围会更大一些;欧盟的商标法则是将商标的近似作为判定侵权的基础,将混淆可能性作为一个限制性的条件。

1.2.1 腹式呼吸训练 患者取仰卧位、半卧位或半坐卧位,两膝轻轻弯曲,使腹肌松弛,一手放在胸骨柄部控制胸部起伏,另一手放在脐部,以感觉腹部隆起程度和呼吸时帮助腹肌收缩。深吸气腹部徐徐凸起后,憋气约2 s,然后缩唇慢呼气,呼气时间是吸气时间的2倍。每分钟6次。每天进行3次,每次训练20 min。

4.教育模式的探索

实施多元化的授课模式。在阶段性的专业知识传授后,教师可以鼓励学生参与课堂教学,分别从数据收集、数据处理、统计软件操作、统计建模与数据解读几个方面,培养学生解决实际问题的能力,让学生真正掌握统计的专业技巧。湖北大学实施本科生导师制,通过定期开展大讨论、鼓励学生参加课外实践活动等形式,帮助学生加深对应用统计学专业的了解。除此之外,湖北大学还注重校内学生与校外企业的联合培养,目前已经与上海缔脉生物医药科技有限公司签订了定向培养协议。校企联合培养的方式,不但增强了学生的专业实践能力,而且为企业输出了专业的数据分析人才。

五、结束语

传统统计学在全球大数据化的时代背景下面临前所未有的机会与挑战。统计学学科建设必须顺应时代,进行相应的革新,培养符合大数据时代要求的数据分析与数据挖掘人才,提高学生在社会经济中应用的专业技能,提升学生就业的核心竞争力。统计学教育的改革不应局限于一朝一夕,面对大数据背景下迎面而来的挑战,学校应该制定长期的培养方案,建立有效的检验机制。大数据是推动统计事业新发展的关键动力,能够使应用统计学走得更远。

参考文献:

[1] 孔晓瑞,刘梦玲,靳俊娇.大数据时代背景下对应用统计学专业的思考[J].高教学刊,2016(18):41-44.

[2] 刘春杰.大数据时代对当代统计学教育的挑战[J].统计与决策,2015(8):32-33.

[3] 邱东.大数据时代对统计学的挑战[J]].统计研究,2014(1):16-22.

[4] 李金昌.大数据与统计新思维[J].统计研究,2014(1):10-17.

[中图分类号]G642

[文献标志码]A

[文章编号]2095-3712(2019)19-0097-03

[基金项目]湖北大学教学改革研究项目“大数据时代应用统计人才的培养研究”(070/014238)。

[作者简介]王晓娟(1983—),女,河南南阳人,博士,湖北大学数学与统计学学院讲师;甘澜珊(1995—),女,湖北孝感人,湖北大学数学与统计学学院;胡泽华(1995—),男,湖北武汉人,湖北大学数学与统计学学院。

[收稿日期]2019-05-06

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

王晓娟:大数据时代应用统计学的发展模式探究——基于湖北大学的个案分析论文
下载Doc文档

猜你喜欢