空军军医大学第一附属医院陕西省西安市710032
摘要:21世纪之后,迅猛发展高新科技,不断强化经济全球化趋势,极大的提升了我国国民经济水平,也促进各个行业快速进步。充分满足人们的物质生活之后,人们对精神及视觉上的享受更为追求,此种状况下,数据信息所具备的作用越来越清晰的显现出来。数据信息海量产生背景下,很大程度的便利了人们的生产及生活,但与此同时,由于其中包含众多无价值信息,一定的给人们造成困扰,对此,为更加便利人们使用,提出了数据挖掘的概念,并研发出相应的挖掘技术。进入到大数据时代后,数据挖掘技术占据越来越重要的地位,必须要在明确现有技术类型的基础上,进一步的优化与创新,研究出与时俱进的新的数据挖掘技术。
关键词:大数据时代;数据挖掘技术;应用情况
1大数据时代下的数据挖掘技术
1.1数据挖掘技术基本概念
在日常的信息检索和整合处理的时候,技术工作人员会采用一些较为特殊的技术手段进行处理,这种特殊的数据处理方式就是我们所说的数据挖掘技术。在传统的信息检索处理中,工作人员往往需要花费很多的时间和精力才能在众多的数据库当中挑选出合适的数据信息[1]。数据时代的到来给人们的生活带来了无限的便利条件,当前,技术工人可以利用数据挖掘技术处理日常的工作,大大提高了工作效率,拓宽了数据挖掘技术的应用空间。
1.2数据挖掘技术的特点
一般来说,在大数据时代下的数据挖掘技术相对十分复杂,它虽然在一定程度上改善了传统数据检索中常常遇到的问题和困难,但还需要建立合适的数学模型。另外,对于数据挖掘技术来说,它所使用的数据库十分庞大,这在无形中增加了出现微小错误的可能性,这种错误虽然不影响最终的处理结果,但还是不能保证十全十美。最后,相比于原有的数据处理技术,数据挖掘技术更加人性化,它可以从用户的角度出发,最大程度的满足用户的根本需求。
1.3数据挖掘技术的应用
第一,它可以依照不同用户的不同需求在数据库中进行信息的收集和处理,保证了数据处理的个性化。第二,不同用户之间的信息是相互关联的,因此,可以根据全网用户的检索情况分析他们之间的联系或工作内容等项目。第三,系统会自动将相似的信息进行汇总,并统一于一个数据库当中,这样一来,在日后的处理过程中,技术人员的工作效率就可以得到提升。
2常用的数据挖掘技术类型
2.1聚类分析
数据库或对象库抽选后,进行与“分类”相似的聚类划分,之后在一个组类中放置相同的或相似的数据,由此将多个组类建立起来,此种过程即为聚类分析过程。整个聚类分析过程中,所突出的学习过程并无知识基础,也无监督管控,以所给数据为范围,将其中有价值的部分寻找到,并将相应的类设置出来。尽管聚类分析与“分类”相似,但并不相同于“分类”,聚类分析并无法把相应的属性知道。通过聚类分析,可将对相间类聚的某些规律获得。现阶段,心理学领域、医学领域等诸多的领域均已经广泛的采用聚类分析方法。根据具体的隶属度,聚类分析通常包含硬聚类和模糊聚类两种,硬聚类是指向距离最短的聚类中划拨事物的类,仅能在某一类中隶属;模糊聚类划拨类时,该类可能归属于多个类型。
2.2分类和预测
问题预测过程中,类型中重要的两个即为分类和预测。分类是指预估分类标号,无序、离散。数据挖掘时,可将分类看做基础性的步骤,训练数据可预计情况下,分类可将相应特性呈现出来,每个类别的描述或特征获取之后,完成有关的分类构建。分类学习过程存在监督,类别区分经确定性描述进行,而确定性描述来源于训练数据集。目前,分类包含多种方法,决策树、神经网络等为比较常用的方法。在神经网络系统中,包含的神经元数量众多,这些神经元的连接权值均可调,其特点体现在分布式存储信息、大规模并行处理、自组织自学习能力良好等。神经网络属于计算方法,以神经单元大集合为基础,将轴突连接的生物神经元大群集问题解决。每个神经单元均连接多个其他的神经单元,同时,能够抑制连接的神经单元的激活状态。相应值输入后,神经单元能够组合这些值,并进行求和。预测是指将连续值函数模型构建出来,规律的预估为预测的最终目的,而预估的依据为分类、回归,回归分析法、局势外推法为较常用的预测方法。例如回归分析法,所展现出来的是数据库中具备独特性质的数据,同时,根据函数关系,将数据间存在的联系与区别体现出来,进而将数据信息特质的依赖程度分析出来。目前,数据序列预计与测量中多采用回归分析方法。
2.3关联分析
众所周知,日常生活中的各个事物均不是独立存在的,它们之间具有复杂的关联,一旦发生意外,即会导致更多的意外产生。关联分析就是以此种关联作为依据,将事物之间存在的某些规律分析出来,之后以发现的规律为依据,开展预估工作。例如购物篮分析,这是一个典型的案例,通过观察购物篮中各商品的排列规律,分析其内在关联,进而将消费者的消费特点及消费心理总结出来,之后以此为依据,制定营销策略,实现顺利的销售。灰色关联度分析是关联分析中比较常用的一种方法,此种方法以各因素发展趋势的差异或相似程度为依据,实施归纳与评价,从而将因素间的关联程度衡量出来。现实世界中,并不会出现信息“非黑即白”的情况,因此,以灰色来描述信息间存在的过渡阶段,灰色系统则表明信息同时包含已知的和未知的部分。由于一直存在不确定性,灰色分析能够清晰的陈述出一系列解决方案。中间情况下,灰色系统可对各种解决方案做出优化,保证给出的解决方案是最佳的,可妥善的解决现实生活中存在的问题。
3大数据时代数据挖掘的应用
数据挖掘技术之所以可以运用到很多领域,是因为其能很好地融入各个领域的环境中,提升各个企业的服务水平,该技术还使各个企业竞争力加强,改善生产经营管理的效率。海量的数据是数据挖掘的前提,数据挖掘对这些数据进行分析、整合、分类,因此,数据的信息量是数据挖掘的保证,然后该技术才能对数据进行挖掘、分析、运用。
3.1教育领域
在该领域使用数据挖掘技术,方便教师对学生信息的掌握,了解学生的成绩、优点、薄弱科目等信息,也可对学生的各个方面进行分析,教师就可以对学生进行针对性的帮助。该技术在教育方面上的运用,提高了教育教学的质量和效率,使教学系统配置达到优化状态,这为教育事业提供了良好的条件。因此,该技术在教育领域占有举足轻重的地位。
3.2科研领域
数据挖掘在该领域上相当于一种辅助因子,原因是科学研究和实验数据是密切相关的,需要对数据之间的关系进行分析,然后统计结果和经验,然而,实验数据具有庞大的信息量。基于此,数据挖掘就被运用在该领域,数据挖掘技术可以帮助科研项目提供信息、寻找数据。因此,在科研领域上,数据挖掘的作用无可代替。
3.3电信领域
随着互联网的发展,电信企业也随之兴起,因为电信企业拥有大量的数据信息,不得不为人民提供更好的服务。由于该数据的综合性很强,使其服务受到限制,造成服务质量不好。但数据挖掘技术刚好能够改善这种情况,能使数据条理化,并对数据进行有效分析,全方位了解、记录用户信息,解决服务过程带来的麻烦问题。因此,数据挖掘为电信企业的服务提供有效的用户信息,为该企业提供了一个高效、优化的基础。
结束语
大数据技术算法的创新是一条光明而曲折的路,在这条路上会出现很多难题与挑战,这个任务长期而又艰巨,需要结合实际经验,不断地进行总结归纳。为实现自身的长远发展而进行大胆革新,利用创新思维进行现代化建设,从而大踏步地走向智能化的大数据发展目标。
参考文献:
[1]陈晓,赵晶玲 .大数据处理中混合型聚类算法的研究与实现[J].信息网络安全,2017(04).
[2]杨婷婷,林昌露,刘忆宁,张胜元 .基于多方排序协议的安全电子投票方案[J].计算机系统应用,2017(08).