文本数据是电力大数据的重要组成部分,对其进行有效挖掘是智能电网深入、全面发展的需要。在目前已有研究成果的基础上,对电力领域文本数据挖掘的现状及挑战进行了深入剖析。首先分析了文本挖掘技术的发展过程及存在难题;接着重点分析了电力文本数据挖掘的关键技术及其研究现状,包括文本预处理技术、文本表示方法以及数据挖掘方法;然后以电力设备缺陷文本为对象,介绍了文本挖掘技术在电力领域的应用,包括缺陷文本质量的提升与保证、缺陷文本严重程度自动分类、缺陷发生部件及程度的自动提取、缺陷文本检索、基于缺陷文本的电力设备健康状态评价等,可为其他类型电力文本的挖掘提供参考;最后,探讨了电力文本挖掘面临的挑战以及未来发展方向。
类型: 期刊论文
作者: 王慧芳,曹靖,罗麟
关键词: 电力大数据,文本数据,数据挖掘,自然语言处理,电力设备,缺陷文本
来源: 浙江电力 2019年03期
年度: 2019
分类: 工程科技Ⅱ辑,信息科技
专业: 电力工业,计算机软件及计算机应用,自动化技术
单位: 浙江大学电气工程学院,国网浙江省电力有限公司舟山供电公司
基金: 国网浙江省电力有限公司群创项目(5211ZS180011)
分类号: TM76;TP391.1
DOI: 10.19585/j.zjdl.201903001
页码: 1-7
总页数: 7
文件大小: 208K
下载量: 767
本文来源: https://www.lunwen90.cn/article/8c547dee1dd7f4fd023ede95.html