本文的主要研究目的是探究文本挖掘技术在电力数据中的应用场景,通过对电力设备运行过程中累计的缺陷数据进行分析应用,实现缺陷处理措施的自动推荐,以提升检修消缺的效率,降低工单化过程的时间成本。本文首先构建了电力设备专业词库,词库来源主要包含电力行业常用词汇、南方电网设备类别词汇和缺陷数据特征词汇。其次对非结构化的缺陷文本数据,如:缺陷表象、缺陷原因及缺陷类型等数据,结合已构建的专业词库进行分词,提取出其中的关键字、并对关键程度进行排序。最后通过Simhash算法与汉明距离的计算在缺陷数据库中查询层发生过的相似度最高的缺陷,推荐其处理措施作为本条缺陷的参考。本文应用上述方法,成功实现了输入缺陷处理措施的推荐,且根据专家判断该措施可以实现这类缺陷的消缺。
类型: 期刊论文
作者: 曹铁男,王英洁
关键词: 电力数据,文本挖掘,缺陷文本,汉明距离,推荐算法
来源: 电力大数据 2019年09期
年度: 2019
分类: 工程科技Ⅱ辑,信息科技
专业: 电力工业,计算机软件及计算机应用
单位: 南方电网科学研究院有限责任公司
基金: 中国南方电网有限责任公司科技项目《基于多维度数据的设备运维指挥技术支持研究》资助(ZBKJXM20180033)
分类号: TM507;TP391.1
DOI: 10.19317/j.cnki.1008-083x.2019.09.002
页码: 8-13
总页数: 6
文件大小: 1487K
下载量: 72
本文来源: https://www.lunwen90.cn/article/0bbe0b2b7df737b89507f6dd.html