基于文本分析的故障序列模式挖掘算法

基于文本分析的故障序列模式挖掘算法

论文摘要

针对结构化程度差、表达形式各异的文本数据,提出了一种基于文本信息的故障序列模式挖掘算法,用于发掘故障之间的时序关系。为从文本记录的故障信息中挖掘故障规律,首先将文本信息向量化,对故障文本信息进行相似度衡量,将表达相同意义的故障归为一类。在此基础上根据故障特性,提出最大窗口阈值、最小共现度阈值的概念,构建故障序列模式挖掘算法框架。最后对某型飞机文本故障信息进行序列模式挖掘,找出了正确的故障序列关系。实例验证了所提算法是正确有效的。

论文目录

  • 0 引言
  • 1 研究方法
  •   1.1 相关概念与定义
  •   1.2 文本相似度衡量模型
  •     1.2.1 文本预处理
  •     1.2.2 文本向量化
  •     1.2.3 相似度计算
  •   1.3 算法流程
  • 2 算法构建
  •   2.1 频繁事件集挖掘
  •     2.1.1 算法描述
  •     2.1.2 算法流程
  •   2.2 序列模式挖掘
  •     2.2.1 算法描述
  •     2.2.2 算法流程
  • 3 实例验证
  •   3.1 文本预处理
  •   3.2 计算故障文本相似度
  •   3.3 故障频繁项目集挖掘
  •   3.4 序列模式挖掘
  • 4 结束语
  • 文章来源

    类型: 期刊论文

    作者: 常文兵,苑星龙,周晟瀚,李磊

    关键词: 序列模型,数据挖掘,文本相似度,飞机故障,文本挖掘

    来源: 计算机应用研究 2019年09期

    年度: 2019

    分类: 信息科技,工程科技Ⅱ辑

    专业: 航空航天科学与工程,计算机软件及计算机应用

    单位: 北京航空航天大学可靠性与系统工程学院

    基金: 国家自然科学基金资助项目(71501007),航空科学基金资助项目,北航研究生教育发展基金资助项目

    分类号: TP391.1;V267

    DOI: 10.19734/j.issn.1001-3695.2018.02.0142

    页码: 2643-2646+2685

    总页数: 5

    文件大小: 231K

    下载量: 212

    相关论文文献

    标签:;  ;  ;  ;  ;  

    基于文本分析的故障序列模式挖掘算法
    下载Doc文档

    猜你喜欢