论文摘要
针对结构化程度差、表达形式各异的文本数据,提出了一种基于文本信息的故障序列模式挖掘算法,用于发掘故障之间的时序关系。为从文本记录的故障信息中挖掘故障规律,首先将文本信息向量化,对故障文本信息进行相似度衡量,将表达相同意义的故障归为一类。在此基础上根据故障特性,提出最大窗口阈值、最小共现度阈值的概念,构建故障序列模式挖掘算法框架。最后对某型飞机文本故障信息进行序列模式挖掘,找出了正确的故障序列关系。实例验证了所提算法是正确有效的。
论文目录
文章来源
类型: 期刊论文
作者: 常文兵,苑星龙,周晟瀚,李磊
关键词: 序列模型,数据挖掘,文本相似度,飞机故障,文本挖掘
来源: 计算机应用研究 2019年09期
年度: 2019
分类: 信息科技,工程科技Ⅱ辑
专业: 航空航天科学与工程,计算机软件及计算机应用
单位: 北京航空航天大学可靠性与系统工程学院
基金: 国家自然科学基金资助项目(71501007),航空科学基金资助项目,北航研究生教育发展基金资助项目
分类号: TP391.1;V267
DOI: 10.19734/j.issn.1001-3695.2018.02.0142
页码: 2643-2646+2685
总页数: 5
文件大小: 231K
下载量: 212