导读:本文包含了检测和密写分析论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:自然语言,文本,论文。
检测和密写分析论文文献综述
武睿峰[1](2014)在《自然语言密写分析及密写量检测》一文中研究指出文本密写是在互联网上进行隐蔽通信的一种重要方式,自然语言密写作为文本密写的重要分支,越来越受到人们的广泛关注和深入研究。然而近些年,随着自然语言密写技术的逐渐成熟,一些不法分子将该项技术作为他们的犯罪工具,在互联网上非法传播危害国家和公共安全的信息,成为我国公共安全事业和国防事业的隐患,因此,针对自然语言密写技术的密写分析刻不容缓!自然语言密写分析是一项用来检测文本中是否包含秘密信息的技术,该项技术的研究不仅能够有效监控网络信息的传播,而且能够不断促进现有密写技术的发展。目前针对自然语言密写分析的研究尚不算多,而且研究的深度也非常有限,对含密文本知之甚少,无法满足实际应用的需求,也难以发挥对现有技术的促进作用。本文从统计学角度出发,提出了自然语言密写分析模型和密写量检测模型,不仅能够检测待测文本中是否含有秘密信息,而且能够对含密文本中秘密信息的多少进行预估并计算密写量安全上界,推动了自然语言密写技术的进一步发展。本文的具体研究内容有:1)提出自然语言密写分析模型。该模型从统计学角度出发,将文本的特征替换率分布作为分类特征,从而对待测文本进行检测,判断其中是否含有秘密信息。本文从理论和实验两个角度验证了正常文本的特征替换率服从贝塔分布,而满嵌文本的特征替换率服从均值为0.5的正态分布。实验部分讨论了在自然语言密写分析模型中,文本长度和特征阈值分别对模型正确率的影响。2)提出自然语言密写量检测模型。本文从理论和实验两个方面证明了不同长度、不同特征阈值、不同密写量文本的特征替换率都服从贝塔分布和正态分布的混合分布,提出了自然语言密写量检测模型,使得密写分析技术对含密文本的认识更进一步。3)结合正常文本的贝塔分布模型和含密文本的混合分布模型,提出密写量安全上界计算模型。该模型分别利用贝塔分布和混合分布对正常文本和含密文本的特征替换率分布进行拟合,计算待测文本在某一密写量下的安全比,从而绘制密写量安全上界曲线。(本文来源于《西北大学》期刊2014-06-01)
检测和密写分析论文开题报告
检测和密写分析论文参考文献
[1].武睿峰.自然语言密写分析及密写量检测[D].西北大学.2014