导读:本文包含了电子邮件分类器论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:向量,电子邮件,人工免疫,模型,特征,垃圾邮件,空间。
电子邮件分类器论文文献综述
邵叶秦[1](2014)在《基于Hadoop平台的电子邮件分类》一文中研究指出为了从大量的电子邮件中检测垃圾邮件,提出了一个基于Hadoop平台的电子邮件分类方法。不同于传统的基于内容的垃圾邮件检测,通过在Map Reduce框架上统计分析邮件收发记录,提取邮件账号的行为特征。然后使用Map Reduce框架并行的实现随机森林分类器,并基于带有行为特征的样本训练分类器和分类邮件。实验结果表明,基于Hadoop平台的电子邮件分类方法大大提高了大规模电子邮件的分类效率。(本文来源于《电脑知识与技术》期刊2014年34期)
穆俊鹏,董魁锋,张明[2](2012)在《基于动态特征库的电子邮件分类的研究》一文中研究指出随着邮件分类技术的不断发展,为了对邮件进行更加有效的组织和管理,需要对不断变化的邮件进行动态特征提取,根据其动态特征对邮件进行分类。从邮件的动态特征方面入手,通过编写邮件客户端程序,利用中科院的ICTCLAS分词工具实现中文邮件的准确分词,利用改进的TF-IDF算法对邮件的特征权重进行计算,并利用WEKA挖掘工具进行结果的仿真实验。实验结果表明,利用邮件的动态特征来对邮件进行分类是切实可行的,且在一定程度上能够对邮件进行合理有效的分类。(本文来源于《计算机与现代化》期刊2012年07期)
石铁峰[3](2011)在《支持向量机在电子邮件分类中的应用研究》一文中研究指出在电子邮件分类的研究中,针对研究垃圾邮件识别问题,垃圾邮件问题日益严重,影响正常工作,受到研究人员的广泛关注。而电子邮件特征维数相当的高,使传统分类方法存在分类速度慢、正确率低的问题。为了加快电子邮件分类速度、提高分类的正确率,更好的过滤出垃圾邮件,提出一种基于支持向量机的电子邮件自动分类方法。采用互信息量法提取电子邮件关键词作为分类特征,选择最优的分类特征,加快分类速度,然后支持向量机模型对分类特征进行学习训练,建立最优电子邮件分类器模型,最后对电子邮件测试集进行分类。UCI垃圾邮件数据库进行仿真,支持向量机识别正确率远远高于神经网络,且分类速度明显加快,能够很好的把垃圾分类出来。支持向量机分类方法是一种有效的电子邮件分类方法,有利于清除拉圾邮件。(本文来源于《计算机仿真》期刊2011年08期)
秦晓倩[4](2010)在《免疫危险理论在电子邮件分类中的应用》一文中研究指出在对危险理论、人工免疫和云模型的研究基础上,提出了一种基于危险理论的电子邮件分类模型并对模型的框架和工作原理进行了详细的描述.实验证明该模型总体性能优于贝叶斯分类,能有效地识别出有害的非我,达到降低伪肯定率和伪否定率的目的.(本文来源于《江西师范大学学报(自然科学版)》期刊2010年02期)
秦晓倩[5](2010)在《危险理论在电子邮件分类中的应用》一文中研究指出提出了一种基于危险理论的电子邮件分类模型.该模型在对邮件进行分类之前,利用云模型对危险进行绑定,再由危险信号激活免疫响应.对比试验证明,与贝叶斯分类相比,模型中的算法具有更高的正确率.(本文来源于《华中师范大学学报(自然科学版)》期刊2010年01期)
周婷婷,慕德俊,袁源,周菁[6](2009)在《基于Adaboost的电子邮件分类算法》一文中研究指出提出基于Adaboost的电子邮件分类算法,通过不断修改训练样本的权值,自适应地改变训练样本分布,避免对训练样本的敏感性。实验表明,该算法能有效提高电子邮件分类的精度和召回率。(本文来源于《机电一体化》期刊2009年08期)
邓春燕,陶多秀,吕跃进[7](2009)在《粗糙集与决策树在电子邮件分类与过滤中的应用》一文中研究指出垃圾邮件的识别与过滤是目前研究的热点问题之一。而粗糙集是一种新的处理模糊和不确定性知识的数据分析工具,已被成功地应用到许多有关分类的领域。将粗糙集与决策树结合,提出一个基于RS-DT的邮件分类方案与模型,并进行了实验及结果分析。通过与朴素贝叶斯模型及SVM的比较,表明提出的基于RS-DT的模型可以降低把正常邮件错分为垃圾邮件的比率,提高过滤系统的自学习能力。(本文来源于《计算机工程与应用》期刊2009年16期)
曾超,吕钊,顾君忠[8](2008)在《基于概念向量空间模型的电子邮件分类》一文中研究指出提出了一个基于概念向量空间模型的电子邮件分类方法。在提取电子邮件特征向量时,以WordNet语言本体库为基础,以同义词集合概念代替词条,同时考虑同义词集合间的上下位关系,从而建立电子邮件的概念向量空间模型作为电子邮件的特征向量。使用TF*IWF*IWF方法对概念向量进行权值修正,最后通过简单向量距离分类方法来确定电子邮件的类别。实验结果表明,当训练集合数目有限时,该方法能够有效提高电子邮件的分类准确率。(本文来源于《计算机应用》期刊2008年12期)
曾超[9](2008)在《基于WordNet概念向量空间模型的电子邮件分类方法的研究与实现》一文中研究指出随着计算机技术、信息化程度的日益提高,尤其是互联网的日益普及,电子邮件因其快捷、经济等特点而逐渐成为人们普遍采用的一种通信手段。正因如此,电子邮件往往反映出社会当前的热点问题和公众的舆论焦点。然而电子邮件使用的越来越频繁,垃圾邮件、广告、群发消息等的泛滥,使得用户花费在处理邮件上的时间增多,也影响了人们对信息的整理和获取。倘若能将电子邮件进行分类,那么人们就可以准确、全面、迅速地获取到自己关心的内容,大大提高了工作效率,从而减少了人力、财力、物力等方面的损失。因此,电子邮件分类引起了许多学者的研究兴趣。现有的电子邮件分类技术可以分为基于统计、基于连结和基于规则的叁种方法。常用的基于统计的方法有Naive Bayes、KNN、类中心向量、回归模型、支持向量机、最大熵模型等。常用的基于连结的方法是人工神经网络。常用的基于规则的方法有决策树、关联规则等。这些分类方法存在一个共同的问题:都不考虑邮件文本中词与词之间的语义关系,然而现实的邮件文本中的用词往往是有关联的,比如:同义词、同义词集合间的上下位关系等,不考虑邮件文本中词与词之间的语义关系往往会出现向量空间的高维性,其结果是高维性会造成分类性能和分类精度的降低。为解决上述问题,本文提出了一种特征提取方法,即以WordNet本体库为基础,以同义词集合来代替词条,同时考虑同义词集合间的上下位关系,建立邮件文本的概念空间向量模型作为邮件文本的特征向量,使得在训练过程中能够提取出能作为类别特征的高层次信息。本文还设计了一种确定阀值的方法(百分比阀值确定法),可以通过调整阀值来满足不同的查全率和查准率。最后本文将提出的方法付诸实现,并通过试验证明了基于WordNet概念向量空间模型的电子邮件分类方法的有效性。本文提出的基于WordNet概念向量空间模型的电子邮件分类方法对现有的电子邮件分类方法进行了改进,并在分类性能和效率上获得了提升。这些结果使能够快速准确的获取有用的信息,从而大大提高了人们的工作效率。(本文来源于《华东师范大学》期刊2008-10-01)
李艳,范明[10](2008)在《基于基本显露模式的电子邮件分类与过滤技术》一文中研究指出垃圾邮件问题日益严重,受到研究人员的广泛关注.基于内容分类与过滤垃圾邮件是当前解决垃圾邮件问题的主流技术之一.本文对电子邮件内容做了深入的研究,提出了一种更适合垃圾邮件分类的新的特征提取方法,并将新的特征提取方法与基于essential emerging pattern(eEP)的分类算法CeEP相结合,应用于垃圾邮件检测,实现了一种基于eEP的电子邮件分类与过滤算法(thee-mail categorization and filtering technology based on eEP,ECFEP).实验表明,新的特征提取方法与CeEP分类算法的结合是一种十分高效的分类方法,算法ECFEP的分类效率均高于目前几种较好的分类算法.(本文来源于《南京大学学报(自然科学版)》期刊2008年05期)
电子邮件分类器论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着邮件分类技术的不断发展,为了对邮件进行更加有效的组织和管理,需要对不断变化的邮件进行动态特征提取,根据其动态特征对邮件进行分类。从邮件的动态特征方面入手,通过编写邮件客户端程序,利用中科院的ICTCLAS分词工具实现中文邮件的准确分词,利用改进的TF-IDF算法对邮件的特征权重进行计算,并利用WEKA挖掘工具进行结果的仿真实验。实验结果表明,利用邮件的动态特征来对邮件进行分类是切实可行的,且在一定程度上能够对邮件进行合理有效的分类。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
电子邮件分类器论文参考文献
[1].邵叶秦.基于Hadoop平台的电子邮件分类[J].电脑知识与技术.2014
[2].穆俊鹏,董魁锋,张明.基于动态特征库的电子邮件分类的研究[J].计算机与现代化.2012
[3].石铁峰.支持向量机在电子邮件分类中的应用研究[J].计算机仿真.2011
[4].秦晓倩.免疫危险理论在电子邮件分类中的应用[J].江西师范大学学报(自然科学版).2010
[5].秦晓倩.危险理论在电子邮件分类中的应用[J].华中师范大学学报(自然科学版).2010
[6].周婷婷,慕德俊,袁源,周菁.基于Adaboost的电子邮件分类算法[J].机电一体化.2009
[7].邓春燕,陶多秀,吕跃进.粗糙集与决策树在电子邮件分类与过滤中的应用[J].计算机工程与应用.2009
[8].曾超,吕钊,顾君忠.基于概念向量空间模型的电子邮件分类[J].计算机应用.2008
[9].曾超.基于WordNet概念向量空间模型的电子邮件分类方法的研究与实现[D].华东师范大学.2008
[10].李艳,范明.基于基本显露模式的电子邮件分类与过滤技术[J].南京大学学报(自然科学版).2008