导读:本文包含了互信息规则论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:规则,近邻,短语,算法,粗糙,模型,数据挖掘。
互信息规则论文文献综述
瞿学新,朱全银,严云洋,李翔[1](2018)在《基于互信息和关联规则的文本特征提取方法》一文中研究指出为改善传统互信息方法在网页分类中的效果,对互信息方法在词频、类间分布以及低信息量特征方面进行改善,提出了一种基于互信息和关联规则的文本特征提取方法。改进了传统互信息方法,引进词频和类间平衡因子,从而避免互信息对低词频特征值放大;改进互信息特征提取后,计算低信息量特征与高信息量特征的关联规则,以置信度为概率将低信息特征替换为对应规则中的高信息量特征;将置换后的样本集再进行向量化。实验表明,该方法相比传统的互信息方法具有较好的分类性能,F1值平均提高了约6%。将该方法应用于网页分类中,结果显示改进后的互信息方法在网页分类中具有较好的性能。(本文来源于《淮阴工学院学报》期刊2018年03期)
谢霖铨,章恩[2](2014)在《以互信息为度量的一种规则可视化》一文中研究指出概念格是一种有效的知识表示和知识发现的工具,已被成功应用于许多领域,然而在建格上大多是利用最小支持度以及置信度来进行约简操作,同时利用置信度来进行规则提取。提出以信息论的互信息来构造具有强关联规则的Hasse图,并利用互信息进行规则提取。(本文来源于《计算机工程与应用》期刊2014年17期)
周靖[3](2013)在《平均互信息和类别区分性修剪规则的KNN算法》一文中研究指出大规模的样本数量及其特征高维性影响着K最近邻(KNN)分类算法的分类性能。为此,提出一种具备降维、修剪机制的特征参数平均互信息和类别区分性的KNN改进算法AMI&CD-KNN。首先使用熵中平均互信息的概念,衡量特征参数体现类别特征信息的准确程度;然后采用特征参数相对类别的优势率及其在数据集中的分布概率描述类别区分性,用于体现特征参数提供类别信息量的大小;最后建立特征参数平均互信息和类别区分性的内在联系,设计样本修剪方法,从而达到在保证分类准确性的前提下,提高分类速度的目的。理论分析与仿真实验表明,与经典KNN及其他具备修剪机制的算法比较,提出的算法具有更高的分类泛化性。(本文来源于《计算机应用》期刊2013年02期)
刘乐乐,田卫东[4](2009)在《基于属性互信息熵的量化关联规则挖掘》一文中研究指出在量化关联规则挖掘中存在量化属性及其取值区间的组合爆炸问题,影响算法效率。提出算法BMIQAR,通过考察量化属性间互信息熵,找到具有强信息关系的属性集,从中得到频繁项集以产生规则。实验表明,由于在属性层进行了剪枝,因此缩减了搜索空间,提高了算法的性能,且能得到绝大多数置信度较高的规则。(本文来源于《计算机工程》期刊2009年14期)
商炳章,白清源[5](2008)在《基于互信息规则剪枝的关联文本分类》一文中研究指出传统的关联文本分类算法产生的规则数量巨大,若不对规则剪枝会影响分类效率,而采用以前的剪枝方法又会使分类精度出现不同程度的下降.为此提出以互信息的方法对每个类的规则进行剪枝,挑选出分类能力强的规则构成分类器,对待分类文本进行分类.经过这个方法剪枝后的规则数量大幅减少,且能取得比规则集未修剪过的分类器和采用以前剪枝方法的ARC-BC算法更好的分类效果,大量的实验表明此方法是有效的.(本文来源于《南京师范大学学报(工程技术版)》期刊2008年04期)
刘井莲,赵卫绩[6](2008)在《一种基于互信息的规则约简方法》一文中研究指出粗糙集理论的主要应用是属性约简和规则提取,但由于应用粗糙集理论提取出的规则未必都是最佳规则,因此,本文提出一种基于互信息的规则约简方法。对确定性规则进行优化,挖掘出最简规则集,最后通过实例分析验证了该方法可行性和有效性。(本文来源于《计算机与信息技术》期刊2008年05期)
高升,贾文举,王晓龙,姜亚学[7](2000)在《一个基于互信息的规则量化方法》一文中研究指出规则量化问题是基于规则与统计相结合的计算语言模型的关键性问题 .首先描述了一个基于规则与统计相结合的计算语言模型 ,从而引出了规则结合度的概念 ,并提出一种基于互信息的规则量化方法 .该方法既给出了一条规则的实用性的定量评价 ,又为基于规则与统计相结合的计算语言模型提供了一个重要的规则参量 .通过实验指出该方法对系统规则集的筛选与计算语言模型中规则与统计结合机制的优化的重要指导意义(本文来源于《计算机研究与发展》期刊2000年08期)
互信息规则论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
概念格是一种有效的知识表示和知识发现的工具,已被成功应用于许多领域,然而在建格上大多是利用最小支持度以及置信度来进行约简操作,同时利用置信度来进行规则提取。提出以信息论的互信息来构造具有强关联规则的Hasse图,并利用互信息进行规则提取。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
互信息规则论文参考文献
[1].瞿学新,朱全银,严云洋,李翔.基于互信息和关联规则的文本特征提取方法[J].淮阴工学院学报.2018
[2].谢霖铨,章恩.以互信息为度量的一种规则可视化[J].计算机工程与应用.2014
[3].周靖.平均互信息和类别区分性修剪规则的KNN算法[J].计算机应用.2013
[4].刘乐乐,田卫东.基于属性互信息熵的量化关联规则挖掘[J].计算机工程.2009
[5].商炳章,白清源.基于互信息规则剪枝的关联文本分类[J].南京师范大学学报(工程技术版).2008
[6].刘井莲,赵卫绩.一种基于互信息的规则约简方法[J].计算机与信息技术.2008
[7].高升,贾文举,王晓龙,姜亚学.一个基于互信息的规则量化方法[J].计算机研究与发展.2000