导读:本文包含了语义过滤论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语义,隐语,模型,文本,谓词,汉语,句法。
语义过滤论文文献综述
刘辉,万程峰,吴晓浩[1](2019)在《基于增量协同过滤和潜在语义分析的混合推荐算法》一文中研究指出为了解决传统新闻推荐系统定期更新推荐算法不能根据用户喜好的变化进而动态地调整推荐列表的问题,提出了一种混合推荐算法(IULSACF)。该算法包含了2个关键部分:基于项目的增量更新协同过滤算法和基于关键词频率的潜在语义分析算法。该混合推荐算法在基于项目的增量更新协同过滤模块中,通过对项目相似度列表增量更新来动态地调整推荐列表,并结合潜在语义分析算法来确保所推荐文章的相关性。实验结果表明,所提出的IULSACF算法在各项评价指标上均优于传统的推荐方法。(本文来源于《计算机工程与科学》期刊2019年11期)
王光,姜丽,董帅含,李丰[2](2019)在《融合本体语义与用户属性的协同过滤算法》一文中研究指出传统协同过滤推荐算法在处理海量数据时存在数据稀疏性和项目长尾效应,导致推荐精度较低。针对该问题,结合本体语义和用户属性,提出一种改进的协同过滤算法。利用本体计算项目之间的语义相似度,构建项目相似度矩阵,同时引入用户属性计算用户相似度矩阵。通过融合本体语义和用户属性形成用户-项目评分矩阵,并对该矩阵的预测评分进行加权处理,生成TOP-N推荐结果。实验结果表明,相比传统皮尔逊相似度计算协同过滤算法、基于本体语义的协同过滤算法和基于评分矩阵填充与用户兴趣的协同过滤算法,该算法的平均绝对误差较低,准确率较高,综合性能及新颖度较优。(本文来源于《计算机工程》期刊2019年10期)
曹春萍,武婷[3](2019)在《多主题下基于LSTM语义关联的长文本过滤研究》一文中研究指出现如今互联网上出现了很多评论性文章,这些文章字符数多,且包含较多与主题无关的信息,会影响后续的文本分析任务的性能。因此,针对传统的解决方案不能够对多主题长文本进行建模,以及现有的神经网络无法从相对较长的时间步长中捕获语义关联等问题,文中提出了一种结合单层神经网络和分层长短记忆网络的深度网络模型,并在长文本过滤任务中进行应用。该模型通过词语层LSTM网络获得句子内部词语之间的关系并得到具有语义的句向量,然后将句向量输入主题依赖度计算模型和句子层LSTM网络模型,进而得到句子与各主题类别的依赖度以及待过滤句子与其他句子之间的关联。最后,在从马蜂窝获取的游记数据集上进行的实验表明,该模型相比SVM、朴素贝叶斯、LSTM、Bi-LSTM等效果更好。(本文来源于《计算机技术与发展》期刊2019年11期)
李启序[4](2019)在《基于隐语义模型改进的协同过滤推荐算法》一文中研究指出为解决传统的协同过滤算法相似度计算不精确而导致的推荐召回率低的问题。通过LFM隐语义模型与协同过滤结合的方法研究了用户不相似度与用户平均兴趣程度对推荐召回率的影响,并且提出依据个人选择能力的个性化推荐策略。结果表明:该算法能够有效优化用户间的相似度,提高推荐结果的召回率。(本文来源于《信息通信》期刊2019年03期)
郑帅,齐向明[5](2018)在《基于多维语义空间的垃圾短信过滤算法》一文中研究指出随着移动电话的普及,垃圾短信问题已严重影响到了移动电话的正常使用,因此垃圾短信的治理越来越受到有关部门的重视。当前,垃圾短信的治理工作不断深入,垃圾短信监控拦截的准确性要求也越来越高,而传统的基于关键词匹配和流量监控的技术已经不能有效解决这一问题。通过对大量真实垃圾短信数据的分析和统计,提取数据中的语义概念,挖掘数据中的语义关系,通过分类、概括、聚集和联合,提出一种基于多维语义空间的垃圾短信过滤算法。经过试验表明,该算法可以有效的识别垃圾短信。(本文来源于《自动化技术与应用》期刊2018年07期)
龚成[6](2018)在《基于隐语义模型的动态协同过滤算法的研究》一文中研究指出推荐系统收集用户的行为历史数据,构造相关模型预测用户需求和兴趣,为用户过滤出有用的信息,为当前大数据时代的“信息过载”问题提供了解决方案。协作过滤是推荐系统中广泛使用的一种算法。它只需要“用户项目”之间的少量历史评分数据就能高效构建推荐系统预测用户的需求。然而,随着数据规模的扩大,数据类型丰富度的增加以及应用环境的多样性。数据稀疏性,可伸缩性,实时性等是目前协同过滤算法遇到的主要问题。本文针对协同过滤算法中的数据稀疏性和实时性问题进行了研究,对基于隐语义模型的协同过滤算法进行改进。主要工作体现在以下两个方面:第一,实时性一直是协同过滤算法研究中的主要问题,用户对项目的偏好会随时间发生变化,项目本身也会在不同时间段表现出不同概念。因此,对时间动态建模对于设计推荐系统或一般用户偏好模型是必不可少的。本文在传统的SVD++算法的基础上进行改进,对评分数据随时间变化规律进行建模,分别融入了用户偏好特征因子时间信息、用户时间偏置和项目时间偏置,在此基础上还加入了用户特征信息,提出了一种新的改进算法:SpecialTSVD++算法。本文改进的算法加强了数据与时间的联系,体现了推荐结果随时间的动态变化,提升了预测评分的准确度。第二,针对协同过滤算法存在的数据稀疏性问题,本文结合基于密度的主动学习策略和SpecialTSVD++算法,提出了ESpecialTSVD++算法,该算法通过为现有用户自动“添加”评分来降低评分矩阵的数据稀疏性。其方法将原有的矩阵拆分成密集型的子矩阵,子矩阵的评分数据都由评分较多的用户提供,再对子矩阵中的缺省值用SpecialTSVD++算法进行预测填充从而得到完整矩阵,最后将已经完整填充的子矩阵融合进原始矩阵中,提高了原始矩阵中的已知评分数量,使得原始数据更加丰富,推荐准确度得到提升。进一步本文在原本单层ESpecialTSVD++模型基础上提出了多层模型,多层的ESpecialTSVD++模型通过迭代式的训练学习解决了单层模型在预测数值较多时和原始模型数据偏差较大的问题。(本文来源于《北京工业大学》期刊2018-06-01)
杨彬彬[7](2018)在《基于多谓词语义框架的网络文本过滤技术研究》一文中研究指出互联网上存在庞大的文本信息数据,如何在良莠不齐的信息中查找有用信息或过滤无关信息成为一个关键课题,而文本过滤的关键,就是文本的相似度计算。传统的文本相似度计算大多是基于词频统计或关键字的计算方法,不能体现语义,导致文本相似度计算的准确率一直较低,近年来基于语义的信息过滤方式越来越受到关注。而已有的基于语义框架的文本相似度研究算法在进行句子或文本相似度计算时,忽略了长短语的文本相似度计算部分的重要性,无法对复杂语句进行处理,不能够很好的体现文本的语义,故过滤算法准确性较低。为了解决上述问题,本文提出了一种基于多谓词语义框架的网络文本过滤算法。算法主要内容包括:文本依存句法分析、语义框架填充、长短语文本处理、框架相似度计算。为了能更好的体现文本语义,语义框架填充时,除了考虑到语义框架的骨干元素(主谓宾)外,框架的组成还插入了状语,时间,地点,方式等元素。在处理长短语文本的相似度计算时,先利用依存句法分析将长短语构建成短语树,然后再利用层次分析法确定各层权值,结合不同层次的结点相似度后得出长短语文本相似度。对句子类、短篇类和长篇类文本进行相似度准确率对比实验后可以看到本算法的相似度计算达到了较高准确性。基于本文的算法,设计并实现了基于多谓词语义框架的网络文本过滤系统。(本文来源于《北方工业大学》期刊2018-05-10)
梅刚[8](2018)在《基于用户聚类和隐语义模型的协同过滤推荐研究》一文中研究指出由于科技的进步,互联网技术得到了飞速的提高,现如今我们生活在“信息过载”的时代,为了从海量数据中快速提取出我们需要的有用信息,需要一个智能体系来替我们做出选择,其能够帮我们从海量数据中筛选出有用信息,我们称这样一个系统为推荐系统;推荐系统的核心是推荐算法,并且在各推荐算法中,协同过滤推荐算法被我们所熟知并且经常被应用到工业上。但是协同过滤也存在其一些缺点,例如它存在“数据稀疏性”、扩展性等问题,本文在前人研究的基础之上,进一步研究如何缓解协同过滤推荐算法的这些问题。论文整体研究内容有:(1)基于粒子群算法改进k-means聚类;考虑到k-means聚类能够通过机器学习的方法将没有具体类别的数据进行自动聚类,分成对应的k个类簇的特点,本文引入了 k-means聚类来对推荐系统中的用户进行聚类,将属于同一类簇内的用户尽量分到同一类簇中,又考虑到k-means算法的聚类效果极易被初始中心点的位置所影响,故论文考虑借助具有快速探索全局最优值的粒子群算法来对k-means聚类算法进行改进。(2)将粒子群算法改进的k-means聚类算法应用到协同过滤推荐算法上:考虑到基于用户的协同过滤是在全部用户范围内研究这些用户之间的相似性,这使得基于用户的协同过滤推荐算法需要处理的数据十分庞大,从而造成了基于内存的协同过滤推荐所存在的扩展性问题,为了缓解这一问题,将粒子群算法改进后的k-mmeans聚类算法加入到协同过滤推荐当中,对用户进行聚类,让计算相似用户步骤的计算范围缩小到用户所属聚类簇内的用户,因此能够减小算法处理的计算量,使得算法推荐的速度得到提高,而且属于同一类簇内的用户是非常相似的,故该改进算法的推荐精准度也有所提高。(3)提出了基于隐语义模型和用户聚类的协同过滤推荐算法,在基于粒子群算法改进k-means聚类的协同过滤推荐算法的前提下,引入了隐语义模型,考虑到其可以利用降维技术很好的预测用户-项目评分矩阵的空缺值,从而将原始稀疏的用户-项目评分矩阵较可靠的还原成稠密的用户-项目评分矩阵,故将其引入,并通过改进后的k-mmeans聚类算法对稠密的用户-项目评分矩阵中的用户进行聚类,提高了聚类的准确度,并且推荐算法在研究用户间的相似性时,将计算范围从全部用户缩小到对应的类簇中。通过系统的仿真实验结果验证了本文中提出的改进后的推荐算法较之前的粒子群改进k-means聚类的推荐算法精准度要好。(本文来源于《海南大学》期刊2018-05-01)
张苗苗,刘明童,张玉洁,徐金安,陈钰枫[9](2018)在《融合Gate过滤机制与深度Bi-LSTM-CRF的汉语语义角色标注》一文中研究指出语义角色标注的传统方法采用基于句法特征的统计机器学习方法。由于依存句法可以表示词语之间的语义关系,故在语义角色标注中取得了较好的性能;但该方法存在特征抽取过程繁琐,难以捕捉句子中长距离依赖等问题。随着深度学习的兴起,研究者将基于双向长短时记忆(Bidirectional Long Short-Term Memory,Bi-LSTM)神经网络模型用于语义角色标注。该模型可以自动学习特征,并对词与词之间的远距离依赖关系进行有效建模。本文提出融合Bi-LSTM-CRF模型与依存句法特征的方法,并且引入Gate过滤机制对词向量表示进行调整,以达到利用句法特征提高语义角色标注精度的同时,规避特征工程的繁琐。CPB上的实验结果表明,利用本文所提方法的汉语语义角色标注的F1值达到79.53%,比前人的方法有了较为显着的提升。(本文来源于《情报工程》期刊2018年02期)
魏巍,郑杜[10](2018)在《融合统计学习和语义过滤的ADR信号抽取模型构建研究》一文中研究指出[目的 /意义]社交媒体的出现为医疗健康数据的收集提供了新的途径,应用自然语言处理技术从社交媒体中抽取患者报告的ADR(Adverse Drug Reaction,药物不良反应)信号对于改善药物不良反应监测的临床和科学知识具有很大的潜力。然而,从社会媒体中提取患者报告的ADR信号仍然面临重大挑战。为此,开发一个利用高级自然语言处理技术从健康主题社交媒体中抽取ADR信号的研究模型。[方法 /过程]该模型首先采用基于多词典源匹配的方法,从嘈杂的社交媒体中识别医学实体;然后采用最短依存路径核函数为基础的统计学习方法提取药物不良事件;并利用药品安全数据库的语义知识过滤药物的治疗和适用症信息以及否定的药物不良事件;最后,对报告源进行分类剔除传闻等噪音信息。[结果 /结论]通过收集糖尿病论坛上的数据对模型的有效性进行验证,结果显示该模型的每一部分都有助于其整体性能的提升。(本文来源于《图书情报工作》期刊2018年05期)
语义过滤论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
传统协同过滤推荐算法在处理海量数据时存在数据稀疏性和项目长尾效应,导致推荐精度较低。针对该问题,结合本体语义和用户属性,提出一种改进的协同过滤算法。利用本体计算项目之间的语义相似度,构建项目相似度矩阵,同时引入用户属性计算用户相似度矩阵。通过融合本体语义和用户属性形成用户-项目评分矩阵,并对该矩阵的预测评分进行加权处理,生成TOP-N推荐结果。实验结果表明,相比传统皮尔逊相似度计算协同过滤算法、基于本体语义的协同过滤算法和基于评分矩阵填充与用户兴趣的协同过滤算法,该算法的平均绝对误差较低,准确率较高,综合性能及新颖度较优。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语义过滤论文参考文献
[1].刘辉,万程峰,吴晓浩.基于增量协同过滤和潜在语义分析的混合推荐算法[J].计算机工程与科学.2019
[2].王光,姜丽,董帅含,李丰.融合本体语义与用户属性的协同过滤算法[J].计算机工程.2019
[3].曹春萍,武婷.多主题下基于LSTM语义关联的长文本过滤研究[J].计算机技术与发展.2019
[4].李启序.基于隐语义模型改进的协同过滤推荐算法[J].信息通信.2019
[5].郑帅,齐向明.基于多维语义空间的垃圾短信过滤算法[J].自动化技术与应用.2018
[6].龚成.基于隐语义模型的动态协同过滤算法的研究[D].北京工业大学.2018
[7].杨彬彬.基于多谓词语义框架的网络文本过滤技术研究[D].北方工业大学.2018
[8].梅刚.基于用户聚类和隐语义模型的协同过滤推荐研究[D].海南大学.2018
[9].张苗苗,刘明童,张玉洁,徐金安,陈钰枫.融合Gate过滤机制与深度Bi-LSTM-CRF的汉语语义角色标注[J].情报工程.2018
[10].魏巍,郑杜.融合统计学习和语义过滤的ADR信号抽取模型构建研究[J].图书情报工作.2018