导读:本文包含了语义相似性论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:相似性,语义,模型,本体,递归,维吾尔,环境要素。
语义相似性论文文献综述
朱杰,游雄,夏青[1](2019)在《利用作战任务本体计算战场环境要素语义相似性》一文中研究指出如何根据作战任务需求为用户快速提供有针对性的有效数据,是战场环境数据保障实现主动服务必须解决的问题之一。针对作战任务与战场环境数据关联关系复杂,目前方法上存在缺少数据匹配语义表达、语义相关度及不同要素类语义权重量化等问题,提出了一种基于作战任务本体的战场环境要素语义相似性计算方法。利用本体方法确定作战任务与战场环境数据在概念语义上的逻辑关系,按照作战任务语义相关度划分战场环境要素,采用规则与案例相结合的推理技术建立语义相似性计算,从而量化战场环境要素实体语义权重。实验结果表明,该方法能有效提升战场环境数据组织的效率与精度。(本文来源于《武汉大学学报(信息科学版)》期刊2019年09期)
王玲婷[2](2019)在《探索大脑和计算机中语义表征的相似性:一项EEG研究》一文中研究指出人类可以通过经验或阅读文本两种方式习得语义表征,这些语义学习的经验也改变了我们的语义神经系统。而在计算机科学中,自然语言处理模型可以从大型文本语料库中学习语义,并在高维向量空间中表征为向量。计算机语言模型的语义表征是否可以预测人脑提取语义时的神经活动?如果能,那么计算机语义表征与人脑语义表征存在相似性,哪个向量空间的语义表征模型更接近于“基本事实(ground truth)”——人脑中的语义表征?为了探究这些问题,首先,我们选择了叁个计算机语义模型,每个模型的词向量可以计算一个词对的相对语义距离,作为模型语义表征的指标。然后,进行脑电语义启动实验获得脑电N400成分——一个表征心理语义距离的指标,可以提供一个时间窗口来观察人的语义表征和计算机模型语义表征之间的关系。最后,我们检测了这两个指标之间的相关性。研究结果表明,计算机模型的语义表征可以预测N400成分,其与人脑的语义表征存在相似性。不同的计算机语言模型在N400的时间窗里与脑电数据呈现不同的相似模式,进一步的分析发现,GloVe模型的预测表现最佳。本研究将两个不同的复杂系统联系起来,建立了一种评估复杂系统间表征相似性的新框架。(本文来源于《华东师范大学》期刊2019-05-06)
祝火乐[3](2019)在《基于拓扑及语义相似性的生物网络疾病模块挖掘算法研究》一文中研究指出识别生物网络中的疾病模块已经引起很大关注,因为准确的预测疾病模块有助于理解复杂疾病的发病机理并促进疾病诊断和治疗。当前,研究人类蛋白质之间的相互作用关系逐渐成为揭示复杂疾病背后作用机理最为有效的方法之一,但现有的蛋白质相互作用关系仍存在着大量缺失以及错误。于是许多疾病模块挖掘算法都尝试使用其他一些生物学或拓扑学数据来调整蛋白质网络以进行疾病模块挖掘,但这些方法都没有同时考虑到蛋白质网络中相互作用缺失和错误的问题。因此,本文通过有效的结合多种生物数据资源,从而可以更加准确的识别疾病模块。本文的主要研究工作如下:(1)本章提出了基于拓扑和语义相似性在蛋白质网络上挖掘疾病模块算法(IDMCSS)。首先,利用候选蛋白质与疾病蛋白质之间的拓扑相似性和语义相似性增加和删除一些可能缺失和错误的蛋白质相互作用关系,对现有蛋白质网络结构进行调整。然后,在调整过后的蛋白质网络上扩充拓扑相似性和语义相似性之和最大的候选蛋白质,直到扩充的候选蛋白质集合不再显着富集生物信息为止。蛋白质网络调整策略贯穿整个算法,每次扩充候选疾病蛋白质之前都要利用候选蛋白质与疾病蛋白质之间的拓扑相似性和语义相似性对网络局部结构进行调整,使得本文提出算法在存在大量假阳性和假阴性数据的蛋白质网络上能够搜索到理想的疾病模块。在实验部分,将本文提出的IDMCSS与其他多种算法在哮喘疾病数据集上进行了比较和分析,在哮喘数据集上的实验结果证明了IDMCSS算法的有效性。(2)本章提出了基于拓扑、语义以及表型相似性在双层网络上挖掘疾病模块算法(IDMCSPS)。本文在工作IDMCSS的基础上,利用构建的蛋白质-表型网络代替蛋白质相互作用网络,有效的使用蛋白质相互作用、表型相似性以及蛋白质表型关联数据挖掘疾病模块。首先,构建蛋白质-表型双层网络。然后,利用协同过滤方法增加蛋白质-表型关系,同时利用拓扑相似性和语义相似性对现有蛋白质网络结构进行调整。最后,在调整过后的双层网络上计算候选蛋白质与疾病蛋白质之间的拓扑相似性和语义相似性以及候选蛋白质与所研究疾病相似的疾病之间的表型相似性,扩充拓扑、语义以及表型相似性之和最大的候选蛋白质,直到扩充的候选蛋白质集合不再显着富集生物信息为止。双层网络调整策略贯穿整个算法,每次扩充候选疾病蛋白质之前对双层网络进行调整。在实验部分,将算法IDMCSPS与多种疾病模块挖掘算法在哮喘疾病数据集上进行了比较和分析。实验结果表明IDMCSPS算法挖掘得到的疾病模块中显着富集哮喘生物信息,并且与IDMCSS算法挖掘的疾病模块相比,有更多离散的已知疾病蛋白质被扩充到疾病模块当中,因为现有蛋白质网络中存在大量相互作用关系的错误和缺失,导致一些疾病蛋白质的拓扑相似性比较低,而随着表型相似性数据的融入,提高了这部分疾病蛋白质的排名。(本文来源于《安徽大学》期刊2019-05-01)
周亮[4](2018)在《基于语义相似性关联特征提取的大数据挖掘技术》一文中研究指出为了提高武器装备信息管理数据库中的大数据挖掘能力,提出一种基于语义相似性关联特征提取的大数据挖掘技术。构建武器装备信息管理数据分布式结构模型,采用关联规则信息融合方法进行大数据分块结构匹配处理,结合自适应回归分析方法进行武器装备信息管理数据的关联特征提取,对提取的装备管理数据的关联规则特征量进行属性分类识别,计算大数据的语义相似性关联特征量,结合判决统计分析方法进行大数据的融合调度,采用语义划分方法进行大数据模糊聚类处理,实现武器装备信息管理数据库中的大数据自适应挖掘。仿真结果表明,采用该方法进行大数据挖掘的准确性较高,对冗余数据的抗干扰能力较强,提高了武器装备大数据的自适应挖掘和检索能力。(本文来源于《智能计算机与应用》期刊2018年05期)
郭维威[5](2018)在《基于WEB的领域本体语义相似性度量方法研究》一文中研究指出语义相似性度量在信息检索和自然语言处理领域中起到重要的作用,本文分析了传统语义相似性度量的方法,针对现实领域本体中WEB搜索引擎检索信息的方式,提出了一种基于WEB的领域本体语义相似性度量方法,通过对该方法的理论验证和分析,所提出的方法可以有效的提高语义相似性的计算精度。(本文来源于《山东工业技术》期刊2018年15期)
潘现伟,崔雷[6](2018)在《基于内容和语义相似性的文献网络构建方法的比较与评价》一文中研究指出网络分析法用于文献领域的研究已是由来已久,从最初基于文献引用和共现的间接关系构建文献相似性网络~([1-5])到目前基于文献内容特征的直接关系构建文献相似性网络,文献相似性网络研究在概念和算法上已逐渐形成体系。基于文献内容特征的直接关系构建文献相似性网络的主流算法是内容相似性算法(Content Similarity Algorithm,CSA)和语义相似性算法(本文来源于《中国图书馆学会年会论文集(2017年卷)》期刊2018-05-31)
张莹,亚森·艾则孜,吴顺祥[7](2019)在《利用N-gram和语义分析的维吾尔语文本相似性检测方法》一文中研究指出为了实现维吾尔语文本的相似性检测,提出一种基于N-gram和语义分析的相似性检测方法。根据维吾尔语单词特征,采用了N-gram统计模型来获得词语,并根据词语在文本中的出现频率来构建词语—文本关系矩阵,并作为文本模型。采用了潜在语义分析(LSA)来获得词语及其文本之间的隐藏关联,以此解决维吾尔语词义模糊的问题,并获得准确的相似度。在包含重组和同义词替换的剽窃文本集上进行实验,结果表明该方法能够准确有效地检测出相似性。(本文来源于《计算机应用研究》期刊2019年09期)
杨文静,靳玉乐,邱江,张庆林[8](2018)在《问题先导下语义相似性和原型难度对原型启发的影响》一文中研究指出采用现实生活中的科学发明事例,通过两个研究探讨了问题先导下的原型启发促发顿悟的机制。实验1采用简单原型材料,利用"先问题"范式探讨了问题先导下的原型启发促发顿悟的关键认知过程,结果发现问题激活率可以解释问题解决正确率89.3%的变异。实验2采用3种不同难度的原型材料,用"先问题"范式和被试自我报告问题和原型中关键词的方式探讨问题自动激活的机制。结果发现原型和问题关键词的提取对问题激活率有显着影响,而原型和问题关键词之间的语义相似性与问题激活率显着相关。研究表明,问题激活是现实生活中广泛存在的问题先导下的原型启发促发顿悟的关键认知过程。原型的特征性功能和问题的需求性功能之间的语义相似性是问题自动激活的机制。(本文来源于《心理学报》期刊2018年03期)
袁姗姗,张嘉容,赵丽波[9](2018)在《语义相似性对单词学习的影响》一文中研究指出本研究考察了集中学习的单词之间的语义相似性对单词学习效果的影响。与前人研究不同,本研究采用了语义和语音均需要从无到有习得的人工单词,并侧重对语音学习效果的考察。实验一中两组被试分别在高语义相似性和低语义相似性条件下学习了若干语义-语音的配对。命名测验和词干补全测验的成绩均显示,低语义相似组的成绩显着高于高语义相似组。实验二采用了被试内设计,并调换了两个测验的顺序,结果与实验一相同。本研究的结果为语义相似性在单词学习中的阻碍作用提供了新证据,并为语言教学提供了有益的启示。(本文来源于《现代外语》期刊2018年02期)
刘畅,周向东,施伯乐[10](2018)在《图像语义相似性网络的文本描述方法》一文中研究指出图像的文本化描述解决图像理解的高级语义问题。由于存在语义鸿沟,导致自动生成的文本与图像内容有较大差异,浅层神经网络构建的语言模型很难生成通顺的语句。为此,提出图像语义相似性神经网络,在递归神经网络的输出层之后添加全连接网络,引入图像间的视觉相似性和文本相似性信息,从而在预测图像的文本描述时保持相似图像的有效语义信息。增加栈式隐层和普通隐层的深度来提高语言模型的学习能力,最终得到接近自然语言的文本。实验结果表明,该方法在BLEU、ROUGE、METEOR和CIDEr等评价指标上均取得较好的效果,能够生成符合图像内容的高质量文本描述。(本文来源于《计算机应用与软件》期刊2018年01期)
语义相似性论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
人类可以通过经验或阅读文本两种方式习得语义表征,这些语义学习的经验也改变了我们的语义神经系统。而在计算机科学中,自然语言处理模型可以从大型文本语料库中学习语义,并在高维向量空间中表征为向量。计算机语言模型的语义表征是否可以预测人脑提取语义时的神经活动?如果能,那么计算机语义表征与人脑语义表征存在相似性,哪个向量空间的语义表征模型更接近于“基本事实(ground truth)”——人脑中的语义表征?为了探究这些问题,首先,我们选择了叁个计算机语义模型,每个模型的词向量可以计算一个词对的相对语义距离,作为模型语义表征的指标。然后,进行脑电语义启动实验获得脑电N400成分——一个表征心理语义距离的指标,可以提供一个时间窗口来观察人的语义表征和计算机模型语义表征之间的关系。最后,我们检测了这两个指标之间的相关性。研究结果表明,计算机模型的语义表征可以预测N400成分,其与人脑的语义表征存在相似性。不同的计算机语言模型在N400的时间窗里与脑电数据呈现不同的相似模式,进一步的分析发现,GloVe模型的预测表现最佳。本研究将两个不同的复杂系统联系起来,建立了一种评估复杂系统间表征相似性的新框架。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语义相似性论文参考文献
[1].朱杰,游雄,夏青.利用作战任务本体计算战场环境要素语义相似性[J].武汉大学学报(信息科学版).2019
[2].王玲婷.探索大脑和计算机中语义表征的相似性:一项EEG研究[D].华东师范大学.2019
[3].祝火乐.基于拓扑及语义相似性的生物网络疾病模块挖掘算法研究[D].安徽大学.2019
[4].周亮.基于语义相似性关联特征提取的大数据挖掘技术[J].智能计算机与应用.2018
[5].郭维威.基于WEB的领域本体语义相似性度量方法研究[J].山东工业技术.2018
[6].潘现伟,崔雷.基于内容和语义相似性的文献网络构建方法的比较与评价[C].中国图书馆学会年会论文集(2017年卷).2018
[7].张莹,亚森·艾则孜,吴顺祥.利用N-gram和语义分析的维吾尔语文本相似性检测方法[J].计算机应用研究.2019
[8].杨文静,靳玉乐,邱江,张庆林.问题先导下语义相似性和原型难度对原型启发的影响[J].心理学报.2018
[9].袁姗姗,张嘉容,赵丽波.语义相似性对单词学习的影响[J].现代外语.2018
[10].刘畅,周向东,施伯乐.图像语义相似性网络的文本描述方法[J].计算机应用与软件.2018