导读:本文包含了文本矩阵论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:矩阵,文本,在线,汉字,分解,笔画,卷积。
文本矩阵论文文献综述
李卫疆,伊靖[1](2019)在《基于扩展特征矩阵和双层卷积神经网络的微博文本情感分类》一文中研究指出针对现有深度学习方法在中文微博短文本分类任务中存在的数据稀疏、忽略微博文本中的表情和词语特征等问题,提出一种基于扩展特征矩阵和双层卷积神经网络的微博文本情感分类算法Dual-CNN。针对微博用户常用的微博表情和多种词语特征,建立扩展特征矩阵;将融合扩展特征矩阵后的词向量,分别使用不同的文本编码方式输入卷积神经网络的两层,得到情感分类结果。通过在COAE2014任务4上的对比实验证明,Dual-CNN算法取得了93.35%的分类准确率。相比于单层卷积神经网络算法和SVM等传统机器学习算法,Dual-CNN模型具有明显的优势。(本文来源于《计算机应用与软件》期刊2019年12期)
贺超波,汤庸,张琼,刘双印,刘海[2](2019)在《基于增量式鲁棒非负矩阵分解的短文本在线聚类》一文中研究指出对社会化媒体产生的大量短文本进行聚类分析具有重要的应用价值,但短文本往往具有噪音数据多、增长迅速且数据量大的特点,导致现有相关算法难于有效处理.提出一种基于增量式鲁棒非负矩阵分解的短文本在线聚类算法STOCIRNMF.STOCIRNMF基于非负矩阵分解构建短文本聚类模型,通过l_(2,1)范数设计模型的优化求解目标函数提高鲁棒性,同时应用增量式迭代更新规则实现短文本的在线聚类.在搜狐新闻标题和微博短文本数据集上进行相关实验,结果表明STOCIRNMF不仅比现有代表性算法具有更好的聚类性能,而且能够有效对微博话题进行在线检测.(本文来源于《电子学报》期刊2019年05期)
于翔美,王开西[3](2019)在《基于汉字笔画编码矩阵的文本隐写方法》一文中研究指出现有的文本隐写方法在隐藏容量和隐写成功率方面存在不足,针对此问题提出了一种基于汉字笔画的文本隐写方法,利用汉字笔画矩阵和编码矩阵将汉字笔画与"0"、"1"编码段进行映射,按照秘密消息的二进制编码段的顺序,找到对应的汉字笔画并按顺序组合成汉字,找到包含这些汉字的文本作为载体,对携带秘密信息的汉字在文本载体中的位置进行编码,编码后的位置信息放置在URL中,发送给接收方供其提取秘密消息。本方法不仅有较好的隐写成功率,而且在隐藏容量方面也有较大优势。(本文来源于《青岛大学学报(自然科学版)》期刊2019年02期)
黄建一,李建江,王铮,方明哲[4](2019)在《基于上下文相似度矩阵的Single -Pass短文本聚类》一文中研究指出在线社交网络已经成为人们信息交流的重要渠道和载体,形成了与现实世界交互影响的虚拟社会。众多的网络事件通过社交网络进行快速传播,可以在短时间内成为舆论热点,而负面事件会对国家安全和社会稳定造成冲击,从而引发一系列的社会问题。因此,挖掘社交网络中蕴含的热点信息,无论是从舆论监督方面还是舆情预警方面都具有重要的意义。文本聚类是挖掘热点信息的一种重要方法,然而,使用传统长文本聚类算法处理海量短文本时准确率将变低,复杂度急剧增长,从而导致耗时过长;现有的短文本聚类算法的准确率偏低、耗时过长。文中基于文本关键词,提出了结合上下文和相似度矩阵的关联模型,从而判断当前文本与上一文本的关联性。此外,根据该关联模型对文本关键词权重进行调整,以进一步降低噪声。最后,在Hadoop平台上实现了分布式的短文本聚类算法。与K-MEANS,SP-NN,SP-WC算法的比较实验验证了所提算法在话题挖掘速度、准确率和召回率等方面都具有更好的效果。(本文来源于《计算机科学》期刊2019年04期)
张文硕,许艳春,谢术芳[5](2019)在《基于文本挖掘的自动非负矩阵分解的层次聚类方法》一文中研究指出随着网络信息技术的飞速发展,人们在如此庞大的信息中如何找到有用的信息成为一个问题,文本挖掘技术在这样的背景下应运而生。为解决层次关系的文字资料的文本挖掘,文章提出一种新自动非负矩阵分解的层次聚类方法。实验结果对实际数据集进行了比较,结果表明,该方法对于所有情况的平均估计要优于其他传统方法,对于具有层次关系的文字资料的数据挖掘是一种较好的方法。(本文来源于《江苏科技信息》期刊2019年04期)
耿静静[6](2018)在《基于文本信息的归纳矩阵补全算法研究及应用》一文中研究指出随着大数据技术的发展,我们进入了信息社会,信息数据量以指数级的形式增长,尤其是电子文本信息。文本不仅是获取知识的重要媒介,也是科学研究的基础,文本信息在一定程度上反映了人类社会历史阶段的知识水平。但文本中存在大量暗含或非直接的信息,研究中往往容易忽视这些信息。如何在海量的数据中挖掘并恢复丢失的文本信息已显得至关重要,新兴矩阵补全技术已为解决上述问题提供了方法。但当数据规模较大、关系矩阵特别稀疏且标记数量有限时,矩阵补全技术不能很好的恢复样本与标记之间的关系,而且传统的机器学习方法往往只能利用样本空间的信息,而忽略标记空间的特征,归纳矩阵补全算法可以同时利用样本空间和标记空间的信息。本文在归纳矩阵补全技术的基础上提出了一种基于文本信息的归纳矩阵补全算法,利用文本挖掘技术提取文本信息,并加入样本与标记的特征向量,而且针对大量的文本信息提出了一种新的特征表示方法。本文的创新之处如下:(1)提出了一种文本特征表示方法:利用Word2vec工具提取特征,并结合多示例单示例化算法,实现一个样本用一个实数值特征向量描述。该方法利用文本信息解决了文本歧义性、难以结构化、特征表示不够全面等问题,而且表示的特征维度不高,避免了维度灾难。(2)提出了一种基于文本信息的归纳矩阵补全算法Word IMC,该算法将文本挖掘技术中的文本特征表示与归纳矩阵补全相结合,加入了样本与标记的特征空间,克服了传统矩阵补全中数据稀疏、类不平衡等问题。并在多个生物数据集上验证了特征表示以及Word IMC算法的优越性。(本文来源于《南京邮电大学》期刊2018-11-14)
胡小丽[7](2018)在《陶瓷行业博客文本矩阵的建立方法》一文中研究指出为了提高陶瓷行业聚类的精度,陶瓷信息词典的建立与博客文本矩阵建立方法尤为重要。通过在知名陶瓷网站中收集信息创建陶瓷信息词典,阐述了基于陶瓷信息词典提取博客文本中的陶瓷信息词的方法,以及陶瓷行业博客文本矩阵建立方法。(本文来源于《电脑与电信》期刊2018年09期)
刘梦娇[8](2018)在《众媒时代新媒体矩阵调查性报道的文本策略及其影响》一文中研究指出众媒时代背景下,新媒体矩阵传播是传统媒体的网络延伸。面对当前传统纸媒调查性报道大幅"缩水"的窘境,调查性报道在寻求新媒体渠道传播的过程中,注重新闻报道的文本策略,借助新媒体矩阵聚合受众的优势,扩大调查性报道的影响力。文章对《新京报》新媒体矩阵建设情况进行简要概括,以"爱心妈妈"李利娟报道为文本范例,从文本语言、文本结构、文本内容叁个角度理解,有关李利娟的报道是如何运用文本策略进行传播,并对其传播中带来的文本语言表述掺杂个人情感、文本结构缺乏有效意见支撑、文本内容关键信息交代模糊的问题,提出与之相对应的注意事项,即报道要警惕情感倾向,避免话语缺失,降低信任风险。(本文来源于《武汉交通职业学院学报》期刊2018年03期)
霍欢,刘亮[9](2019)在《一种在矩阵空间中识别文本蕴涵的动态交互网络》一文中研究指出针对文本蕴涵问题提出一种动态交互网络(dynamic interactive network,DIN)进行识别。不同于已有交互模型,DIN将两句词向量投射到二维矩阵空间中进行交互,然后利用输出矩阵为同时处理上下文信息和控制信息流动的GRU编码器生成动态权重。前者通过更高阶形式的信息交互挖掘深层逻辑片段,后者通过改变交互信息与上下文信息的结合模式帮助编码器有效区分两者的重要性差异。模型在SNLI测试集上获得了88. 0%的识别准确度,超过已有的最佳模型,且使用的训练参数仅为它的一半。(本文来源于《计算机应用研究》期刊2019年10期)
景永霞,王治和,苟和平[10](2018)在《基于矩阵奇异值分解的文本分类算法研究》一文中研究指出针对KNN文本分类算法在高维数据集上分类计算开销大、效率低的缺点,采用一种基于矩阵奇异值分解的文本特征向量降维方法实现向量降维的同时保留更多的分类信息.同时,采用信息增益的方式对原始文本特征词进行了初步筛选,过滤掉对分类系统几乎没有贡献的特征词,以克服文本特征维数增长所带来的奇异值分解计算开销过大的缺点.实验表明此方法能在保持分类精度的同时极大地降低分类计算开销.(本文来源于《西北师范大学学报(自然科学版)》期刊2018年03期)
文本矩阵论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
对社会化媒体产生的大量短文本进行聚类分析具有重要的应用价值,但短文本往往具有噪音数据多、增长迅速且数据量大的特点,导致现有相关算法难于有效处理.提出一种基于增量式鲁棒非负矩阵分解的短文本在线聚类算法STOCIRNMF.STOCIRNMF基于非负矩阵分解构建短文本聚类模型,通过l_(2,1)范数设计模型的优化求解目标函数提高鲁棒性,同时应用增量式迭代更新规则实现短文本的在线聚类.在搜狐新闻标题和微博短文本数据集上进行相关实验,结果表明STOCIRNMF不仅比现有代表性算法具有更好的聚类性能,而且能够有效对微博话题进行在线检测.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
文本矩阵论文参考文献
[1].李卫疆,伊靖.基于扩展特征矩阵和双层卷积神经网络的微博文本情感分类[J].计算机应用与软件.2019
[2].贺超波,汤庸,张琼,刘双印,刘海.基于增量式鲁棒非负矩阵分解的短文本在线聚类[J].电子学报.2019
[3].于翔美,王开西.基于汉字笔画编码矩阵的文本隐写方法[J].青岛大学学报(自然科学版).2019
[4].黄建一,李建江,王铮,方明哲.基于上下文相似度矩阵的Single-Pass短文本聚类[J].计算机科学.2019
[5].张文硕,许艳春,谢术芳.基于文本挖掘的自动非负矩阵分解的层次聚类方法[J].江苏科技信息.2019
[6].耿静静.基于文本信息的归纳矩阵补全算法研究及应用[D].南京邮电大学.2018
[7].胡小丽.陶瓷行业博客文本矩阵的建立方法[J].电脑与电信.2018
[8].刘梦娇.众媒时代新媒体矩阵调查性报道的文本策略及其影响[J].武汉交通职业学院学报.2018
[9].霍欢,刘亮.一种在矩阵空间中识别文本蕴涵的动态交互网络[J].计算机应用研究.2019
[10].景永霞,王治和,苟和平.基于矩阵奇异值分解的文本分类算法研究[J].西北师范大学学报(自然科学版).2018