导读:本文包含了线性文本论文开题报告文献综述、选题提纲参考文献,主要关键词:线性,文本,特征,组合,分片,词性,日语。
线性文本论文文献综述写法
毛文伟[1](2019)在《基于线性分析的日语文本分类模型构建研究》一文中研究指出本文以涵盖日常会话、会议发言、小说、议论文、政府白皮书以及新闻报道等多个类型的训练组文本为对象,统计其名词比、数词比、接续词句比等22项数据,将其作为文本表示方式进行线性分析,从中选取14项具有显着判别能力的指标,确定了其权重,由此构建基于Bayes分类函数的文本分类模型。观察这14项典型指标可知,除词汇占比类数据外,句长等指标也能够成为文本分类的有效依据。经测试,在绝大多数情况下,该模型的分类准确率都高于85%,召回率都高于81%,实现了以较小的运算量达到较高分类精度的目标。(本文来源于《外语电化教学》期刊2019年06期)
苏晓宝,刘臣,唐莉[2](2019)在《基于线性链条件随机场的用户生成文本标点标注》一文中研究指出标点符号的正确性对于用户生成文本的词性标注,命名实体识别,依存句法分析等有着重要的作用,正确的标点标注可以使用户生成文本的语法结构准确完整。线性链条件随机场模型可以容纳任意的非独立的特征信息,本文通过选取标点符号所在位置左右词性对作为模型的观测序列,使用条件随机场进行标点符号的标注。实验的测试语料采用京东在线产品评论,结果表明基于线性链条件随机场的用户生成文本标点标注效率较高。(本文来源于《软件》期刊2019年04期)
汤艳雨[3](2019)在《突破线性教学观,打开文本解读新视角》一文中研究指出学者李政涛认为,在教学中不能将教师和学生分割开来进行二元对立的思考,而应该让两者融合在一起,将教学变成师生共同成长的生命场,这样才能提高学生的学习效率。然而遗憾的是,初中语文教学中,不少教师采用的依然是二元对立的思考模式,在教学方式上选择的也是单向灌输式的线性教学观。在这种思想的影响下,所有的问题和教学进度都由教师单向决定,学生只能被动接受,自然不符合师生共同成长的要求。我在教学中尝试突破线性的教学观,用引导学生多元解读的方式构筑师生互动交流的教学环境,促使学生打开文本解读的新视角,进而提高阅读效率。一、文学视角,促发意义共生(本文来源于《新作文(语文教学研究)》期刊2019年01期)
文必龙,李菲,马强[4](2018)在《面向线性文本的K-means聚类算法研究》一文中研究指出鉴于线性文本内容组织形式的有序性,将有序的主题内容进行正确的划分,用于挖掘文本中隐藏的信息、知识,是一个值得研究的问题。同时,传统的K-means聚类算法在对线性文本进行聚类时,会造成计算复杂度增加以及无穷迭代或聚类结果混乱等一系列问题。针对以上问题,对传统的K-means算法进行研究,将随机初始化中心点的算法进行改进,提出一种随机均匀初始化中心点算法。该算法充分考虑线性文本的组织结构特性,随机化第一个中心点后,均匀地确定其他中心点,保证了文本子主题的完整划分;与此同时,又采用了设定约束规则的等距点归类法,实现文本迭代次数限制下的自动归类。实验结果表明,该算法在对线性文本进行聚类时,可以有效减少迭代次数并提高聚类精度,最终获得较好的聚类效果。(本文来源于《计算机技术与发展》期刊2018年09期)
谢继红,刘华山,吴鹏[5](2018)在《超文本与线性文本中元理解判断的比较》一文中研究指出通过实验考查超文本和线性文本情境中元理解判断的异同。采用2×3的混合设计,让被试先阅读文章,然后完成元理解判断任务。结果说明,文本组织结构对细节题成绩预测和推理题成绩预测的判断值具有调节作用,超文本的非线性结构降低了元理解判断的相对准确性。(本文来源于《心理学探新》期刊2018年01期)
李玉鉴,王曼丽,刘兆英[6](2017)在《基于组合凸线性感知器的文本分类模型》一文中研究指出针对文本分类问题,从分片线性学习的角度出发,提出了一种文本分类的组合凸线性感知器模型.首先,对文本样本集进行预处理,包括特征选择、特征项赋权等;然后,分别利用生长支持组合凸线性感知器算法(growing support multiconlitron algorithm,GSMA)和支持组合凸线性感知器算法(support multiconlitron algorithm,SMA)构造组合凸线性感知器,对样本集进行分类.该模型基于支持向量机的最大间隔思想,通过集成线性分类器,实现了对2类数据的划分,具有计算简单、适应能力强的优点.在标准文本数据集上的实验结果表明:该模型所构造的分类器具有良好的文本分类性能,与其他典型文本分类方法的对比也说明了该方法的有效性.(本文来源于《北京工业大学学报》期刊2017年11期)
李艳,陈尚达[7](2017)在《突破线性语文教学观——《一棵小桃树》文本解读与教学创新》一文中研究指出李政涛教授曾指出,"不要把师生割裂开来,作非此即彼、二元对立的思考,我们要把课堂变成师生共生共长的生命场,成为师生共生共长的家园,它的背后是关联式思维、整体融通式思维和综合渗透式思维。"~①"共生共长"一词,道出了语文教学的"课堂"作为"生命场"所蕴涵的师生交互和相互关切,这种"共生共长"暗含着师生相互作用过程充满变化的生生不息和种种不确定性带来的好奇心和紧张感。遗憾的是,很多语文教学满载着教师对学(本文来源于《中学语文》期刊2017年25期)
蔡华杰,谢光艺[8](2016)在《基于边缘特征分析和线性判断的文本帧检测算法》一文中研究指出为保证视频文本检测作用于含有文本的视频帧中,提出一种基于边缘特征和分量线性的文本帧检测算法。算法首先去除模糊视频帧,通过融合颜色和梯度信息以及文本聚类的方法得到边缘图,利用启发式规则滤除非文本分量;然后根据视频文本分量质心位置及最小外接矩形大小规律构建候选文本行;并结合文本行内字符结构特征定义线性关系。最后对候选文本行进行线性判断,若有候选文本行符合线性关系则将视频帧标记为文本帧。实验结果表明所提文本帧检测算法比其他类似算法检测性能更好。(本文来源于《科学技术与工程》期刊2016年36期)
王曼丽[9](2016)在《组合凸线性感知器在文本分类中的应用及评测研究》一文中研究指出文本分类是指根据一定的标准使用计算机对文本自动进行类别标记的过程。它是目前机器学习领域比较热门的研究方向,通常包括文本表示、分类器的选择与训练、分类器性能研究与评价。目前,已经存在许多较成熟的分类器,比如朴素贝叶斯(Naive Bayes)、支持向量机(SVM)、K近邻算法(KNN)等。分片线性分类器作为模式识别领域研究的热点,该分类器确定的决策面是由若干个超平面段组成,与一般超曲面相比,简单易于实现,需要较少的内存消耗。同时,能逼近各类不同形状的超曲面,具有很强的适应能力。目前,学者们也提出了许多设计分片线性分类器的方法。如委员机方法,线性规划的方法,组合凸线性感知器。尤其组合凸线性感知器作为一个构造分片线性分类器的通用框架,具有计算简单、适用能力强等突出优点,然而,它在文本分类的效果有待进一步的评测研究。因此,本文从分片学习的角度,提出了基于组合凸线性感知器的文本分类方法,研究并评测组合凸线器在文本分类中的性能,主要包括以下叁个方面:1)详细介绍了组合凸线性感知器,它作为构造分片线性分类器的一个通用理论框架,也是本文研究内容的理论基础。本文研究的重点内容就是将它应用于文本分类领域中。同时,在这个过程中,我们还需要关注如何将这些分类方法有效地应用到文本分类领域。针对这个问题,我们首先使用向量空间模型表示文本空间,将文本信息表示成计算机可统一处理的形式,再采用组合凸线性感知器的相关算法进行文本分类。2)研究了各种常用的特征提取和特征项赋权方法。本文介绍了常用的特征提取方法和特征赋权方法,并且较为全面地研究并测评了不同的特征赋权方法(tf.idf、tf.χ~2、tf.ig和tf.rf),对组合凸线性感知器的分类效果的影响。3)将组合凸线性感知器应用于文本分类的研究。由于实验数据规模较大,文本经过特征提取之后的维度依然较大,在文本分类过程中必然会占用大量的内存,所以在进行分类之前,需要利用主成分分析方法对样本的特征空间降维。在标准数据集上,通过大量实验对比典型的文本分类方法(SVM、KNN)的分类性能,利用正确率、准确率、召回率和F1等评价指标,评测组合凸线器在文本分类上的性能。(本文来源于《北京工业大学》期刊2016-12-01)
孙刚[10](2015)在《基于线性回归的中文文本可读性预测方法研究》一文中研究指出随着Internet的发展,网络上的信息越来越多,人们往往通过向搜索引擎提交查询,然后搜索引擎能够返回与用户的查询最相关的结果。然而人们的阅读水平与理解能力不尽相同,如何为用户找到适合其阅读的网页文本成为一个重要的课题,而文本的可读性预测在这一过程中扮演着重要的角色。因此,如何准确地预测文本的可读性具有十分重要的意义。文本的可读性预测指的是度量文本的阅读难度,这在多个领域中都有应用,如语言教育,信息检索和文本简化。迄今为止使用最多的方法是可读性公式,这些公式一般是基于一些简单的特征通过线性回归模型建立的。近期的研究使用了机器学习技术,并且受益于自然语言处理技术等其他领域的发展,一些新的复杂的特征得以被利用。这些新的可读性预测方法表现出对经典可读性公式的优越性。然而可读性公式的这种表现很有可能是由于使用的特征有限,并且它们是基于特定的训练语料库建立的。本文总结并分析了现有的可读性研究成果,提出了基于线性回归与特征选择的中文文本可读性预测方法,然后通过一系列的实证研究来评估该方法的有效性。现将本文的主要贡献概括如下:1.综述了文本可读性预测问题的研究进展。首先对文本可读性预测问题进行了介绍,包括文本可读性的基本概念,以及可读性预测的问题定义。然后总结了现有的文本可读性预测方法,并将其分为四类进行了介绍,包括基于传统的文本特征的可读性公式方法、基于认知理论的方法、基于单词统计的语言模型方法和基于复杂特征与机器学习的方法。2.提出了基于线性回归与特征选择的中文文本可读性预测方法。首先对本文提出的基于线性回归与特征选择的中文文本可读性预测方法的动机进行了介绍,接着阐述了该方法的框架,并从中文特征计算、特征选择和线性回归模型叁个方面对该框架进行了介绍,最后介绍了该方法的设计与实现。3.展开了对基于线性回归与特征选择的中文文本可读性预测方法的实证研究。为了评估本文中提出的基于线性回归与特征选择的中文文本可读性预测方法的有效性,我们首先提出两个主要的研究问题。接着对实验用的数据集进行介绍。然后介绍实验设计部分,包括实验设置和所使用的性能评价指标。最后通过分析实验结果,验证本文提出方法的有效性。(本文来源于《南京大学》期刊2015-05-01)
线性文本论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
标点符号的正确性对于用户生成文本的词性标注,命名实体识别,依存句法分析等有着重要的作用,正确的标点标注可以使用户生成文本的语法结构准确完整。线性链条件随机场模型可以容纳任意的非独立的特征信息,本文通过选取标点符号所在位置左右词性对作为模型的观测序列,使用条件随机场进行标点符号的标注。实验的测试语料采用京东在线产品评论,结果表明基于线性链条件随机场的用户生成文本标点标注效率较高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
线性文本论文参考文献
[1].毛文伟.基于线性分析的日语文本分类模型构建研究[J].外语电化教学.2019
[2].苏晓宝,刘臣,唐莉.基于线性链条件随机场的用户生成文本标点标注[J].软件.2019
[3].汤艳雨.突破线性教学观,打开文本解读新视角[J].新作文(语文教学研究).2019
[4].文必龙,李菲,马强.面向线性文本的K-means聚类算法研究[J].计算机技术与发展.2018
[5].谢继红,刘华山,吴鹏.超文本与线性文本中元理解判断的比较[J].心理学探新.2018
[6].李玉鉴,王曼丽,刘兆英.基于组合凸线性感知器的文本分类模型[J].北京工业大学学报.2017
[7].李艳,陈尚达.突破线性语文教学观——《一棵小桃树》文本解读与教学创新[J].中学语文.2017
[8].蔡华杰,谢光艺.基于边缘特征分析和线性判断的文本帧检测算法[J].科学技术与工程.2016
[9].王曼丽.组合凸线性感知器在文本分类中的应用及评测研究[D].北京工业大学.2016
[10].孙刚.基于线性回归的中文文本可读性预测方法研究[D].南京大学.2015