导读:本文包含了结构化自然语言论文开题报告文献综述及选题提纲参考文献,主要关键词:城市空间格局,格局要素特征,自然语言,结构化表达
结构化自然语言论文文献综述
吕晓东[1](2017)在《面向自然语言的城市空间格局信息结构化表达研究》一文中研究指出城市空间格局是城市的骨架,反映了城市空间的架构,与城市的经济、交通、就业、土地利用等社会生活各方面息息相关。构建科学、合理的城市空间格局,把握城市的要素布局,有利于城市空间科学的规划决策,是城市地理学以及城市规划领域的重要研究内容之一。目前的城市空间格局及其模式研究中,众多学者从各自学科的角度对城市空间格局及其要素布局规律进行了描述和分析,但少有从城市空间格局要素特征角度出发,对城市空间格局信息的自然语言描述进行分析,缺少对自然语言描述的城市空间信息进行结构化表达的研究。基于以上不足,本文在分析城市空间格局要素特征的基础上,对自然语言描述的城市空间格局信息进行分析,基于可拓学基元模型对城市空间格局信息的结构化表达进行探讨与研究,主要研究内容与成果如下:(1)城市空间格局的要素特征分析通过对国内典型的城市总体规划文本、规划图件等图文资料的归纳整理,从语义属性、几何形态、要素间的相互关系等方面对城市空间格局要素进行特征分析,探讨了城市空间格局模式类型的图形化表达,为自然语言描述的城市空间格局信息结构化表达提供了理论基础。(2)面向城市空间格局的自然语言描述分析针对城市空间格局要素的语义属性特征、几何结构特征以及要素间相互关系特征,从城市总体规划文本出发,对描述城市空间格局信息的典型语句进行结构拆分,对其中句子组成成分、句型结构、语法模式进行分析,对描述中含有的由城市空间格局要素特征构成的属性约束信息、空间关系约束信息特征进行总结归纳。(3)城市空间格局的结构化表达研究在城市空间格局要素特征分析、城市空间格局信息自然语言描述分析的基础上,从可拓学基元模型的原理出发,对空间格局要素及其属性约束、空间关系约束进行抽象化,构建城市空间格局信息结构化表达方法。并结合实例证明了该结构化过程的可行性。(本文来源于《南京师范大学》期刊2017-09-01)
赵卫锋,张勤[2](2016)在《非结构化中文自然语言地址描述的自动识别》一文中研究指出互联网中存在海量易获取的自然语言形式地址描述文本,其中蕴含丰富的空间信息。针对其非结构化特点,提出了自动提取中文自然语言地址描述中词语和句法信息的方法,以便深度挖掘空间知识。首先,根据地址语料中字串共现的统计规律设计一种不依赖地名词典的中文分词算法,并利用在地址文本中起指示、限定作用的常见词语组成的预定义词表改善分词效果及辅助词性标注。分词完成后,定义能够表达中文地址描述常用句法的有限状态机模型,进而利用其自动匹配与识别地址文本的句法结构。最后,基于大规模真实语料的统计分词及句法识别实验表明了该方法的可用性及有效性。(本文来源于《计算机工程与应用》期刊2016年23期)
张文斌[3](2011)在《结构化数据的自然语言接口技术研究》一文中研究指出当今互联网上信息繁杂,存在多种多样的信息格式,质量参差不齐。其中结构化数据是众多种类的数据中质量最高的一类,它包括关系数据库、本体、XML数据库等。互联网上已有的结构化数据非常丰富,并且一直在快速增长,具有很大的利用价值。结构化数据的传统查询方式一般要求用户熟悉结构化数据的某种特定的形式化查询语言(如SQL)以及该数据的结构,然后根据自身的信息需求构造查询语句进行查询。而结构化数据的自然语言接口允许用户以自然语言的形式对结构化数据进行查询,不要求用户熟悉查询语言和数据的结构,是一种更为友好的信息获取方式,极大地提高了结构化数据的易用性。因此,结构化数据的自然语言接口的研究具有非常重要的现实意义。同时,结构化数据的自然语言接口即为结构化数据上的自动问答,而自动问答一直是自然语言处理和信息检索领域的热点,所以结构化数据的自然语言接口也具有重要的研究价值。结构化数据的格式不同,对应的自然语言接口的技术也因而不同。本文主要对关系数据库和语义网本体这两大类最常见的结构化数据进行了自然语言接口的研究。对于关系数据库的自然语言接口,我们提出了基于最短路和基于序列标注的两种方法。最短路的方法过于简单机械,效果不佳。序列标注的方法效果较好,但需要大量标注语料。总结关系数据库的自然语言接口实验的经验和教训,我们又选取语义网本体进行了自然语言接口的实验。我们在语义网本体上提出的基于实体关系路径搜索的方法取得了最佳的效果。实验表明,我们在关系数据库和语义网本体上都构建了能取得较好效果的自然语言接口系统。相比而言,语义网本体更适合作为自然语言接口的数据格式。(本文来源于《哈尔滨工业大学》期刊2011-07-01)
赵晓琴,孙毅中,薛晓蕾[4](2010)在《基于知识单元的自然语言结构化解析模型——以城市规划领域规则为例》一文中研究指出将自然语言描述的知识规则应用于计算机处理时,需要将非结构化语言转换为结构化语言。对于面向特定领域的、具有空间关系的规则,还需要消除两种语言之间的空间信息语义障碍。本文以城市规划领域的知识规则为例,提出知识单元概念、构建具有空间关系的知识单元体系结构、提炼面向领域的知识单元组合模式。在此基础上,建立自然语言解析模型,实现将自然语言描述的领域规则转化为知识单元组合模式,进而解析成面向GIS查询、分析、操作的结构化的计算机语言。(本文来源于《测绘科学》期刊2010年06期)
孔晓风,李莹,李昊旻,吕旭东[5](2008)在《基于自然语言处理技术的消化科内窥镜检查报告的结构化》一文中研究指出以消化科内窥镜检查报告为例,介绍一种基于自然语言处理技术的结构化实现方法。利用现有的自然语言处理技术,并引入消化科内窥镜检查术语标准MST(Minimal Standard Terminology)。实现了胃镜的叙述性检查报告到基于MST的结构化报告的转化,表述准确率达到92.3%。(本文来源于《中国医疗器械杂志》期刊2008年05期)
周国栋,李军辉,钱龙华,朱巧明[6](2007)在《基于结构化句法信息的自然语言处理技术研究》一文中研究指出结构化的句法信息在较高层次的自然语言处理研究中起着关键作用。不过哪些结构化的句法信息是有效的以及如何在具体研究中有效体现结构化的句法信息依然是悬而未决的问题。本文将从两个方面探讨上述问题:一是句法树的自动抽取,即在语言学理论的指导下,探索句法树中的关键结构化句法信息,提出自动获取相关结构化信息的句法树抽取方案,以确保抽取的句法树既涵盖关键的结构化信息,又能减少不必要的噪音;二是树核函数的研究,即研究和改进现有的树核函数,如卷积树核函数,并探索新的树核函数,有效计算一对句法树之间的相似度,以更好地体现各种结构化信息。(本文来源于《内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集》期刊2007-08-01)
李俊杰[7](2007)在《基于自然语言处理技术的消化科内窥镜检查报告的结构化》一文中研究指出在医院的现代化管理中,病历作为医疗活动信息的主要载体,不仅是医疗、教学、科研的第一手资料,而且也是对医疗质量、技术水平、管理水平等进行综合评价的依据。欲在大量的检查报告中抽取符合一定条件的文档进行分析并总结(如研究某种疾病的易感人群的年龄段及地域分布等规律,某种症状与某种疾病之间的关系),对病历进行文本分析是开展上述工作的必要途径之一。在医院诊疗过程中,病历的录入,尤其是诊断报告的录入,目前大部分的系统还是选用医生自由录入的方式,这就形成了大量的叙述性报告。医院作为一个特殊的领域,日信息吞吐量极大,用户要在海量数据中得到自己需要的数据是十分困难的,这为在自由文本中对某些信息进行统计、查询带来一定的困难,同时大量非结构化,非标准化的文本信息也不利于医院之间的信息共享与统计。因此,对自然语言表达的病历文书进行结构化的研究探索是一件十分有意义的事情。目前,电子病历的研究开发人员提出了很多实现结构化的方法,大多数是采用结构化表单录入的方式,但是这种方式不能表达自然语言的所有语义信息。本论文从自然语言理解的角度出发,基于现有的自然语言处理技术的成果,以内窥镜检查报告为例,对自然语言表达的病历文书进行结构化研究。本论文的主要工作包括:利用现有的自动分词研究成果,对文本报告进行初步分词。本论文采用中国科学院自然语言处理研究所开发的分词系统ICTCLAS作为初步分词的基础件。对初步分词结果进行进一步的调整。利用专业词典进一步识别MST(Minimal Standard Terminology)标准词汇,以及能够转化成标准MST词汇的非标准MST词汇。对分词结果进行文本解析,输出结构化内容。分析MST标准的结构特点以及MST标准术语之间隐含的相互关系,借鉴UMLS超级叙词表的关系数据模型及与语义网络框架,建立MST语义网络知识库,利用这个知识库,分析每个词汇的语义类型以及相互关系,输出符合MST标准的结构化报告。本论文的重点在于对设计方法的研究。在实验中本论文以胃镜检查报告为实验数据,得到的叙述性报告转化到MST结构化报告的准确率为92.3%。从最初的设计到应用于实际这一过程证明,本论文提出的基于自然语言处理技术的消化科内窥镜检查报告的结构化,方法简单,能够比较有效地完成叙述性报告到结构化报告的转化,为实现电子病历的结构化,提供了一种尝试性的方案。这种方法可以应用于电子病历的其他部分,最终能够实现电子病历的完全结构化、标准化。(本文来源于《浙江大学》期刊2007-05-01)
张少平[8](2002)在《基于结构化自然语言的算法规约研究》一文中研究指出形式化方法是克服“软件危机”,实现软件自动化的关键技术,算法设计的软件设计的灵魂。薛锦云教授对算法程序进行深入地研究,提出了一种基于分划和递推关系的算法程序设计形式化方法——PAR方法。用形式化方法进行软件开发,第一步就是要给出问题的精确定义,即问题的规约。然而,为了避免自然语言表示的二义性,现有的形式化方法都是用数学方法来描述规约,要求使用它的人要熟练地掌握相关领域的数学知识,因此也就在一定的程度上限制了形式化方法的应用和推广,这是本文的研究动机所在。 本文对算法规约和自然语言进行了深入的研究,提出了一种基于结构化自然语言(Structured Natural Language,简称为SNL语言)的算法规约描述方法,取得了如下成果: 1.针对算法规约的描述问题,本文提出了一种以自然语言为基础、辅助于初等数学公式、基本量词运算和抽象数据类型的SNL语言,并定义了SNL语言的语法结构。用SNL语言来描述算法规约,就不需要掌握很深的数学理论,只是熟练掌握SNL语言就可以了。 2.针对自然语言表示的多样性问题,本文收集了用自然语言描述算法规约的相关词语,创建了一个自然语言-算法规约双语语料库。 3.算法规约中的断言比较复杂时,就难以用一个式子表示出来。针对这一问题,本文提出了在SNL语言中用与子句形式来描述算法规约中的断言。用与子句来描述断言,更接近于人的思维习惯,又简单直观。 4.本文在SNL语言中定义了一个算法语料库,这样可以把已有的库函数加入进来,利用现有算法可以构造更复杂的算法程序的规范。 5.采用面向对象分析和设计技术,利用Java语言实现了把SNL语言表示的算法规约到RADL语言算法规约的转换系统。(本文来源于《江西师范大学》期刊2002-10-01)
刘海涛[9](1992)在《结构化语言知识库在自然语言处理中的应用》一文中研究指出本文讨论了知识在自然语言处理中的作用和现有系统的局限,引入一种全文结构知识库的概念并探讨了此知识库在自然语言处理中的诸多应用问题。(本文来源于《情报科学》期刊1992年05期)
结构化自然语言论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
互联网中存在海量易获取的自然语言形式地址描述文本,其中蕴含丰富的空间信息。针对其非结构化特点,提出了自动提取中文自然语言地址描述中词语和句法信息的方法,以便深度挖掘空间知识。首先,根据地址语料中字串共现的统计规律设计一种不依赖地名词典的中文分词算法,并利用在地址文本中起指示、限定作用的常见词语组成的预定义词表改善分词效果及辅助词性标注。分词完成后,定义能够表达中文地址描述常用句法的有限状态机模型,进而利用其自动匹配与识别地址文本的句法结构。最后,基于大规模真实语料的统计分词及句法识别实验表明了该方法的可用性及有效性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
结构化自然语言论文参考文献
[1].吕晓东.面向自然语言的城市空间格局信息结构化表达研究[D].南京师范大学.2017
[2].赵卫锋,张勤.非结构化中文自然语言地址描述的自动识别[J].计算机工程与应用.2016
[3].张文斌.结构化数据的自然语言接口技术研究[D].哈尔滨工业大学.2011
[4].赵晓琴,孙毅中,薛晓蕾.基于知识单元的自然语言结构化解析模型——以城市规划领域规则为例[J].测绘科学.2010
[5].孔晓风,李莹,李昊旻,吕旭东.基于自然语言处理技术的消化科内窥镜检查报告的结构化[J].中国医疗器械杂志.2008
[6].周国栋,李军辉,钱龙华,朱巧明.基于结构化句法信息的自然语言处理技术研究[C].内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集.2007
[7].李俊杰.基于自然语言处理技术的消化科内窥镜检查报告的结构化[D].浙江大学.2007
[8].张少平.基于结构化自然语言的算法规约研究[D].江西师范大学.2002
[9].刘海涛.结构化语言知识库在自然语言处理中的应用[J].情报科学.1992