信息抽取论文_蔡皎洁

导读:本文包含了信息抽取论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:信息,语义,文本,深度,模型,化工,自然语言。

信息抽取论文文献综述

蔡皎洁[1](2019)在《AI中的文本信息抽取方法进展研究》一文中研究指出以科技文献数据库(web of science,WOS)为数据源,2015-2019年国内、外情报学领域期刊论文为研究对象,综合采用文献计量学和文献述评理论与方法,利用CiteSpace软件进行关键词共现分析,获取文本信息抽取方法的研究热点及发展路径,并对四类主要的文本信息抽取方法进行评述。通过对比分析发现以上四种方法并不是独立存在的,文本信息抽取方法呈现多元化和综合化趋势,深度学习逐渐成为最新的发展方向,知识地图成为最新的信息抽取框架。(本文来源于《湖北工程学院学报》期刊2019年06期)

白钰洁[2](2019)在《基于开始定界符的自动Web信息抽取》一文中研究指出为了从网页中快速获得隐含的有用信息,提出一种基于开始定界符的Web信息抽取方法。首先通过网络爬虫获取样本网页;其次对样本网页进行预处理;再通过循环神经网络训练预处理后的样本网页,获得开始定界符;最后利用lxml解析库实现目标抽取页面Web信息的定位与抽取。这样将半结构化的网页自动整理成结构化的知识,以便人们的查询及再利用。通过叁个慕课网站的抽取实验,证明该方法抽取效果良好,可以抽取有用信息并具有可移植性。(本文来源于《微型电脑应用》期刊2019年11期)

毛瑞彬,吕华揆,朱菁[3](2019)在《上市公司公告篇章级信息抽取框架与实现》一文中研究指出【目的/意义】构建一个面向上市公司公告的篇章级信息抽取框架,实现多种类型信息的抽取,并服务于投资和监管。【方法/过程】以深圳A股市场公告中的635篇并购重组公告为例,从中抽取了交易信息和公司财务指标等信息,对框架和方法进行验证。【结果/结论】运用本文所提框架和方法实现的字段抽取准确率为87.6%,效果较好。本文提出的信息抽取框架及方法在上市公司公告信息抽取中是有效的,可以为投资者的投资决策和监管机构的监管提供数据基础。(本文来源于《情报科学》期刊2019年11期)

梁立荣,李长伟,沈晔,周立娟,景行[4](2019)在《基于层迭条件随机场模型的电子病历文本信息抽取》一文中研究指出自然语言处理技术已用于非结构化中文电子病历信息抽取,并且新的算法或模型不断出现,但其应用效果的证据较少。共收集北京某大型叁甲综合医院呼吸专科住院电子病历38 218份,通过对数据预处理,抽象文本特征与定义语法规则,产生训练数据集和测试集,构建层迭条件随机场模型,并评估该模型的识别效果。结果表明,针对入院记录、出院记录、辅助检查报告3大类共39种非结构化文本,该模型可准确、快速地处理病历文本信息,应用效果较为理想。(本文来源于《计算机应用与软件》期刊2019年10期)

李盼,李宜广,徐春[5](2019)在《基于关键节点的网络热点信息抽取》一文中研究指出首先通过实验论证社交网络关键节点对热点信息的产生、传播、引导具有重要作用。在此基础上,关键节点的热点信息按如下方式进行处理:1)对单条信息进行分词处理,得到其切分词集合,滤出其中无意义的切分词;2)将得到的切分词进行重新拼接,滤除其中无意义拼接序列,得到单条热点信息的摘要;3)合并同一含义的热点信息摘要,得到热点信息摘要集合,即为网络热点信息。通过上述一系列的操作,较大幅度地提升了热点信息抽取的准确性和全面性,在社交网络上得到了良好的验证结果。(本文来源于《计算机与现代化》期刊2019年09期)

俞鑫,吴明晖[6](2019)在《基于深度学习的Web信息抽取模型研究与应用》一文中研究指出Web网页中包含了大量异构的半结构化或非结构化数据,如何准确地从这些网页中提取有价值的信息显得极其重要。文章基于深度学习,结合BERT构建了一种新型的BERT+BiLSTM+CRF信息抽取模型,实验结果表明了该方法的有效性。(本文来源于《计算机时代》期刊2019年09期)

张少迪,艾山·吾买尔,郑炅,石刚[7](2019)在《高并发汉英信息抽取系统的设计与实现》一文中研究指出随着大数据时代的来临,如何从海量数据中抽取出最有效的信息成为人们最迫切的需要。为了能够在大数据的环境下更好更快地进行汉英文本的信息抽取,文中采用Python编程语言,Django+uWSGI+Nginx框架,基于TextRank的图排序算法实现汉英文本信息抽取系统。该系统包含文本关键词提取,文本关键短语提取以及文本摘要提取。测试结果表明,该系统能够实现大规模数据的高并发稳定调用,在兼顾抽取质量的同时,还能实现超高效率的信息抽取,具有很好的实际应用价值。(本文来源于《现代电子技术》期刊2019年16期)

荆思凤,熊刚,刘希未,宫晓燕,胡斌[8](2019)在《化工事故案例关键信息抽取研究》一文中研究指出针对当前大部分化工事故案例因以电子文档形式存储而不利于人们对案例信息利用的问题,提出了一种化工事故案例关键信息抽取方法。该方法利用中国科学院计算所ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)系统对化工案例文本进行中文分词和词性标注,利用化工案例信息表述特点及句子语法信息制定关键信息识别规则,利用visual studio平台编制测试代码,对收集到的2000年至今的100个化工事故案例进行测试评价,结果显示该方法能抽取出化工事故案例发生的时间、地域、化工设备及事故类型等信息。该工作为提高化工事故案例信息的利用率作了有效的探索与尝试。(本文来源于《工业安全与环保》期刊2019年08期)

杨兵,聂铁铮,申德荣,寇月,于戈[9](2019)在《一种面向医学文本数据的结构化信息抽取方法》一文中研究指出医学文本作为医疗领域重要的信息载体,为临床诊断和病理学研究提供了重要的数据支持,然而使用自然语言编写的文本数据往往是非结构化的,不便于机器理解和自动化处理.对于中文的医学文本数据而言,由于专业性强,需要丰富的领域知识,并且语法上多采用短句形式,这给结构化信息的抽取带来了巨大的挑战.为此,本文设计了一种针对医学领域的文本数据进行结构化信息抽取的方法,该方法首先通过文本聚类和关键词提取来获得医学描述语言中常用的表达术语,然后使用生成的医学术语库辅助中文分词处理,以提高中文医学文本的分词质量.然后,分析词与词之间的语义依存关系并随之构建依存句法树.最后,从该句法树中识别和抽取医学文本描述中的关键指标及其对应的指标值,最终得到结构化的键值对数据.本文采用真实的医学影像报告文本作为实验数据,实验结果表明该方法有效提高了中文医学文本的分词质量,准确率最高可达98. 24%,并在结构化的信息抽取中效果显着,具有最高83. 76%的准确率和88. 09%的召回率.本文提出的方法能覆盖多种依存语法,且有很好的适用性.(本文来源于《小型微型计算机系统》期刊2019年07期)

张晓孪,王西锋[10](2019)在《基于语义的Web招聘信息抽取关键技术的研究》一文中研究指出随着互联网技术的应用,大量求职者期望能从招聘网站中快速、精准获取有用信息,因此分析并抽取这些网站中的招聘信息具有实际应用的价值。针对Web信息抽取技术在招聘信息系统中的应用,提出了一种基于语义的Web招聘信息抽取的方法,首先是构建主题蜘蛛程序抓取网页,然后对预处理过的网页中的命名实体进行识别。经测试采用本文提出的方法进行信息抽取是可行的,命名实体识别的准确率和召回率能达到71%以上。(本文来源于《微型电脑应用》期刊2019年06期)

信息抽取论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为了从网页中快速获得隐含的有用信息,提出一种基于开始定界符的Web信息抽取方法。首先通过网络爬虫获取样本网页;其次对样本网页进行预处理;再通过循环神经网络训练预处理后的样本网页,获得开始定界符;最后利用lxml解析库实现目标抽取页面Web信息的定位与抽取。这样将半结构化的网页自动整理成结构化的知识,以便人们的查询及再利用。通过叁个慕课网站的抽取实验,证明该方法抽取效果良好,可以抽取有用信息并具有可移植性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

信息抽取论文参考文献

[1].蔡皎洁.AI中的文本信息抽取方法进展研究[J].湖北工程学院学报.2019

[2].白钰洁.基于开始定界符的自动Web信息抽取[J].微型电脑应用.2019

[3].毛瑞彬,吕华揆,朱菁.上市公司公告篇章级信息抽取框架与实现[J].情报科学.2019

[4].梁立荣,李长伟,沈晔,周立娟,景行.基于层迭条件随机场模型的电子病历文本信息抽取[J].计算机应用与软件.2019

[5].李盼,李宜广,徐春.基于关键节点的网络热点信息抽取[J].计算机与现代化.2019

[6].俞鑫,吴明晖.基于深度学习的Web信息抽取模型研究与应用[J].计算机时代.2019

[7].张少迪,艾山·吾买尔,郑炅,石刚.高并发汉英信息抽取系统的设计与实现[J].现代电子技术.2019

[8].荆思凤,熊刚,刘希未,宫晓燕,胡斌.化工事故案例关键信息抽取研究[J].工业安全与环保.2019

[9].杨兵,聂铁铮,申德荣,寇月,于戈.一种面向医学文本数据的结构化信息抽取方法[J].小型微型计算机系统.2019

[10].张晓孪,王西锋.基于语义的Web招聘信息抽取关键技术的研究[J].微型电脑应用.2019

论文知识图

质量感知的综合信任模型潜变量因子载...高频系数融合规则概念化的检测器网络结构一3中文信息资源可视化模型礴层次展示技术文本自动分类结构图

标签:;  ;  ;  ;  ;  ;  ;  

信息抽取论文_蔡皎洁
下载Doc文档

猜你喜欢