基于通用知识库的地理实体开放关系过滤方法

基于通用知识库的地理实体开放关系过滤方法

论文摘要

文本数据为地理知识服务提供了海量资源。面向文本数据的地理实体关系抽取是地理知识图谱构建的核心技术,直接影响地理知识推理与服务的质量。由于文本数据不可避免地含有噪声,从文本中抽取的地理实体关系需要质量评价和信息过滤。本文提出一种基于通用知识库的地理实体关系过滤方法,针对已抽取的地理实体关系从中筛选出高质量的结果:先利用"本体知识"、"事实知识"和"同义词知识"构建地理关系知识库,作为信息过滤的参照数据;再基于分布式向量表示模型度量已抽取的地理实体关系与参照数据之间的语义相似性,以提高地理知识图谱的丰度与鲜度。实验结果表明,相比业界流行的"Stanford OpenIE"工具,本文所提出的方法可将置信度区间[0, 0.2]和[0.8, 1]的MSE(Mean Square Error)从59.27%降至3.94%,AUC(Area Under the ROC Curve)从0.51提升至0.89。

论文目录

  • 1 引言
  • 2 相关工作
  • 3 方法与实验
  •   3.1 方法
  •     3.1.1 构建参照数据集
  •     3.1.2 评价三元组质量
  •   3.2 实验
  •     3.2.1 实验数据集
  •     3.2.2 实验设计
  •     3.2.3 方法度量指标
  • 4 结果与讨论
  •   4.1 MSE
  •   4.2 ROC和AUC
  •   4.3 选择阈值
  •   4.4 讨论
  • 5 结论与展望
  • 文章来源

    类型: 期刊论文

    作者: 高嘉良,余丽,仇培元,陆锋

    关键词: 文本数据,地理实体关系抽取,地理知识图谱构建,通用知识库,开放关系抽取,地理信息质量评价,信息过滤

    来源: 地球信息科学学报 2019年09期

    年度: 2019

    分类: 基础科学,信息科技

    专业: 自然地理学和测绘学,计算机软件及计算机应用

    单位: 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,中国科学院大学,中国科学院文献情报中心,江苏省地理信息资源开发与利用协同创新中心

    基金: 国家自然科学基金重点项目(41631177)~~

    分类号: P208;TP391.1

    页码: 1392-1401

    总页数: 10

    文件大小: 6374K

    下载量: 128

    相关论文文献

    • [1].结合实体词与句子语义的地理实体关系抽取[J]. 测绘科学技术学报 2018(06)
    • [2].基础地理实体数据整合技术研究[J]. 北京测绘 2019(08)
    • [3].地市级地理实体数据规范化研究——以徐州市为例[J]. 测绘 2018(02)
    • [4].地理实体数据库建库技术研究[J]. 传播力研究 2018(19)
    • [5].一种地名地理实体数据自动获取方法[J]. 地理信息世界 2016(06)
    • [6].基于语义文法的地理实体位置关系的获取[J]. 计算机科学 2016(07)
    • [7].关于发布《2015年我国命名的124个国际海底地理实体名称信息》的公告[J]. 国家海洋局公报 2016(01)
    • [8].基于“一张图”的全要素地理实体分类框架研究[J]. 城市地理 2017(12)
    • [9].地理实体编码标准研究与实践[J]. 江苏科技信息 2019(21)
    • [10].地理实体与政务专题数据关联融合方式研究[J]. 城市勘测 2018(04)
    • [11].我国国际海底地理实体命名取得重大进展[J]. 海洋世界 2015(11)
    • [12].浅谈对地理实体实施命名的方法[J]. 中国地名 2012(02)
    • [13].基于地理实体与影像成像方式的镶嵌线生产算法研究[J]. 现代测绘 2019(01)
    • [14].一种基于空间特征的地理实体编码方法[J]. 测绘通报 2018(10)
    • [15].我国大洋科学考察的重要成果——《中国大洋海底地理实体名录(2016)》[J]. 海洋开发与管理 2016(12)
    • [16].我国首次申报月球地理实体命名获批[J]. 地理教学 2011(06)
    • [17].海底地理实体命名研究进展与发展趋势[J]. 海洋通报 2012(05)
    • [18].顾及距离与形状相似性的面状地理实体聚类[J]. 武汉大学学报(信息科学版) 2009(03)
    • [19].海底地理实体命名关键技术研究[J]. 海洋测绘 2013(06)
    • [20].地理实体分类与编码体系的构建[J]. 现代测绘 2019(01)
    • [21].基于代数超曲面的地理实体数值型时空数据预测方法[J]. 测绘与空间地理信息 2014(04)
    • [22].海底地理实体命名对大陆架划界的影响——以日本为例[J]. 地球科学进展 2016(08)
    • [23].考虑地物构造的矢量数据不确定性描述[J]. 武汉理工大学学报(交通科学与工程版) 2010(06)
    • [24].基于跨省界自然地理实体地名空间格局的行政管理优化[J]. 地理学报 2019(04)
    • [25].稀疏地理实体关系的关键词提取方法[J]. 地球信息科学学报 2016(11)
    • [26].数字城市地理实体建库模型探讨[J]. 测绘与空间地理信息 2012(S1)
    • [27].基于自然语言形态描述的地理实体模拟表达方法[J]. 地球信息科学学报 2019(10)
    • [28].耦合尺度的地理实体空间相关度算法的建立与应用[J]. 地球信息科学学报 2018(01)
    • [29].基于对象唯一性的地理实体数据变化检测方法研究[J]. 矿山测量 2017(02)
    • [30].面向影像镶嵌的地理实体要素信息提取研究与实现[J]. 现代测绘 2019(01)

    标签:;  ;  ;  ;  ;  ;  ;  

    基于通用知识库的地理实体开放关系过滤方法
    下载Doc文档

    猜你喜欢