基于多数据源的地名匹配及地名翻译方法研究

基于多数据源的地名匹配及地名翻译方法研究

论文摘要

本文的研究主题是基于多数据源的全球地名匹配与翻译方法。随着全球一体化时代的到来,一带一路发挥着越来越重要的作用,地理信息的需求也不断增加。整合不同来源、不同类型的数据,使之形成规范的GIS数据是地理信息行业的一项重要工作。实际工作中,由于目标与技术不同,数据来源不同,所得到的数据往往需要进行数据一致性匹配处理后方能为己所用。用户日益增长的地名数据需求决定了进行全球地名匹配、汉化翻译等工作的迫切与必要性。本文首先阐述了地名相关理论。从地名语义一致性匹配的时代背景与研究意义出发,对地名与地理空间数据语义一致性的匹配、翻译研究进展进行了综述;并对地名及空间数据一致性的概念和理论进行了详细解析,分别从地名的语义、特征、分类以及其他地名构词方式方面进行了相关研究;总结了地名的发展趋势与地名更新变换的影响因素,并从地名翻译及管理方面对地名的数据库与地名数据现状进行分析研究。其次,本文设计了多数据源地名语义匹配算法。总结了几种使用率较高的地名语义匹配算法;针对算法的优点与不足,对相关算法进行了优化改进;在总结规范化地名构词特点的基础上,从人对地名的认知习惯出发,通过对地名语义相似度的计算以及地理实体空间拓扑关系的语义一致性,进行综合的地名语义一致性匹配处理,从而提高地名语义匹准确率与配效率。最后,使用本文改进的地名匹配算法进行了实践,设计实现了地名语义匹配、翻译综合相似度计算工具集。一方面对地名进行合理权重分配的相似度计算,另一方面引入了谷歌地名翻译、bing词典翻译、bing翻译以及百度翻译四种地名匹配翻译网络地名库。对地名数据进行综合语义匹配、翻译。并将匹配成果数据与国家基础地理信息中心2007版全球地名规范数据与民政部标准地名进行对比检验,成果表明本文所用方法是行之有效的。本文设计实现了基于多数据源的全球地名翻译方法,并开发了基于多数据源的地名翻译工具集,使用本工具集对全球地名数据进行匹配、翻译实验,并对全球矢量数据进行批量化地名数据处理及地名规范化整理。应用于国家基础地理信息中心《全球1:100万矢量地名翻译和界线数据更新处理》项目,成果表明,使用该方法较大程度减少了地名处理时的人工工作量。在全球各个地区内的翻译效果较单一数据源翻译成果都有很大改善,其中抽样平均翻译率达到了91.02%,全体数据统计的翻译可靠率平均值达到了87.66%。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 研究背景及研究意义
  •   1.2 国内外研究现状
  •   1.3 研究内容与技术路线
  •     1.3.1 研究内容
  •     1.3.2 技术路线
  •   1.4 论文组织
  • 第2章 地名相关理论
  •   2.1 地名
  •     2.1.1 地名的概念
  •     2.1.2 地名的特征
  •     2.1.3 地名的分类
  •   2.2 地名的语义
  •     2.2.1 地名的构词规则
  •     2.2.2 地名的语义
  •   2.3 地名翻译及管理
  •     2.3.1 地名数据库
  •     2.3.2 地名数据现状
  •   2.4 本章小结
  • 第3章 基于多数据源的地名匹配算法
  •   3.1 已有成果分析
  •     3.1.1 BPM-BM算法
  •     3.1.2 基于属性方法
  •     3.1.3 语义距离计算法
  •     3.1.4 其他方法
  •   3.2 地名相似度匹配算法改进
  •     3.2.1 算法分析
  •     3.2.2 算法优化
  •     3.2.3 地名语义及权重计算原则
  •   3.3 地名匹配计算
  •   3.4 本章小结
  • 第4章 基于多数据源的地名匹配与翻译工具集研制
  •   4.1 技术路线
  •     4.1.1 数据收集与分析
  •     4.1.2 技术路线规划
  •   4.2 关键技术问题分析与解决
  •     4.2.1 数据编码
  •     4.2.2 效率优化
  •     4.2.3 匹配方法
  •   4.3 工具集设计
  •     4.3.1 工具集界面设计
  •     4.3.2 相关资源API调用选择
  •     4.3.3 成果降噪
  •   4.4 本章小结
  • 第5章 应用实践
  •   5.1 实验环境与实验数据
  •   5.2 实验成果对比
  •   5.3 成果分析
  •   5.4 本章小结
  • 第6章 总结与展望
  •   6.1 论文总结
  •   6.2 展望及后续思考
  • 参考文献
  • 致谢
  • 攻读硕士学位期间参与的科研项目和学术成果
  • 文章来源

    类型: 硕士论文

    作者: 曹存相

    导师: 邹积亭,霍亮,陈品祥

    关键词: 数据整合,属性相似度,地名语义,地名匹配与翻译,矢量数据更新

    来源: 北京建筑大学

    年度: 2019

    分类: 基础科学,哲学与人文科学

    专业: 自然地理学和测绘学,中国语言文字

    单位: 北京建筑大学

    分类号: H059;P281

    总页数: 53

    文件大小: 3616K

    下载量: 119

    相关论文文献

    • [1].西藏城镇新地名的命名原则与方法探讨[J]. 西部发展研究 2015(00)
    • [2].规范地名管理服务 弘扬优秀地名文化[J]. 中国民政 2019(24)
    • [3].地名用字“塆”不能改为“湾”[J]. 中国地名 2020(02)
    • [4].黔东南州:建立地名管理联席会议制度[J]. 中国地名 2018(12)
    • [5].浅谈地名特殊用字的规范[J]. 中国民政 2018(24)
    • [6].浅析如何在地名管理过程中对地名进行保护[J]. 当代教育实践与教学研究 2019(01)
    • [7].浅谈地名特殊用字的规范[J]. 中国地名 2019(03)
    • [8].青海民族语地名中存在的问题及思考[J]. 中国地名 2019(04)
    • [9].郑州市:加强文化自信 清理整治不规范地名[J]. 中国地名 2019(04)
    • [10].苏州市:组织开展编制镇级地名规划[J]. 中国地名 2019(03)
    • [11].浅谈如何编制地名规划——以山东省为例[J]. 中国地名 2019(04)
    • [12].遏制地名任性 延续城市文脉[J]. 中国地名 2019(04)
    • [13].以第二次全国地名普查为契机 大力推动地名规范化建设[J]. 中国地名 2019(06)
    • [14].如何以法治方式清理整治不规范地名[J]. 中国民政 2019(14)
    • [15].广州“六个结合”清理整治不规范地名[J]. 大社会 2019(07)
    • [16].合肥地名源流文化研究[J]. 合肥工业大学学报(社会科学版) 2017(06)
    • [17].治理地名乱象目的在促进地名规范化[J]. 中国地名 2017(10)
    • [18].以“六个必须”为指导 全面做好新时代地名管理工作——国务院第二次全国地名普查领导小组办公室会议纪要[J]. 中国地名 2017(Z1)
    • [19].恩施州:依法精准破解地名管理难题[J]. 中国地名 2018(02)
    • [20].四川省攀枝花市:加强地名管理助力城市文明[J]. 中国民政 2018(09)
    • [21].郑州市:清理整治不规范地名[J]. 中国地名 2017(08)
    • [22].关于健全地名管理制度的几点建议[J]. 中国民政 2016(18)
    • [23].增城市地名管理信息系统设计与实现[J]. 测绘与空间地理信息 2014(10)
    • [24].西宁书简·地名谈[J]. 雪莲 2019(03)
    • [25].洋地名泛滥倒逼地名文化保护[J]. 华人时刊 2016(Z1)
    • [26].连云港市人民政府关于印发《连云港市地名管理办法》的通知[J]. 连云港市人民政府公报 2016(Z9)
    • [27].“洋地名”泛滥根子在“文化的不自信”[J]. 时代报告 2016(05)
    • [28].基于大数据技术的地名信息共享平台方案[J]. 今日财富 2017(05)
    • [29].我国地名研究进展及趋势[J]. 环球市场信息导报 2017(05)
    • [30].改地名要依规矩[J]. 人民周刊 2016(16)

    标签:;  ;  ;  ;  ;  

    基于多数据源的地名匹配及地名翻译方法研究
    下载Doc文档

    猜你喜欢