百度地图阿拉丁系统的重构及开发

百度地图阿拉丁系统的重构及开发

论文摘要

随着互联网的迅速发展,网上的信息越来越多,用户想在海量的数据中检索自己需要的信息越来越困难。随着垂直搜索引擎的出现,大大改善了传统搜索引擎检索结果泛而不专的状况。所谓的垂直搜索引擎是应用于某一个行业、专业的搜索引擎。垂直搜索引擎为用户提供的并不是上百甚至上千万的相关网页,而是范围极为缩小、极具有针对性的具体信息。本文中的项目即百度地图阿拉丁系统是作者在百度公司实习期间所参与的项目。在百度公司内部,垂直搜索也被称为“阿拉丁”。百度针对不同的检索范畴,分为例如商品阿拉丁、音乐阿拉丁、体育阿拉丁、旅游阿拉丁、地图阿拉丁等等。本系统是在原有百度地图阿拉丁系统version1.0基础上从架构、业务、性能等做了全面的升级,即百度地图阿拉丁系统(version2.0)。本人参与了项目前期的调研工作,随后进行完整的需求分析、设计、开发、测试及部署上线的全过程。在具体的工作中,将整个百度地图阿拉丁系统分为四层来进行设计与实现。对接上游层包括搜索数据接口模块、DuerOS数据接口模块;非业务处理层包括数据抽稀模块、数据缓存模块、质量控制模块;业务处理层包括普通poi(point of interest)类检索模块、周边类检索模块、公交线路类检索模块、出行路线类检索模块;对接下游层包括地图后端服务统一数据总线模块。在本系统具体的设计实现中,使用百度内部php开发环境ODP,数据缓存使用Redis,数据抽稀使用Douglas-Peukcer抽稀算法,质量控制使用逻辑回归算法训练模型并进行预测。此外在开发工作结束后对整个系统进行了测试,达到了预期目标。本文的最后对整个项目进行总结以及对未来工作的展望。

论文目录

  • 致谢
  • 摘要
  • ABSTRACT
  • 1 引言
  •   1.1 项目背景
  •   1.2 垂直搜索发展现状
  •   1.3 项目研发意义与目的
  •   1.4 本人工作与论文组织结构
  •   1.5 本章小结
  • 2 系统相关技术简介
  •   2.1 ODP开发环境
  •   2.2 Redis存储系统
  •   2.3 Douglas-Peukcer数据抽稀算法
  •   2.4 逻辑回归算法
  •   2.5 本章小结
  • 3 系统需求分析
  •   3.1 系统需求架构总览
  •   3.2 系统功能性需求
  •     3.2.1 普通poi类检索功能
  •     3.2.2 周边类检索功能
  •     3.2.3 公交线路类检索功能
  •     3.2.4 出行路线类检索功能
  •   3.3 系统非功能性需求
  •     3.3.1 系统的高效性
  •     3.3.2 系统的可靠性
  •     3.3.3 系统的准确性
  •   3.4 本章小结
  • 4 系统设计
  •   4.1 系统总体功能结构
  •   4.2 系统技术实现架构
  •   4.3 对接上游层
  •     4.3.1 搜索数据接口模块
  •     4.3.2 DuerOS数据接口模块
  •   4.4 非业务处理层
  •     4.4.1 数据抽稀模块
  •     4.4.2 数据缓存模块
  •     4.4.3 质量控制模块
  •   4.5 业务处理层
  •     4.5.1 普通poi类检索模块
  •     4.5.2 周边类检索模块
  •     4.5.3 公交线路类检索模块
  •     4.5.4 出行路线类检索模块
  •   4.6 对接下游层
  •     4.6.1 地图后端服务统一数据总线模块
  •   4.7 本章小结
  • 5 系统实现
  •   5.1 对接上游层
  •     5.1.1 搜索数据接口模块
  •     5.1.2 DuerOS数据接口模块
  •   5.2 非业务处理层
  •     5.2.1 数据抽稀模块
  •     5.2.2 数据缓存模块
  •     5.2.3 质量控制模块
  •   5.3 业务处理层
  •     5.3.1 普通poi类检索模块
  •     5.3.2 周边类检索模块
  •     5.3.3 公交线路类检索模块
  •     5.3.4 出行路线类检索模块
  •   5.4 对接下游层
  •     5.4.1 地图后端服务统一数据总线模块
  •   5.5 本章小结
  • 6 系统测试
  •   6.1 功能性测试
  •     6.1.1 普通poi类检索功能
  •     6.1.2 周边类检索功能
  •     6.1.3 公交线路类检索功能
  •     6.1.4 出行路线类检索功能
  •   6.2 非功能性测试
  •   6.3 测试总结
  •   6.4 本章小结
  • 7 结论与展望
  •   7.1 工作总结
  •   7.2 工作展望
  • 参考文献
  • 作者简历
  • 学位论文数据集
  • 文章来源

    类型: 硕士论文

    作者: 薛立生

    导师: 孔令波

    关键词: 垂直搜索,地图,数据抽稀,数据缓存,逻辑回归

    来源: 北京交通大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 自然地理学和测绘学,计算机软件及计算机应用,计算机软件及计算机应用

    单位: 北京交通大学

    分类号: TP311.52;P208

    DOI: 10.26944/d.cnki.gbfju.2019.000111

    总页数: 95

    文件大小: 6351K

    下载量: 45

    相关论文文献

    • [1].平权时代的童话新讲——论新版《阿拉丁》电影中的性别重构[J]. 湖北科技学院学报 2020(02)
    • [2].女性主义视域下《阿拉丁》的分析[J]. 西部广播电视 2020(13)
    • [3].论奥基夫/法尔利《阿拉丁或神灯》的特点和影响[J]. 北京科技大学学报(社会科学版) 2020(05)
    • [4].聚焦微信小程序生态变革 第二届阿拉丁小程序年会圆满成功[J]. 中国会展(中国会议) 2019(02)
    • [5].从《阿拉丁》看传统题材电影的改编与开发[J]. 电影文学 2019(18)
    • [6].沙特客户阿拉丁的雷沃情怀[J]. 工程机械与维修 2016(08)
    • [7].阿拉丁[J]. 阅读 2019(92)
    • [8].品书[J]. 语文世界(小学生之窗) 2019(12)
    • [9].阿拉丁[J]. 阅读 2020(Z2)
    • [10].惊喜连连的童话盛宴[J]. 北方人(悦读) 2019(08)
    • [11].阿拉丁[J]. 疯狂英语(初中版) 2019(11)
    • [12].神奇的“飞天魔毯”[J]. 小学教学研究 2016(36)
    • [13].阿拉丁[J]. 阅读 2018(17)
    • [14].热点网罗[J]. 好家长 2017(14)
    • [15].《阿拉丁》[J]. 新语文学习(小学低年级版) 2012(06)
    • [16].阿拉丁的水坊[J]. 文学少年(小学) 2011(05)
    • [17].女性性别身份焦虑下的《阿拉丁》[J]. 电影文学 2019(20)
    • [18].阿拉丁古堡[J]. 学苑创造(7-9年级阅读) 2017(11)
    • [19].从百度“阿拉丁平台”谈搜索引擎的发展方向[J]. 情报探索 2010(05)
    • [20].《阿拉丁》角色形象的审美特征[J]. 电影文学 2019(18)
    • [21].跨艺术研究——《阿拉丁》三部曲[J]. 名作欣赏 2017(03)
    • [22].最新关注[J]. 中学生英语 2019(17)
    • [23].阿拉丁原是中国人[J]. 创新作文(小学版) 2018(05)
    • [24].阿拉丁神灯[J]. 数学大王(3-6年级适用) 2013(05)
    • [25].阿拉丁新传[J]. 小星星(作文100分) 2010(Z2)
    • [26].《阿拉丁》的艺术叙事特点[J]. 电影文学 2020(15)
    • [27].阿拉丁和灯神(阿拉伯民间故事)[J]. 雪花 2012(Z2)
    • [28].以学生为核心的“阿拉丁订单式”校企合作人才培养模式实践与探索[J]. 南昌教育学院学报 2010(02)
    • [29].心中的神灯——《阿拉丁神灯》导读[J]. 小学生优秀作文 2015(Z5)
    • [30].不知走向何处[J]. 新作文.金牌读写(初中生适读) 2012(Z1)

    标签:;  ;  ;  ;  ;  

    百度地图阿拉丁系统的重构及开发
    下载Doc文档

    猜你喜欢