科研合作网络中的链路预测技术研究

科研合作网络中的链路预测技术研究

论文摘要

科研人员之间的交流和合作是推动科技发展和知识传播的有效途径。从论文专著,到科研项目,乃至大型科学工程,无不凝聚着众多科研人员的努力和贡献。因此,如何推动更好地科研合作,以及如何寻找合适的科研合作伙伴,已经成为学术界和工业界共同感兴趣的课题。本文以科研合作网络为应用背景,以复杂网络理论为基础理论,研究科研合作网络中的链路预测技术,旨在探讨在网络信息缺失条件下如何通过链路预测技术重建网络连接的问题。本文的主要工作包括以下三个方面:1)总结和研究了复杂网络的基础理论和链路预测技术中的链路预测理论。着重介绍了链路预测评价指标和研究方法,特别是对链路预测的三种主要研究思路进行了探究。包括基于结构信息的链路预测研究方法、基于最大似然估计进行链路预测和利用概率模型进行链路预测。其中,基于结构信息的链路预测研究方法仍然是目前最主流的方法。2)研究了网络数据抓取方法与数据可视化方法。其中,本文不仅总结和分析了爬虫的基本概念、常见类型和网络数据可视化理论,而且着重研究了聚焦网络爬虫和通用网络爬虫的实现原理及过程,特别是对Scrapy框架的使用和数据处理流程进行了深入研究与探索。本文采用两种方法实现了对所抓取的数据进行可视化,1)使用MATLAB程序对网络数据进行仿真,输出MATLAB绘制的网络图。但这个方法只适合数据量较小的网络。2)使用专业的可视化软件,如VOSviewer、Gephi等对数据进行可视化处理,这种方法取得了较好的可视化效果。3)提出了一种基于元路径和随机游走的元路径计算预测MPCP(meta-path computation prediction)算法,本文提出的MPCP算法建立了两种元路径:共同作者(A-A-A)元路径和共同关键词(A-D-A)元路径。MPCP算法将从Web of Science收集到的作者和关键字数据形成异质信息网络G=(A,D,R)。将元路径与随机游走结合起来,并考虑元路径的重叠,在不同链路阻断阈值的条件下预测新链路建立的概率。本文以链路的恢复率作为算法的评价指标,并以量子通信和链路预测为关键词构建实际的科研合作网络案例。算法仿真结果发现,随着链路阻断阈值的增加,实际恢复的链路数量会减少。在最坏情况下,即对于最大阻断阈值为1的时候,MPCP算法依然至少恢复50%的断开链路。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景及意义
  •   1.2 国内外研究现状
  •   1.3 本文的研究方法
  •   1.4 研究内容和论文组织结构
  • 第二章 复杂网络与链路预测基础理论
  •   2.1 复杂网络基本概念
  •     2.1.1 复杂网络介绍
  •     2.1.2 三种经典网络的比较
  •     2.1.3 无标度网络
  •   2.2 链路预测基础理论
  •     2.2.1 链路预测基本概念
  •     2.2.2 链路预测常用评估指标
  •   2.3 链路预测研究方法
  •     2.3.1 利用信息方式的链路预测方法
  •     2.3.2 利用信息类型的链路预测方法
  •   2.4 本章小结
  • 第三章 网络数据采集和数据可视化
  •   3.1 网络数据采集理论
  •     3.1.1 网络爬虫介绍
  •     3.1.2 网络爬虫的类型
  •   3.2 网络数据采集实现方法
  •     3.2.1 通用网络爬虫实现过程
  •     3.2.2 聚焦网络爬虫实现过程
  •     3.2.3 爬虫框架Scrapy
  •   3.3 网络数据可视化理论与方法
  •   3.4 本章小结
  • 第四章 科研合作网络中的链路预测
  •   4.1 科研合作网络数据的采集
  •   4.2 异质信息网络模型
  •     4.2.1 异质信息网络
  •     4.2.2 异质信息网络模型
  •   4.3 MPCP算法
  •     4.3.1 元路径
  •     4.3.2 MPCP模型与算法
  •   4.4 结果与讨论
  •     4.4.1 第一组数据:精炼关键词为量子通信
  •     4.4.2 第二组数据:精炼关键词为链路预测
  •     4.4.3 总结与讨论
  •   4.5 本章小结
  • 第五章 总结与展望
  •   5.1 本文研究工作总结
  •   5.2 下一阶段研究工作展望
  • 参考文献
  • 致谢
  • 作者简介
  •   1 作者简历
  •   2 攻读硕士学位期间发表的学术论文
  •   3 参与的科研项目及获奖情况
  •   4 发明专利
  • 学位论文数据集
  • 文章来源

    类型: 硕士论文

    作者: 郭雯

    导师: 付明磊

    关键词: 科研合作网络,复杂网络,链路预测,元路径,随机游走

    来源: 浙江工业大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 浙江工业大学

    分类号: O157.5

    DOI: 10.27463/d.cnki.gzgyu.2019.000898

    总页数: 64

    文件大小: 2374K

    下载量: 81

    相关论文文献

    标签:;  ;  ;  ;  ;  

    科研合作网络中的链路预测技术研究
    下载Doc文档

    猜你喜欢