论文摘要
科研人员之间的交流和合作是推动科技发展和知识传播的有效途径。从论文专著,到科研项目,乃至大型科学工程,无不凝聚着众多科研人员的努力和贡献。因此,如何推动更好地科研合作,以及如何寻找合适的科研合作伙伴,已经成为学术界和工业界共同感兴趣的课题。本文以科研合作网络为应用背景,以复杂网络理论为基础理论,研究科研合作网络中的链路预测技术,旨在探讨在网络信息缺失条件下如何通过链路预测技术重建网络连接的问题。本文的主要工作包括以下三个方面:1)总结和研究了复杂网络的基础理论和链路预测技术中的链路预测理论。着重介绍了链路预测评价指标和研究方法,特别是对链路预测的三种主要研究思路进行了探究。包括基于结构信息的链路预测研究方法、基于最大似然估计进行链路预测和利用概率模型进行链路预测。其中,基于结构信息的链路预测研究方法仍然是目前最主流的方法。2)研究了网络数据抓取方法与数据可视化方法。其中,本文不仅总结和分析了爬虫的基本概念、常见类型和网络数据可视化理论,而且着重研究了聚焦网络爬虫和通用网络爬虫的实现原理及过程,特别是对Scrapy框架的使用和数据处理流程进行了深入研究与探索。本文采用两种方法实现了对所抓取的数据进行可视化,1)使用MATLAB程序对网络数据进行仿真,输出MATLAB绘制的网络图。但这个方法只适合数据量较小的网络。2)使用专业的可视化软件,如VOSviewer、Gephi等对数据进行可视化处理,这种方法取得了较好的可视化效果。3)提出了一种基于元路径和随机游走的元路径计算预测MPCP(meta-path computation prediction)算法,本文提出的MPCP算法建立了两种元路径:共同作者(A-A-A)元路径和共同关键词(A-D-A)元路径。MPCP算法将从Web of Science收集到的作者和关键字数据形成异质信息网络G=(A,D,R)。将元路径与随机游走结合起来,并考虑元路径的重叠,在不同链路阻断阈值的条件下预测新链路建立的概率。本文以链路的恢复率作为算法的评价指标,并以量子通信和链路预测为关键词构建实际的科研合作网络案例。算法仿真结果发现,随着链路阻断阈值的增加,实际恢复的链路数量会减少。在最坏情况下,即对于最大阻断阈值为1的时候,MPCP算法依然至少恢复50%的断开链路。
论文目录
文章来源
类型: 硕士论文
作者: 郭雯
导师: 付明磊
关键词: 科研合作网络,复杂网络,链路预测,元路径,随机游走
来源: 浙江工业大学
年度: 2019
分类: 基础科学
专业: 数学
单位: 浙江工业大学
分类号: O157.5
DOI: 10.27463/d.cnki.gzgyu.2019.000898
总页数: 64
文件大小: 2374K
下载量: 81