复杂网络的相似度表示及应用算法研究

复杂网络的相似度表示及应用算法研究

论文摘要

复杂网络这个概念在20世纪90年代末开始使用,许多计算机科学家、生物学家、社会学家、物理学家和数学家开始研究各种现实世界的网络及其模型。直至今日,复杂网络仍然是一个非常炙手可热和具有吸引力的研究方向,其中链路预测和社区发现就是复杂网络研究中两大热点。判断两个网络节点是否有连接或者同属于一个社区的一种运算复杂度较低的方法便是计算连接点的相似度,该方法比较适用于大规模的网络。已经提出的相似度的指标有很多,但往往只考虑到节点自身度数和共同邻居导致预测精度不够或自身计算复杂度过大导致不适用于复杂网络。本文基于Deepwalk和聚类算法对相似度表示进行研究和应用,主要内容如下:(1)由于传统的相似度表示中,全局相似度的计算复杂度较高,局部相似度的预测精度受到限制,为了得到精度高、复杂度又低的相似度表示,本文将传统相似度表示和Deepwalk得到的距离指标相结合,同时引入集群的概念,提出了一个新的相似度表示Deep Affinity(DA)指标。该指标通过Deepwalk得到节点的坐标和各节点之间的欧氏距离,再用K-means算法得到各节点的簇编号,最后通过两个参数α和β协调影响度得到两个节点最终的相似度。通过在不同真实网络数据集和人工生成的PowerLaw数据集上重复实验,结果表明依靠DA的预测算法在预测精确度上得到很大的提升,且网络数据集越大提升越明显。(2)许多已经提出的社区发现算法,只能在小型网络上有较好的结果,却不适用于大规模网络。本文结合DA指标提出了一种新的社区发现算法CBS,该算法通过使用边界节点识别社区之间的边界线来发现社区,并结合LPA算法的思想,在社区检测的过程中将社区用标签来表示,节点根据其邻居的最大利益分数即DA指标来决定其标签。该算法只关注标签传播迭代过程中的边界节点,消除了不必要的步骤,缩短了整体执行时间,它还具有分布式的性质,在未来可以并行地应用于大型网络。经过在真实数据集和人工生成的LFR图上进行实验,结果证明,在所识别社区的质量方面CBS算法的效果要比2018年Tasgin M等人提出的CBB算法更好。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 选题背景
  •   1.2 研究意义
  •   1.3 国内外研究现状
  •     1.3.1 链路预测研究现状
  •     1.3.2 社区发现研究现状
  •   1.4 主要研究成果
  •   1.5 论文组织结构
  • 第2章 理论基础
  •   2.1 复杂网络
  •     2.1.1 复杂网络三大特性
  •     2.1.2 网络图表示
  •   2.2 链路预测
  •     2.2.1 问题概述
  •     2.2.2 数据预处理
  •     2.2.3 相似度表示
  •     2.2.4 衡量标准
  •   2.3 社区发现
  •     2.3.1 问题概述
  •     2.3.2 社区的定义
  •     2.3.3 衡量标准
  •   2.4 小结
  • 第3章 复杂网络的相似度表示及链路预测应用算法
  •   3.1 问题描述
  •   3.2 基于Deepwalk和聚类算法的相似度表示
  •     3.2.1 Deepwalk算法
  •     3.2.2 K-means
  •     3.2.3 新的相似度表示Deep Affinity
  •   3.3 基于DA的链路预测算法
  •   3.4 实验分析
  •     3.4.1 数据集
  •     3.4.2 评价标准
  •     3.4.3 数据集预处理
  •     3.4.4 实验结果
  •   3.5 算法分析与总结
  •     3.5.1 时间复杂度
  •     3.5.2 优化方向研究
  •   3.6 小结
  • 第4章 基于相似度表示DA的社区发现算法
  •   4.1 标签传播算法
  •     4.1.1 基本理论
  •     4.1.2 标签传播算法的研究及应用
  •   4.2 基于边界点的社区发现算法
  •     4.2.1 问题描述
  •     4.2.2 算法概述
  •     4.2.3 增益分数计算指标
  •   4.3 基于DA的社区发现算法
  •   4.4 实验分析
  •     4.4.1 数据集
  •     4.4.2 评价标准
  •     4.4.3 实验分析
  •   4.5 算法分析与总结
  •     4.5.1 运行时间优化讨论
  •     4.5.2 算法改进方向讨论
  •   4.6 小结
  • 结论
  • 参考文献
  • 附录 A攻读硕士学位期间发表论文目录
  • 附录 B攻读学位期间参与的研究项目
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 王济彬

    导师: 蔡立军,莫继红

    关键词: 链路预测,相似度,社区发现

    来源: 湖南大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 湖南大学

    分类号: O157.5;TP301.6

    DOI: 10.27135/d.cnki.ghudu.2019.001780

    总页数: 71

    文件大小: 1670K

    下载量: 17

    相关论文文献

    • [1].基于曲线相似度的飞行着陆操作评价方法[J]. 交通信息与安全 2019(06)
    • [2].基于域间相似度序数的迁移学习源领域的选择[J]. 科学技术与工程 2020(20)
    • [3].一种图文组合相似度算法的设计与优化[J]. 软件工程 2020(08)
    • [4].基于超网络的微博相似度及其在微博舆情主题发现中的应用[J]. 图书情报工作 2020(11)
    • [5].说之以理[J]. 人力资源 2020(21)
    • [6].一种双层的微博用户相似度算法[J]. 情报杂志 2018(06)
    • [7].基于情景的结构化突发事件相似度研究[J]. 中国管理科学 2017(01)
    • [8].基于混合相似度的协同过滤推荐[J]. 软件导刊 2017(02)
    • [9].基于干扰相似度的多话题演化模型[J]. 电信科学 2017(09)
    • [10].软件相似度在成本估算中的应用[J]. 计算机应用与软件 2015(06)
    • [11].一种基于函数依赖的属性相似度调整算法[J]. 上海交通大学学报 2015(08)
    • [12].河马找亲戚[J]. 学生之友(童花果) 2016(12)
    • [13].十个中文流行语翻译[J]. 初中生辅导 2016(36)
    • [14].母爱[J]. 少年月刊 2017(05)
    • [15].基于多种测度的术语相似度集成计算研究[J]. 情报学报 2013(06)
    • [16].基于余弦相似度分类负荷预测[J]. 电力设备管理 2020(09)
    • [17].基于多尺度相似度特征的答案选择算法[J]. 系统工程与电子技术 2018(06)
    • [18].基于服务相似度的移动用户近似邻居选取方法[J]. 计算机工程 2018(05)
    • [19].基于文本属性的微博用户相似度研究[J]. 计算机技术与发展 2018(05)
    • [20].基于属性相似度的碎多边形自动聚合处理[J]. 测绘与空间地理信息 2013(11)
    • [21].基于共同邻居相似度的社区发现算法[J]. 信息系统工程 2014(05)
    • [22].色谱指纹图谱相似度方法的适应性研究[J]. 中国中医药信息杂志 2012(05)
    • [23].基于向量空间模型附加词义特征的句子相似度研究[J]. 成都信息工程学院学报 2012(03)
    • [24].中国-东盟自贸区二周年的比较研究——基于出口相似度与显性比较优势的分析[J]. 安徽行政学院学报 2012(03)
    • [25].色谱指纹图谱相似度方法的研究进展[J]. 中国实验方剂学杂志 2011(02)
    • [26].基于元相似度的推荐算法[J]. 计算机应用研究 2011(10)
    • [27].互信息启发的相似度组合图像检索算法[J]. 中国图象图形学报 2011(10)
    • [28].相似度法在综合分析投资环境中的应用[J]. 统计与决策 2009(15)
    • [29].一种改进相似度的协同过滤算法实现[J]. 电子科技 2020(02)
    • [30].基于曲线相似度的步态识别研究[J]. 中国新技术新产品 2020(07)

    标签:;  ;  ;  

    复杂网络的相似度表示及应用算法研究
    下载Doc文档

    猜你喜欢