结合社区结构信息的异构社交网络表示学习研究

结合社区结构信息的异构社交网络表示学习研究

论文摘要

近年来,微博,Facebook,微信等大型社交网络迅速普及,形成了海量的社交网络数据。海量的社交网络数据使得经典的网络表示方法在进行网络的数据挖掘时遇到了瓶颈,经典的网络表示方法在表示大型网络时存在占用空间过大,数据形式不利于后续的数据挖掘算法等问题。作为解决这些问题的一种途径,网络表示学习近年来受到了越来越多的研究者的关注。网络表示学习的目的是将网络中的节点映射到一个低维的向量空间中,把每一个网络节点表示为一个特征向量,使得原始网络的结构信息能够蕴含在向量中。网络表示学习通过把网络节点表示成一个低维向量,使得网络数据更容易存储,同时向量形式的网络数据也更容易作为机器学习算法的输入。然而网络表示学习算法的效果会随着社交网络的逐渐稀疏很快地降低。因为如果社交网络很稀疏,那么网络中的很多用户之间没有直接或者间接的联系,网络表示学习算法就无法确定用户向量在向量空间中相互之间的距离。为了解决这一问题,本文利用了社交网络中用户节点的属性信息。通过将用户的各种属性提取出来,形成新的属性节点,将其加入到社交网络中,形成新的异构社交网络。异构社交网络中用户之间通过不同类型的属性节点和链接关系互相链接,蕴含了丰富的语义关系,从而有效地缓解了社交网络的稀疏性问题。但是目前的网络表示学习算法主要是关注于同构网络的表示学习,即网络中的节点和链接关系都是同一个类型。而异构社交网络中包含了不同类型的节点和链接,用户节点之间的不同的链接类型蕴含着不同的语义关系,用户在不同语义关系下可能具有不同的距离,所以针对同构网络而设计的网络表示学习算法不一定能够很好地学习到社交网络中用户的向量表示。为了解决这一问题,本文提出了一种基于元结构的用户相似度计算方法,利用异构社交网络中不同类型的元结构来更加准确地描述用户之间在不同情景下的语义关系。然后使用栈式降噪自编码器融合多种关系信息,从而学习异构社交网络中用户的低维表示。此外,社交网络中往往存在着比较明显的社区结构,如果在异构社交网络表示学习过程中能够学习到社交网络的社区结构,那么学习到的网络节点向量则能够更加准确地反映出原始网络的结构特点。所得到的网络节点向量在后续的网络数据挖掘任务中也能发挥更好的效果,如用户节点分类等。基于此想法,本文通过把社交网络中的社区类比成自然语言中的主题,利用自然语言处理中的主题模型方法,学习到每个用户节点的社区信息。并将其加入到网络表示学习的过程中去,最终学习到社交网络中用户的最终表示。最后我们通过在三个真实数据集上的实验,验证了本文算法的效果。本文主要工作和创新点主要如下:(1)为了解决社交网络过于稀疏影响网络表示学习效果的问题,本文通过引入更加丰富的信息来缓解社交网络的稀疏性问题。通过挖掘用户节点的属性信息,加入到社交网络中,构造了新的异构社交网络。(2)针对同构网络表示学习算法不适用异构社交网络,无法准确地学习到网络中丰富的语义信息的问题,本文利用异构社交网络中的元结构,提出一种计算异构社交网络中用户相似度的方法。通过该方法来挖掘异构社交网络中的用户之间不同类型的语义信息。然后利用深度神经网络来融合多种语义信息,从而学习到网络的节点表示。(3)为了在网络表示学习中学习异构社交网络中宏观的社区结构信息,得到更加精确的用户表示,本文将社交网络中的社区类比成自然语言中的主题,然后借鉴自然语言处理方法中的LDA主题模型算法来学习用户的社区信息,并将其应用到网络表示学习中去。

论文目录

  • 摘要
  • abstract
  • 第1章 绪论
  •   1.1 研究背景和意义
  •   1.2 国内外发展现状
  •   1.3 本文主要研究内容
  •   1.4 论文组织结构
  • 第2章 相关理论基础
  •   2.1 异构信息网络
  •   2.2 自编码器
  •   2.3 降噪自编码器
  •   2.4 栈式降噪自编码器
  •   2.5 网络表示学习
  •   2.6 LDA主题模型
  •   2.7 本章小结
  • 第3章 结合社区结构的异构社交网络表示学习方法设计
  •   3.1 引言
  •   3.2 异构社交网络表示学习的问题定义
  •   3.3 异构社交网络中的用户相似度计算方法
  •   3.4 基于栈式降噪自编码器的异构社交网络表示学习算法
  •     3.4.1 多层前馈神经网络
  •     3.4.2 自编码器
  •     3.4.3 栈式降噪自编码器
  •     3.4.4 基于栈式降噪自编码器的表示学习算法
  •   3.5 结合社区结构信息的异构社交网络表示学习算法
  •     3.5.1 基于元结构的随机游走算法
  •     3.5.2 结合社区结构信息的表示学习算法
  • 第4章 实验结果与分析
  •   4.1 数据集
  •   4.2 对比算法
  •   4.3 实验方案与结果分析
  •     4.3.1 用户分类
  •     4.3.2 社区发现
  •     4.3.3 参数分析
  •   4.4 实验总结与讨论
  • 第5章 总结与展望
  •   5.1 工作总结
  •   5.2 研究展望
  • 参考文献
  • 作者简介及在学期间所取得的科研成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 王旭

    导师: 王喆

    关键词: 网络表示学习,异构社交网络,神经网络,元结构

    来源: 吉林大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,自动化技术

    单位: 吉林大学

    分类号: O157.5;TP181

    总页数: 61

    文件大小: 3488K

    下载量: 116

    相关论文文献

    • [1].一种适用于社交网络分析的分层社区检测算法[J]. 信息与电脑(理论版) 2019(24)
    • [2].图片[J]. 应用写作 2020(01)
    • [3].社交网络中的“自恋”和“表演”[J]. 传播力研究 2019(35)
    • [4].移动社交网络营销效果的影响因素实证研究[J]. 市场论坛 2019(11)
    • [5].基于社交网络的分布式机制设计[J]. 南京大学学报(自然科学) 2020(01)
    • [6].基于分层社区的社交网络异常事件检测模型研究[J]. 电脑知识与技术 2020(04)
    • [7].学术社交网络信息质量的治理和提升[J]. 图书情报工作 2019(23)
    • [8].在线社交网络控制实验的现状与展望[J]. 浙江大学学报(理学版) 2020(01)
    • [9].青少年自恋人格与问题性社交网络使用的关系:链式中介作用分析[J]. 中国特殊教育 2020(01)
    • [10].道德推脱与身份转化:社交网络欺凌中的旁观者效应[J]. 湖南大学学报(社会科学版) 2020(02)
    • [11].国内外学术社交网络的特征及案例分析[J]. 现代情报 2020(04)
    • [12].社交网络平台的盈利模式探析[J]. 中国集体经济 2020(10)
    • [13].社交网络用户发布模式和兴趣预测研究[J]. 计算机工程与应用 2020(09)
    • [14].学术社交网络用户使用动机与功能采纳的特征构成及关联分析[J]. 图书馆学研究 2020(06)
    • [15].超图结构下的在线社交网络中隐性影响力评估[J]. 系统工程学报 2020(01)
    • [16].社交网络文化语境下竖屏剧的创作研究[J]. 声屏世界 2020(04)
    • [17].《社交网络》:传记电影的虚构与拓写[J]. 电影文学 2020(09)
    • [18].社交网络平台对农村留守儿童社会化的影响[J]. 知识经济 2020(06)
    • [19].论社交型网络犯罪的防控体系构建[J]. 法制与社会 2020(13)
    • [20].科研机构用户利用学术社交网络的学科差异研究[J]. 情报科学 2020(06)
    • [21].图片介入社交网络带来的界面设计与功能[J]. 新闻文化建设 2020(03)
    • [22].基于异构社交网络信息和内容信息的事件推荐[J]. 软件学报 2020(04)
    • [23].韩国“N号房”事件对我国“社交网络儿童性剥削”问题的警示[J]. 青少年犯罪问题 2020(03)
    • [24].社交网络视角下高校图书馆知识服务创新探析[J]. 传媒论坛 2020(15)
    • [25].科技型中小企业社交网络招聘模式问题及对策研究[J]. 河北企业 2020(06)
    • [26].社交网络使用会影响用户心理健康么?——一项元分析研究[J]. 信息资源管理学报 2020(04)
    • [27].父母监督儿童使用社交网络的调查研究[J]. 教育文化论坛 2020(04)
    • [28].浅析“社交网络过度使用”术语使用混乱现象[J]. 现代交际 2020(12)
    • [29].在线社交网络的社区发现研究进展[J]. 图书情报工作 2020(09)
    • [30].在线社交网络信息流行度预测综述[J]. 计算机应用研究 2020(S1)

    标签:;  ;  ;  ;  

    结合社区结构信息的异构社交网络表示学习研究
    下载Doc文档

    猜你喜欢