基于正则化自表示矩阵分解模型的生物网络关联预测研究

基于正则化自表示矩阵分解模型的生物网络关联预测研究

论文摘要

生物网络中的关联关系研究有助于寻找致病因子和潜在的药物靶点,对人类疾病的诊断、治疗和预防具有重要的价值。生物网络中的关联预测是生物医学领域的研究重点之一。生物网络分为同质网络和异质网络,本文分别选取了异质网络中的长非编码RNA(lncRNA)与疾病关联和同质网络中的基因合成致死关联为代表进行研究,设计出基于正则化自表示矩阵分解的生物网络关联预测模型,主要工作如下:(1)构建lncRNA、疾病和基因相似性矩阵。本文首先基于公开的相关数据库获取lncRNA—疾病关联数据和基因—基因合成致死关联数据,并将数据清洗和预处理,得到可用的数据集。从疾病分类数据库(Medical Subject Heading,MeSH)收集疾病的分类信息,从基因本体(Gene Ontology,GO)数据库收集基因语义信息,并利用这些信息计算疾病语义相似性、lncRNA功能相似性和基因语义相似性,构建相似性矩阵。(2)提出针对lncRNA与疾病关联预测稀疏正则化自表示模型,基于已知的关联关系数据,运用双侧稀疏表示的方法,分别学习出lncRNA和疾病的表示矩阵,并引入相关生物辅助信息以促进算法对两个表示矩阵的准确估计。算法对每个潜在的关联关系对打分排序,将分数高的关联关系对作为最有可能的候选集合。通过在LncRNADisease,MNDR和Lnc2Cancer三个数据集上的十折交叉验证实验,案例分析以及参数分析实验对模型进行评估,该模型都表现出良好的预测性能。(3)提出针对人类癌症基因合成致死关联预测图正则化自表示模型,基于已知的合成致死关联关系,通过图正则化自表示模型,从输入数据中学习出合成致死的自表示矩阵,再引入基因语义相似性信息来辅助模型的预测。通过图正则化自表示模型,计算出每个基因对成为合成致死基因对的概率。在SynLethDB数据集上的五折交叉验证实验和参数敏感性分析实验的结果充分证明了该模型在合成致死关联预测上的有效性。本研究针对异质网络和同质网络关联预测分别提出了稀疏正则化自表示模型和图正则化自表示模型,实验结果都充分表明了这两个计算模型在生物网络关联预测研究上具有一定的实用性,可为后续相关研究提供一定的借鉴作用。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 研究背景与难点
  •   1.2 国内外研究现状
  •     1.2.1 lncRNA—疾病关联研究现状
  •     1.2.2 基因—基因合成致死关联研究现状
  •   1.3 主要研究内容
  •   1.4 论文结构安排
  • 第2章 相似性矩阵构建与相关评价方法
  •   2.1 引言
  •   2.2 生物数据的获取与整理
  •     2.2.1 lncRNA与疾病关联关系对获取
  •     2.2.2 基因合成致死关联关系对获取
  •   2.3 lncRNA、疾病和基因相似性矩阵构建
  •     2.3.1 疾病语义相似性
  •     2.3.2 lncRNA功能相似性
  •     2.3.3 高斯核相似性
  •     2.3.4 基因GO语义相似性
  •   2.4 评价方法
  •     2.4.1 评价指标
  •     2.4.2 交叉验证
  •     2.4.3 案例分析
  •   2.5 对比算法
  •     2.5.1 lncRNA与疾病关联对比算法
  •     2.5.2 基因合成致死对比算法
  •   2.6 本章小结
  • 第3章 lncRNA与疾病关联预测稀疏正则化自表示模型
  •   3.1 引言
  •   3.2 模型设计原理与实现
  •     3.2.1 符号及问题陈述
  •     3.2.2 双侧稀疏表示
  •     3.2.3 lncRNA与疾病相似性辅助
  •     3.2.4 稀疏正则化自表示算法求解
  •   3.3 实验设置
  •   3.4 预测模型结果分析
  •     3.4.1 十折交叉验证
  •     3.4.2 参数调整分析
  •     3.4.3 案例分析
  •   3.5 本章小结
  • 第4章 人类癌症中基因合成致死预测图正则化自表示模型
  •   4.1 引言
  •   4.2 模型设计原理与实现
  •     4.2.1 符号及问题陈述
  •     4.2.2 自表示矩阵分解
  •     4.2.3 图正则化
  •     4.2.4 图正则化自表示矩阵分解
  •     4.2.5 图正则化自表示算法求解
  •   4.3 实验设置
  •   4.4 模型预测结果分析
  •     4.4.1 五折交叉验证
  •     4.4.2 参数调整分析
  •     4.4.3 案例分析
  •   4.5 本章小结
  • 第5章 总结与展望
  •   5.1 工作总结
  •   5.2 工作展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间研究成果
  • 文章来源

    类型: 硕士论文

    作者: 黄姜

    导师: 朱泽轩

    关键词: 生物网络,关联预测,与疾病关联,合成致死,计算预测模型

    来源: 深圳大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 数学,医学教育与医学边缘学科

    单位: 深圳大学

    分类号: R-05;O157.5

    总页数: 73

    文件大小: 2006K

    下载量: 11

    相关论文文献

    • [1].生物网络在生物功能分析中的应用[J]. 高师理科学刊 2018(03)
    • [2].疫情期间初三生物网络教学实效性的实践研究[J]. 基础教育论坛 2020(26)
    • [3].复杂生物网络分析的图聚类方法研究进展[J]. 食品与生物技术学报 2008(05)
    • [4].一款轻量级的复杂生物网络图形化分析软件的设计与实现[J]. 智能计算机与应用 2018(02)
    • [5].设计合理高效的生物网络课[J]. 中国信息技术教育 2011(18)
    • [6].生物网络型社会组织[J]. 办公自动化 2015(11)
    • [7].生物网络模体识别算法概述[J]. 科协论坛(下半月) 2010(02)
    • [8].复杂生物网络自动画图算法分析[J]. 计算机工程 2010(08)
    • [9].大规模生物网络马尔可夫聚类的并行化算法[J]. 计算机应用 2019(01)
    • [10].一种带权值图匹配算法的研究[J]. 福建电脑 2016(04)
    • [11].microRNA调控的生物网络[J]. 生命科学 2008(04)
    • [12].药物开发的未来——新疗法发展[J]. 西部皮革 2019(10)
    • [13].基于网络拓扑的生物网络关键节点识别研究进展[J]. 数学的实践与认识 2011(07)
    • [14].基于消息传递接口的大规模生物网络比对并行化算法[J]. 计算机应用 2014(11)
    • [15].使用Cytoscape对生物网络数据的建模和分析[J]. 农业网络信息 2017(06)
    • [16].几种人类生物网络的自相似性实证研究[J]. 计算机工程与应用 2011(16)
    • [17].矢量格兰杰因果关系及其在复杂网络中的应用[J]. 计算机工程与应用 2008(29)
    • [18].4G生活猜想[J]. 中国经济周刊 2013(40)
    • [19].书讯[J]. 军事运筹与系统工程 2010(04)
    • [20].网络药理学研究相关技术与应用[J]. 天津中医药大学学报 2015(02)
    • [21].生物网络研究进展述评(英文)[J]. 生物信息学 2011(02)
    • [22].基于生物网络的当归芍药散、桂枝茯苓丸治疗原发性痛经作用机制研究[J]. 中药材 2015(11)
    • [23].复杂网络理论在基因调控网络中的应用[J]. 重庆科技学院学报(自然科学版) 2009(05)
    • [24].基于生物网络与表达谱信息的基因功能预测与分析综述[J]. 计算机与应用化学 2017(02)
    • [25].第64届美国运动医学会年会关于“运动益处的生物网络”研究热点与趋势[J]. 北京体育大学学报 2017(08)
    • [26].网络药理学的研究方法与应用进展[J]. 药学实践杂志 2015(05)
    • [27].本期“复杂性科学”专栏评述[J]. 电子科技大学学报 2013(03)
    • [28].基因组水平上重构代谢网络的研究进展[J]. 药物生物技术 2012(02)
    • [29].异质生物网络的同步节律的实验研究[J]. 物理学报 2012(24)
    • [30].基于动态优化算法的复杂生物网络的状态调控[J]. 生物医学工程学杂志 2020(01)

    标签:;  ;  ;  ;  ;  

    基于正则化自表示矩阵分解模型的生物网络关联预测研究
    下载Doc文档

    猜你喜欢