基于多信息融合的复杂疾病相关miRNA预测算法研究

基于多信息融合的复杂疾病相关miRNA预测算法研究

论文摘要

MicroRNAs(miRNAs)是一类长度约20-24个核苷酸的内源性单链非编码RNA,主要利用碱基对与靶mRNA的3’端非编码区结合,进而降解或抑制其翻译,最终在转录后水平对靶基因的相关表达进行调控。已有研究表明,miRNA与人类的各项生命活动都有着重要联系,miRNA的异常表达或突变会导致各种复杂疾病的发生。传统的研究主要是利用生物实验来确定单个实体属性之间的关联,虽然生物实验的准确性较高,但是该方法对于设备成本、实验周期的要求较高。因此,如何利用生物信息学方法预测miRNA与疾病之间的关联已经成为生物医学领域的一个重要研究内容。本文主要基于生物复杂网络开展研究,结合多种生物学数据资源和计算机相关技术对致病miRNA的识别算法展开研究,本文的主要研究工作如下:(1)功能相似的miRNA通常与相似的疾病相关,对已知miRNA疾病关联组成的异构网络分析发现,绝大多数实验验证的疾病miRNA关联都与邻居节点组成的子图信息相关。因此,本文提出了一种基于子图提取的miRNA疾病关联预测算法SEMDA。该算法利用疾病间的语义关系数据和实验验证的miRNA疾病关联数据计算了miRNA相似性和疾病相似性并构建了双层异构网络;随后,利用异构网络中节点之间的关联性,采用重启随机游走机制提取与已知关联的紧密子图信息与标签,并采用逻辑回归模型进行训练。最后,利用该模型预测潜在miRNA疾病的关联。实验结果表明,该算法相对于比较算法有较高的预测性能。(2)随着生物组学相关数据的不断积累,越来越多的数据可以挖掘更多潜在有价值的信息,传统的miRNA疾病预测算法忽略了弱相关性样本关系即关联性较弱样本的存在。因此为了提高现有预测算法的准确性和效率,本文提出一种基于半监督学习模型的miRNA疾病关系预测框架。该框架首先利用K-Mediods聚类算法以及相似性数据对分别对miRNA和疾病聚类,并结合实验验证的miRNA疾病关联在未知关联样本中筛选出关联性较弱的样本数据;随后,应用现有算法对疾病miRNA分数进行初步预测。最后,将预测分数与弱关联性样本数据相结合得出候选miRNA并排序。从实验结果可以看出,该框架对现有算法预测性能具有显著的提升效果。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 研究背景与意义
  •   1.2 国内外研究现状
  •     1.2.1 基于机器学习的疾病miRNA关系预测方法
  •     1.2.2 基于复杂网络的疾病miRNA关系预测方法
  •   1.3 本文主要工作
  •   1.4 论文组织结构
  • 第2章 基于计算的疾病miRNA关系预测方法概述
  •   2.1 相似性计算方法
  •     2.1.1 疾病相似性计算
  •     2.1.2 miRNA相似性计算
  •   2.2 相关数据库介绍
  •   2.3 疾病miRNA关系预测评价指标
  •   2.4 本章小结
  • 第3章 基于子图提取的疾病miRNA关系预测算法
  •   3.1 引言
  •   3.2 相关概念
  •     3.2.1 异构网络
  •     3.2.2 重启随机游走
  •     3.2.3 Logistic Regression模型
  •   3.3 基于子图提取的疾病miRNA关系预测算法
  •     3.3.1 算法框架
  •     3.3.2 异构网络构建
  •     3.3.3 子图提取
  •     3.3.4 模型训练
  •   3.4 实验结果及分析
  •     3.4.1 实验数据
  •     3.4.2 实验场景设置
  •     3.4.3 实验结果分析
  •   3.5 本章小结
  • 第4章 基于半监督学习的疾病miRNA关系预测框架
  •   4.1 引言
  •   4.2 相关概念
  •     4.2.1 K-Mediods聚类算法
  •     4.2.2 弱关联(low correlation)
  •   4.3 基于半监督学习的疾病miRNA关系预测框架
  •     4.3.1 算法框架
  •     4.3.2 异构网络构建
  •     4.3.3 弱关联提取
  •     4.3.4 优化现有算法
  •   4.4 实验及结果分析
  •     4.4.1 实验数据
  •     4.4.2 实验场景设置
  •     4.4.3 实验结果分析
  •   4.5 本章小结
  • 结论
  • 参考文献
  • 附录A 攻读学位期间所发表的研究成果
  • 附录B 攻读学位期间所参加的科研项目
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 赵文贺

    导师: 骆嘉伟,彭政

    关键词: 疾病,异构网络,多信息融合,关系预测,随机游走

    来源: 湖南大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 数学,生物医学工程

    单位: 湖南大学

    分类号: R318;O157.5

    DOI: 10.27135/d.cnki.ghudu.2019.003346

    总页数: 64

    文件大小: 5492K

    下载量: 16

    相关论文文献

    标签:;  ;  ;  ;  ;  

    基于多信息融合的复杂疾病相关miRNA预测算法研究
    下载Doc文档

    猜你喜欢