论文摘要
MicroRNAs(miRNAs)是一类长度约20-24个核苷酸的内源性单链非编码RNA,主要利用碱基对与靶mRNA的3’端非编码区结合,进而降解或抑制其翻译,最终在转录后水平对靶基因的相关表达进行调控。已有研究表明,miRNA与人类的各项生命活动都有着重要联系,miRNA的异常表达或突变会导致各种复杂疾病的发生。传统的研究主要是利用生物实验来确定单个实体属性之间的关联,虽然生物实验的准确性较高,但是该方法对于设备成本、实验周期的要求较高。因此,如何利用生物信息学方法预测miRNA与疾病之间的关联已经成为生物医学领域的一个重要研究内容。本文主要基于生物复杂网络开展研究,结合多种生物学数据资源和计算机相关技术对致病miRNA的识别算法展开研究,本文的主要研究工作如下:(1)功能相似的miRNA通常与相似的疾病相关,对已知miRNA疾病关联组成的异构网络分析发现,绝大多数实验验证的疾病miRNA关联都与邻居节点组成的子图信息相关。因此,本文提出了一种基于子图提取的miRNA疾病关联预测算法SEMDA。该算法利用疾病间的语义关系数据和实验验证的miRNA疾病关联数据计算了miRNA相似性和疾病相似性并构建了双层异构网络;随后,利用异构网络中节点之间的关联性,采用重启随机游走机制提取与已知关联的紧密子图信息与标签,并采用逻辑回归模型进行训练。最后,利用该模型预测潜在miRNA疾病的关联。实验结果表明,该算法相对于比较算法有较高的预测性能。(2)随着生物组学相关数据的不断积累,越来越多的数据可以挖掘更多潜在有价值的信息,传统的miRNA疾病预测算法忽略了弱相关性样本关系即关联性较弱样本的存在。因此为了提高现有预测算法的准确性和效率,本文提出一种基于半监督学习模型的miRNA疾病关系预测框架。该框架首先利用K-Mediods聚类算法以及相似性数据对分别对miRNA和疾病聚类,并结合实验验证的miRNA疾病关联在未知关联样本中筛选出关联性较弱的样本数据;随后,应用现有算法对疾病miRNA分数进行初步预测。最后,将预测分数与弱关联性样本数据相结合得出候选miRNA并排序。从实验结果可以看出,该框架对现有算法预测性能具有显著的提升效果。
论文目录
文章来源
类型: 硕士论文
作者: 赵文贺
导师: 骆嘉伟,彭政
关键词: 疾病,异构网络,多信息融合,关系预测,随机游走
来源: 湖南大学
年度: 2019
分类: 基础科学,医药卫生科技
专业: 数学,生物医学工程
单位: 湖南大学
分类号: R318;O157.5
DOI: 10.27135/d.cnki.ghudu.2019.003346
总页数: 64
文件大小: 5492K
下载量: 16