基于随机森林算法识别基因间长非编码RNA

基于随机森林算法识别基因间长非编码RNA

论文摘要

为了深入了解和探索lincRNA的调控机制,建立了lincRNA高效识别模型,有助于为后续研究提供数据源。依据最小自由能(minimum free energy, MFE)和信噪比(signal-noise ratio, SNR)等特征,并通过特征贡献度大小剔除冗余特征,构建随机森林(random forest, RF)分类模型,有效地识别lincRNAs。经检验,模型的灵敏度、特异性和精确度分别达到94.1%、93.2%和93.7%,高于现有PhyloCSF、LncRNA-ID和CPC方法的各项识别指标。模型在识别过程中表现出较好的鲁棒性,可准确识别lincRNA。

论文目录

  • 0 引言
  • 1 材料与方法
  •   1.1 材料
  •   1.2 特征选取
  •     1.2.1 最小自由能特征 (mininal free energy, MFE)
  •     1.2.2 信噪比特征 (signal-noise ratio, SNR)
  •     1.2.3 序列特征
  •   1.3 方法
  •   1.4 方法流程图
  •   1.5 评价标准
  • 2 结果与分析
  •   2.1 序列MFE的分析
  •   2.2 序列信噪比的分析
  •   2.3 信息特征选取及评价
  •     2.3.1 信息特征的选取
  •     2.3.2 信息特征的评价
  •   2.4 平衡数据集选取及评价
  •     2.4.1 平衡数据集的选取
  •     2.4.2 平衡数据集的评价
  •   2.5 分类模型选取及评价
  •     2.5.1 分类模型算法的选取
  •     2.5.2 分类模型算法的评价
  • 3 讨论
  • 文章来源

    类型: 期刊论文

    作者: 徐炜娜,张广乐,李仕红,陈园园,李强,杨涛,许明敏,乔宁,张良云

    关键词: 基因间长非编码,随机森林算法,最小自由能,信噪比

    来源: 山东大学学报(理学版) 2019年03期

    年度: 2019

    分类: 基础科学

    专业: 生物学

    单位: 南京农业大学理学院

    基金: 国家自然科学基金资助项目(11571173,11401311,11601231)

    分类号: Q811.4

    页码: 85-92+101

    总页数: 9

    文件大小: 1655K

    下载量: 135

    相关论文文献

    • [1].基于迭代随机森林算法的糖尿病预测[J]. 长春工业大学学报 2019(06)
    • [2].基于改进随机森林的城市河流水生态健康评价研究[J]. 海河水利 2019(06)
    • [3].基于随机森林癫痫患者脑电数据的分析研究[J]. 中国数字医学 2020(01)
    • [4].基于局部均值分解和迭代随机森林的脑电分类[J]. 吉林大学学报(信息科学版) 2020(01)
    • [5].网贷平台数据的随机森林预测模型实证分析[J]. 宜宾学院学报 2019(12)
    • [6].采用单类随机森林的异常检测方法及应用[J]. 西安交通大学学报 2020(02)
    • [7].随机森林数据情感挖掘方法分析[J]. 通讯世界 2020(01)
    • [8].运用最大熵模型和随机森林模型对东北红松分布的模拟[J]. 东北林业大学学报 2020(03)
    • [9].基于随机森林算法的城区土地覆盖分类研究[J]. 河北省科学院学报 2020(01)
    • [10].运用随机森林模型对北京市林分蓄积生长量的预测[J]. 东北林业大学学报 2020(05)
    • [11].融合人工鱼群和随机森林算法的膝关节接触力预测[J]. 中国医学物理学杂志 2020(04)
    • [12].结合特征选择和优化随机森林的无线网络数据丢失重建[J]. 上海电力大学学报 2020(03)
    • [13].基于随机森林算法的耕地质量定级指标体系研究[J]. 华南农业大学学报 2020(04)
    • [14].一种基于随机森林的组合分类算法设计与应用[J]. 电子设计工程 2020(16)
    • [15].基于随机森林算法的日光温室内气温预测模型研究[J]. 中国农学通报 2020(25)
    • [16].基于因子分析和迭代随机森林方法的学生成绩综合评价——以都匀市某高中为例[J]. 黔南民族师范学院学报 2020(04)
    • [17].基于随机森林模拟的辽宁省降水量空间分布研究[J]. 陕西水利 2020(09)
    • [18].随机森林模型在膝关节炎患者结构特征与症状定量分析中的应用(英文)[J]. 磁共振成像 2020(10)
    • [19].基于特征选择的极限随机森林算法研究[J]. 计算机应用研究 2020(09)
    • [20].随机森林回归分析方法在代谢组学批次效应移除中的应用[J]. 中国卫生统计 2020(05)
    • [21].一种面向非均衡分类的随机森林算法[J]. 计算机与现代化 2018(12)
    • [22].随机森林模型和决策树模型在肝硬化上消化道出血预后中的应用[J]. 中国卫生统计 2019(02)
    • [23].基于随机森林的债券违约分析[J]. 当代经济 2018(03)
    • [24].基于改进网格搜索算法的随机森林参数优化[J]. 计算机工程与应用 2018(10)
    • [25].随机森林在城市不透水面提取中的应用研究[J]. 云南师范大学学报(自然科学版) 2017(03)
    • [26].一种顺序响应的随机森林:变量预测和选择[J]. 小型微型计算机系统 2017(08)
    • [27].基于随机森林回归的军械器材需求预测[J]. 自动化应用 2017(09)
    • [28].流式大数据下随机森林方法及应用[J]. 西北工业大学学报 2015(06)
    • [29].面向高维数据的随机森林算法优化探讨[J]. 商 2016(04)
    • [30].深度随机森林在离网预测中的应用[J]. 计算机科学 2016(06)

    标签:;  ;  ;  ;  

    基于随机森林算法识别基因间长非编码RNA
    下载Doc文档

    猜你喜欢