Smith-Waterman算法优化改进与Spark并行化研究

Smith-Waterman算法优化改进与Spark并行化研究

论文摘要

Smith-Waterman算法是1种精确度最高、广泛应用于文本搜索的生物学序列比对算法。在对Smith-Waterman算法深入研究的基础上,从减少计算任务量和降低计算复杂度两个方面对算法进行优化改进,将优化改进算法基于Spark平台进行算法并行化设计,并通过准确性测试、算法运行速度测试、算法速度比较测试、算法可扩展性测试等实验分析优化改进算法和并行化算法的性能。实验结果表明:优化改进和并行化后的算法在保证准确性的前提下,极大地提高了算法运行速度和可扩展性。

论文目录

  • 1 SW算法研究与改进
  •   1.1 SW算法
  •   1.2 SW算法的优化改进
  •     1.2.1 降低计算任务量
  •       (1)利用式(1)和式(2)推导可得式(4)。
  •       (2)利用式(1)和式(2)推导可得式(5)。
  •       (3)同理,利用式(1)和式(2)推导可得式(7)。
  •     1.2.2 简化计算复杂度
  •     1.2.3 提出Opti-SW算法
  •   1.3 Opti-SW算法的准确性和对比实验
  •     1.3.1 Opti-SW算法准确度测试
  •     1.3.2 Opti-SW算法速度测试
  • 2 Opti-SW算法的并行化
  •   2.1 并行化思路
  •   2.2 并行化方案设计
  •     Stage1 求解所有比对得分过程
  •     Stage2 选取相似度高的序列过程
  •     Stage3 求解并输出最优比对过程
  •   2.3 SparkOSW算法相关实验
  •     2.3.1 SparkOSW准确性测试
  •     2.3.2 算法速度对比实验
  •     2.3.3 并行化方案效益测试
  •     2.3.4 SparkOSW算法可扩展性测试
  •     2.3.5 查询序列长度与运行时间的关系测试
  • 3 结论
  • 文章来源

    类型: 期刊论文

    作者: 李雷孝,刘燕凤,高静

    关键词: 基因序列比对,算法,优化改进,并行化

    来源: 内蒙古农业大学学报(自然科学版) 2019年05期

    年度: 2019

    分类: 农业科技,基础科学,信息科技

    专业: 生物学,计算机软件及计算机应用

    单位: 内蒙古工业大学数据科学与应用学院,内蒙古农业大学计算机与信息工程学院,内蒙古自治区农牧业大数据研究与应用重点实验室

    基金: 国家自然科学基金项目(61462070),内蒙古农业大学博士研究基金项目(BJ09-44)

    分类号: Q811.4;TP301.6

    DOI: 10.16853/j.cnki.1009-3575.2019.05.014

    页码: 76-85

    总页数: 10

    文件大小: 1199K

    下载量: 129

    相关论文文献

    • [1].面向过程的任务并行化设计方法[J]. 计算机系统应用 2015(09)
    • [2].“地理计算并行化”专辑导言[J]. 地球信息科学学报 2015(05)
    • [3].“地理计算并行化”专辑征稿[J]. 地球信息科学学报 2014(06)
    • [4].迎接并行化的明天[J]. 软件世界 2009(06)
    • [5].并行化改进遗传算法的FPGA高速实现方法[J]. 信息与电子工程 2012(01)
    • [6].设计结合建造——我国建筑运作模式的“并行化”操作研究[J]. 建筑学报 2019(04)
    • [7].图染色算法的并行化[J]. 电脑编程技巧与维护 2018(03)
    • [8].交通网络微观仿真并行化实现方法[J]. 系统管理学报 2014(04)
    • [9].有限差分法的并行化计算实现[J]. 电脑知识与技术 2008(07)
    • [10].有限差分法的并行化计算实现[J]. 微型电脑应用 2008(05)
    • [11].装箱问题近似算法的并行化研究[J]. 中国科技信息 2009(17)
    • [12].面向场景的人群疏散并行化仿真[J]. 系统仿真学报 2008(18)
    • [13].C形状分析在函数和路径层次上的并行化[J]. 电子技术 2015(08)
    • [14].提升小波并行化处理研究[J]. 价值工程 2011(34)
    • [15].聚类分析的并行化实现技术研究[J]. 电子设计工程 2015(02)
    • [16].太赫兹通信中高速数字信号处理并行化算法[J]. 太赫兹科学与电子信息学报 2017(06)
    • [17].人体姿势估计中随机森林训练算法的并行化[J]. 计算机应用研究 2014(05)
    • [18].基于深度学习的文本情感分析并行化算法[J]. 西南交通大学学报 2019(03)
    • [19].自优化转导支持向量机并行化[J]. 计算机应用 2017(S2)
    • [20].基于海量日志的入侵检测并行化算法研究[J]. 现代电子技术 2016(19)
    • [21].电力通信大数据并行化聚类算法研究[J]. 电子技术应用 2018(05)
    • [22].全景监控视频并行化处理[J]. 软件导刊 2015(11)
    • [23].基于MapReduce的主成分分析算法研究[J]. 计算机科学 2017(02)
    • [24].基于Spark平台的热点话题发现算法并行化研究[J]. 软件导刊 2016(09)
    • [25].云平台下全维度电力设备监测数据并行化处理技术[J]. 电测与仪表 2020(09)
    • [26].基于Spark的分布式大数据并行化聚类方法研究[J]. 湖北第二师范学院学报 2019(08)
    • [27].基于ATM并行化采样优化算法的研究[J]. 长春师范大学学报 2018(06)
    • [28].面向非规则Doacross循环的反馈式编译框架[J]. 信息工程大学学报 2018(01)
    • [29].基于Geant4的射线探测仿真并行化研究[J]. 核电子学与探测技术 2011(11)
    • [30].不同操作平台上的MCNP并行化计算[J]. 中国原子能科学研究院年报 2009(00)

    标签:;  ;  ;  ;  

    Smith-Waterman算法优化改进与Spark并行化研究
    下载Doc文档

    猜你喜欢