从头测序论文_李森,何子文,郭子骁,施苏华

导读:本文包含了从头测序论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:转录,基因组,假发,贻贝,夜蛾,序论,喜树碱。

从头测序论文文献综述

李森,何子文,郭子骁,施苏华[1](2018)在《木榄基因组从头测序及群体历史分析》一文中研究指出红树植物是生长于热带、亚热带潮间带的一类木本植物,是生产力最高的生态系统之一,具有碳汇、保护水土、为底栖动物和鸟类提供栖息地等生态功能,同时红树植物也面临着全球气候变化和人类活动影响的双重威胁。木榄属(Bruguiera Lam.)是红树植物中的一大类群,共包括六个种,广泛分布于印度-西太平洋地区,其中木榄(Bruguiera gymnorhiza)、海莲(Bruguiera sexangula)和它们的中间型尖瓣海莲(Bruguiera rhynchopetala)是海南红树林群体的重要组成部分。之前的研究表明,角果木、白骨壤、正红树、海桑、桐花等红树植物类群都有很低的遗传多样性,说明红树植物面对全球气候变化时有较高的灭绝风险。而由于缺少参考基因组,从全基因组水平对于木榄属的系统发育、亲缘地理、群体历史、遗传多样性等方面的研究较为匮乏。木榄属在全球气候变化下的命运还未可知。我们通过Pacbio测序平台对从清澜港采集的一棵木榄进行了de novo全基因组测序,并通过Illumina文库对拼接结果进行校准,拼接共得到280.7Mb,N50序列长度为1.06Mb。对成对顺序马尔科夫链模型(PSMC)可以根据具有不同杂合位点密度的基因组片段推断出有效群体大小的波动,对基因组做PSMC分析的结果显示木榄的有效群体大小在近十万年间急剧降低,而此期间也是海平面有巨大波动的时期。在海平面趋于稳定的约七千年以来,有效群体大小仍处于一个较低的水平,说明海平面的剧烈波动会对红树植物的有效群体大小产生很大影响。结合木榄、海莲群体多样性的缺失,说明即使是广布的红树物种,可能也易于受到环境变化的影响,具有一定的脆弱性和灭绝的可能性,需要引起保护上的重视。后续也可以以木榄基因组为参考,从基因组水平对木榄属各个群体的多样性进行进一步分析。(本文来源于《中国植物学会八十五周年学术年会论文摘要汇编(1993-2018)》期刊2018-10-10)

杨皓,迟浩,曾文锋,周文婧,刘超[2](2017)在《pSite:肽段从头测序结果中氨基酸层次假发现率的控制方法研究》一文中研究指出基于质谱数据的蛋白质鉴定算法主要分为两类:数据库搜索和肽段从头测序。肽段从头测序方法不依赖于数据库信息,直接根据谱图中谱峰信息推断肽段序列。尽管该方法已经成为基于质谱数据的蛋白质鉴定的主流方法之一,目前仍然缺乏假发现率的质量控制手段。前人研究表明[1],从头测序方法得到的高分结果,其全长序列正确率不足70%。由于缺乏数据库信息,从头测序方法无法借助反库序列来模拟随机匹配,从而无法基于目标诱饵库的策略[2]来估计并控制FDR(false discoveryrate)。实际上,从头测序得到的结果往往存在部分氨基酸正确、部分错误的情况,所以我们进一步需要去估计氨基酸层次的假发现率(FAR, false amino-acid rate),FAR的概念是由本文第一次提出,其定义为超过某打分阈值的错误氨基酸数目除以所有氨基酸数目。本文提出了一种新的评估方法 p Site,可以估计从头测序结果中每个氨基酸的可信度,从而估计FAR。p Site针对待估计的氨基酸,将其领域氨基酸组成的序列标签进行全枚举,得到质量近似等于原始序列标签的背景序列标签,然后与剩余氨基酸连接得到背景肽段,计算原始肽段与打分最好的背景肽段间的打分分差作为特征,使用机器学习方法 SVM[3]对待估计氨基酸进行可信度的打分(如图1)。对于所有氨基酸的打分分布,使用两个Gamma分布去分别拟合正确、错误氨基酸的打分分布,并且使用EM算法[4]估计分布的参数,从而可以估计任意打分阈值之上的FAR。(本文来源于《第叁届全国质谱分析学术报告会摘要集-分会场5:有机/生物质谱新方法》期刊2017-12-09)

王丽萍,张兰,张燕宁,毛连纲,蒋红云[3](2017)在《基于转录组从头测序的数据分析揭示喜树碱诱导甜菜夜蛾细胞凋亡的因子和通路》一文中研究指出细胞凋亡在发育和维持组织内稳态过程中是一个重要的生理过程,其通过一系列基因有序地进行调控。据报道,喜树碱诱导甜菜夜蛾细胞凋亡,然而大多数参与基因和信号级联通路仍然是未知的。在本研究中,通过转录组测序的方法来检测喜树碱诱导的甜菜夜蛾细胞转录组,进而揭示甜菜夜蛾细胞凋亡的参与基因和通路。笔者获得了5 219个表达上调基因和4 377个表达下调基因。鉴定到106个凋亡相关调控因子,包括5个胱天蛋白酶家族成员;5个肿瘤坏死因子家族成员;4个Bcl-2家族成员;3个凋亡诱导因子家族成员;6个凋亡抑制蛋白家族成员;5个p53家族成员;5个Hippo信号通路成员;10个MAPK信号通路成员以及其他53个凋亡相关调控因子。我们对其中18个凋亡基因进行了实时荧光定量PCR验证。这些结果揭示了甜菜夜蛾细胞中存在经典的凋亡内在和外在通路,并为以后甜菜夜蛾细胞中的凋亡研究奠定了基础。(本文来源于《绿色生态可持续发展与植物保护——中国植物保护学会第十二次全国会员代表大会暨学术年会论文集》期刊2017-11-08)

闫燊,池旭,童凯,李昭玲,邓孟胜[4](2016)在《中药植物川牛膝基因组从头测序及分析》一文中研究指出川牛膝是我国重要大宗药材,但近年来品质退化严重,品种真伪混杂。为深入研究川牛膝有效成分积累的分子基础,采用第二代测序技术利用Illumina Hi-seq 2000测序平台对川牛膝进行全基因组测序,使用AByss进行初步组装,得到一个包含大量基因组序列信息的数据集,并对其进行重复序列及编码序列注释。在该测序结果基础上,初步预测得到川牛膝体内甾体合成途径,并对鉴定川牛膝真伪的SCAR分子标记进行了初步定位,为研究川牛膝主要有效成分杯苋甾酮的合成途径,改良川牛膝品质提供了基础。(本文来源于《中国农业科技导报》期刊2016年03期)

张春兰[5](2016)在《绵羊骨骼肌转录组高通量测序从头组装和特征分析》一文中研究指出本实验旨在对绵羊肌肉转录组进行组装分析,以丰富绵羊的基因组并为进一步对绵羊的相关基因的分子遗传学研究奠定基础。选取Illumina Hiseq 2000测序平台对杜泊羊和小尾寒羊的骨骼肌转录组文库进行了高通量测序,并对测序数据进行从头组装分析。结果表明:两个测序文库共得到103058824个长为2×90bp的高质量的测序序列,经从头组装共产生了145524个unigenes。两个文库间有5718个unigenes差异表达,经GO注释分析后发现它们主要分布在细胞、细胞过程和结合条目中。将两个文库的unigenes进一步组装得到70348个平均长为863bp的all-unigenes,其中35201个被注释到Nr数据库,12219个被注释到COG数据库,并与KEGG数据库中的258个功能通路中的蛋白质和氨基酸新陈代谢通路密切相关。(本文来源于《潍坊学院学报》期刊2016年02期)

杨皓,迟浩,刘超,张昆,曾文锋[6](2015)在《pNovo:基于串联质谱的从头测序方法的研究》一文中研究指出利用串联质谱进行蛋白质鉴定通常有两大类方法:数据库搜索与肽段从头测序。从头测序方法不需要数据库的辅助,而是直接从谱图中推导出肽段序列[1,2]。理论上,如果一条肽段碎裂得比较充分,以至于质谱中存在它的所有或大多数碎裂位置的离子,那么我们便有可能通过谱图中这样的连续谱峰的质量差推导出整个序列(图1)。我们在已有的p Novo算法研究[3,4]的基础上,使用机器学习算法识别离子类型,并将谱峰转化成相应的结点,将谱图转化成质谱连接图,通过快速计算前N长的路径的p DAG算法,生成候选肽段,通过机器学习方法理论产生带强度信息的理论谱图,与实验谱图匹配打分。p Novo软件主要有叁个贡献:1.谱图预处理,识别谱峰的离子类型,减少转化成质谱连接图的结点数,降低图的复杂度。2.细打分,使用机器学习方法自动学习碎裂规律,训练产生的模型用来产生肽段的理论谱图,并与实验谱图进行匹配打分,考虑了更多的离子类型,包括中性丢失离子、内部离子和亚氨离子。3.合并谱图方法,将相同母离子的谱图进行合并,考虑不同电荷的情况,不同电荷的谱图碎裂互补性更好,合并产生的谱图信噪比更高,提高谱图质量。p Novo和PEAKS7.5在多组数据集上进行了对比评测,p Novo的准确度比PEAKS7.5高5%,同时速度稍好于PEAKS7.5。此外,p Novo还能够有效支持HCD和ETD两种碎裂形成的谱图对以及不同酶切形成的谱图。pN ovo软件能够处理绝大多数的从头测序方法的研究工作,在后续阶段我们将优化算法并制作界面,方便生物学家的使用。(本文来源于《中国化学会第二届全国质谱分析学术报告会会议摘要集》期刊2015-10-16)

鲍林飞,王新星,何健瑜,范美华,高鹏[7](2015)在《基于Illumina平台的厚壳贻贝外套膜转录组从头测序》一文中研究指出为了解贻贝贝壳基质蛋白的分子多样性,采用Illumina高通量测序平台,对厚壳贻贝(Mytilus coruscus)外套膜组织开展转录组文库构建及从头测序研究,总计产出6 970 102 920nt数据,共77 445 588条干净阅读子;经序列拼接与组装,获得厚壳贻贝外套膜转录组单一基因共计106 452个,总长55 222 289nt,平均长度519nt,N50达到754nt;并对上述单一基因进行了生物学功能注释和聚类分析。为进一步挖掘贻贝贝壳基质蛋白相关基因,通过对单一基因的序列注释以及利用已知贝壳基质蛋白序列进行本地搜索,共鉴定出与12种已知贝壳基质蛋白同源的厚壳贻贝外套膜单一基因124条。通过对厚壳贻贝贝壳基质蛋白单一基因进行序列分析和比较,发现厚壳贻贝与其他软体动物,如鲍属、牡蛎属和珠母贝属等在贝壳基质蛋白组成以及序列上具有一定的保守性,暗示着贝壳基质蛋白可能具有共同的起源;同时,首次从贻贝属中发现了3种贝壳棱柱层特异的贝壳基质蛋白单一基因。这为后续贻贝贝壳基质蛋白的大规模鉴定以及对贝壳形成机制的探讨奠定了基础。(本文来源于《浙江大学学报(农业与生命科学版)》期刊2015年04期)

梁振山[8](2015)在《临床分离的Janibacter全基因组从头测序及比较基因组学研究》一文中研究指出本论文在临床微生物诊断中,发现并分离了一株少见细菌—Janibacter。我们首先通过扩增该分离株的16s rDNA并进行测序、序列比对,确定该分离株属于Janibacter菌属,因此,命名为Janibacter YFY001株。与此同时,我们验证了该细菌的药敏实验,发现JanibacterYFY001株对利福平、头孢他啶和克林霉素耐药。由于该菌属于高GC%含量菌种,所以,我们结合第二代和第叁代基因组测序技术,对所提取的Janibacter全基因组进行测序,并获得了YFY001株的全基因组信息。YFY001株全基因组大小为3.40Mbp,GC%为71.46%。随后,我们对其中可能与致病相关的调控系统以及致病因子,进行注释;并借助比较基因组的研究方法,将YFY001株与已经报道的两株环境株:HTCC2469和holey进行比较分析。最终发现了911个核心蛋白;而有1039个蛋白特异地存在于YFY001株中。本论文借助全基因组测序的方法,对临床分离的高GC含量的Janibacter YFY001,结合了第二代和第叁代测序技术,最终获得了YFY001株的全基因组序列。在YFY001株的全基因组中,我们发现了双组份调控系统、分泌系统等与致病性相关的蛋白。与环境株的比较基因组发现特异存在于YFY001株的蛋白可能也与其致病性有一定的关系。本研究结合基因组测序技术,对临床分离的少见菌株进行全基因组测序,对于阐明这类细菌的致病因子,为感染病人提供及时的治疗提供必要的依据。(本文来源于《南昌大学》期刊2015-06-01)

常征[9](2014)在《基于RNA测序技术的转录组从头拼接算法研究》一文中研究指出生物信息学是一门新兴的交叉学科,它利用数学、信息学、统计学和计算机科学的方法来研究和解决生物学的问题。当前生物信息学所研究的问题主要集中在分子生物学领域,其中一个非常重要而又极具挑战性的问题就是转录组的从头拼接,即利用转录组的测序片段来拼接出整个转录组中的所有表达的转录体。本文主要研究如何利用经典的组合优化模型来解决复杂真核生物转录组的从头拼接问题,这对于研究包括癌症在内的许多与可变剪接相关的人类疾病,具有十分重要的意义。随着第二代测序技术的发展,特别是RNA测序(RNA-seq)的出现,给转录组的拼接在计算上提出了前所未有的挑战。目前的转录组的拼接算法主要分为两大类,一类是基于参考基因组的拼接方法,一类是从头拼接方法。尽管基于参考基因组的方法比从头拼接方法表现要好,但是它的一个致命的缺点是必须要有一个高质量的参考基因组。而事实上,绝大多数生物根本不存在一个已知的基因组可供参考,在这种情况下,从头拼接算法就显得尤为重要。转录组的从头拼接比基于参考基因组的拼接在计算上更具有挑战性,尽管目前已经有了一些算法,但是效果并不理想。本文在分析当前拼接算法的基础上,提出了一个全新的转录组从头拼接算法(命名为Bridger),巧妙地利用基于参考基因组算法的一些技巧来弥补目前从头拼接算法的不足。在狗、人和老鼠的RNA测序数据上的测试结果一致表明,Bridger比当前所有的从头拼接算法都要好。Bridger拼接出了更多的全长的转录体,而给出的候选转录体的数目却很少,暗示着Bridger不仅提高了从头拼接算法的敏感性,也大大降低了预测结果中的假阳性。另外,在时间和内存的使用方面,Bridger也比绝大多数从头拼接算法要少很多。更有意思的是,Bridger在敏感性和准确性上甚至可以跟当前最好的基于参考基因组的算法Cufflinks相媲美。本文的新算法Bridger主要有以下几个创新点:(1)放弃了通常使用的deBruijn图,由RNA的测序片段来直接构建一个能更好地反映出每一个基因可变剪接结构的图——剪接图。(2)构造图的过程中利用双端测序的信息,不仅使得到的剪接图更加准确、完整,而且有效地控制了图的规模,从而降低了在图中寻找对应转录体的路的难度。(3)通过引进一个辅助图——兼容图,成功地将一个经典的组合优化模型——最小路覆盖模型——应用到转录组的从头拼接中,相比于以前的穷举方法,可以大大降低结果的假阳性。(4)通过给模型加权,巧妙地将测序的深度信息整合到模型中,大大提高了拼接的准确性,据我们所知,这是测序的深度信息第一次被成功地用在从头拼接算法中。尽管Bridger算法有很多优点,但是也存在不足。第一,当前的Bridger的代码实现还有待进一步优化,在构造剪接图的过程中实现并行化计算是我们的一个努力方向。第二,算法中的最小路覆盖模型,并不是对于任何情况都非常有效,有些比较特殊例子,该模型也表现不太理想,这时可以通过一些技巧来克服算法的不足。本文通过两个例子展示了Bridger在实际应用中重要价值。一个例子是利用Bridger对肺癌病人的RNA测序数据进行分析,发现了与致癌基因相关的可变剪接转录体以及它们在不同样本中的表达差异。另一个例子是利用Bridger分析狗的RNA测序数据,发现了很多当前基因组中尚未注释的新的转录体。最后,本文还介绍了转录组拼接下游的一些研究工作以及我们今后的几个研究方向。Bridger已经用C++语言实现成一个开源的软件,可以通过以下网址下载:https://sourceforge.net/projects/rnaseqassembly/files/?source=navbar(本文来源于《山东大学》期刊2014-05-12)

毕鹏程[10](2012)在《基于BWT的DNA从头测序重迭群生成算法》一文中研究指出随着遗传学研究的深入,特别是人类基因组计划完成之后,人们认识到取得各个物种的完整基因组序列对于生命本质的探索有着非常重要的作用。如今新一代DNA测序技术已经发展成熟并被广泛的使用,其前所未有的测序速度逐渐的促进了基于序列研究的基因组学的研究,同时也增加了对生物信息学算法的需求。新一代测序技术与传统测序技术相比有速度快、成本低和准确度高的优点,但是其产生的序列片段相对较短。由于传统测序技术开发的序列拼接算法已不适用于新一代测序技术,开发针对新一代测序技术的拼接软件已成为生物信息学领域里一个热门的课题。为此提出一种基于BWT的从头测序的重迭群生成算法,该算法利用BWT的搜索功能找到read之间的最优重迭从而实现序列拼接的目的。首先通过分析实验数据,总结出read数据的特点。然后对序列拼接问题进行分析和建模并给出解决方案。接着详细介绍了整个BWT索引的建立过程,讲述了BWT的原理和作用,以及BTW索引的数据结构和使用方法。对DNA序列拼接过程中需要用到的BWT的向前匹配算法进行了描述,设计了向后匹配算法,并分析了这些算法的时间和空间性能。然后就整个contig的生成过程进行了介绍。首先给出contig生成算法的整体流程,接下来就基于BWT的contig的最佳重迭查找算法进行了具体叙述。然后讲述了contig的延伸算法,主要分正向延伸和反向延伸。并针对之前生成的contig集合里的重复问题提出了contig的修剪算法。最后,评价了算法输出的效果,并与EULER-SR算法进行对比。可以看出我们的序列拼接算法所产生的contig的长度较短,数量较多,仍然有很大的改进空间。但是时间和空间上有很大改善,这对于人类这种大型基因组的拼接有很大的实用意义。(本文来源于《哈尔滨工业大学》期刊2012-07-01)

从头测序论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

基于质谱数据的蛋白质鉴定算法主要分为两类:数据库搜索和肽段从头测序。肽段从头测序方法不依赖于数据库信息,直接根据谱图中谱峰信息推断肽段序列。尽管该方法已经成为基于质谱数据的蛋白质鉴定的主流方法之一,目前仍然缺乏假发现率的质量控制手段。前人研究表明[1],从头测序方法得到的高分结果,其全长序列正确率不足70%。由于缺乏数据库信息,从头测序方法无法借助反库序列来模拟随机匹配,从而无法基于目标诱饵库的策略[2]来估计并控制FDR(false discoveryrate)。实际上,从头测序得到的结果往往存在部分氨基酸正确、部分错误的情况,所以我们进一步需要去估计氨基酸层次的假发现率(FAR, false amino-acid rate),FAR的概念是由本文第一次提出,其定义为超过某打分阈值的错误氨基酸数目除以所有氨基酸数目。本文提出了一种新的评估方法 p Site,可以估计从头测序结果中每个氨基酸的可信度,从而估计FAR。p Site针对待估计的氨基酸,将其领域氨基酸组成的序列标签进行全枚举,得到质量近似等于原始序列标签的背景序列标签,然后与剩余氨基酸连接得到背景肽段,计算原始肽段与打分最好的背景肽段间的打分分差作为特征,使用机器学习方法 SVM[3]对待估计氨基酸进行可信度的打分(如图1)。对于所有氨基酸的打分分布,使用两个Gamma分布去分别拟合正确、错误氨基酸的打分分布,并且使用EM算法[4]估计分布的参数,从而可以估计任意打分阈值之上的FAR。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

从头测序论文参考文献

[1].李森,何子文,郭子骁,施苏华.木榄基因组从头测序及群体历史分析[C].中国植物学会八十五周年学术年会论文摘要汇编(1993-2018).2018

[2].杨皓,迟浩,曾文锋,周文婧,刘超.pSite:肽段从头测序结果中氨基酸层次假发现率的控制方法研究[C].第叁届全国质谱分析学术报告会摘要集-分会场5:有机/生物质谱新方法.2017

[3].王丽萍,张兰,张燕宁,毛连纲,蒋红云.基于转录组从头测序的数据分析揭示喜树碱诱导甜菜夜蛾细胞凋亡的因子和通路[C].绿色生态可持续发展与植物保护——中国植物保护学会第十二次全国会员代表大会暨学术年会论文集.2017

[4].闫燊,池旭,童凯,李昭玲,邓孟胜.中药植物川牛膝基因组从头测序及分析[J].中国农业科技导报.2016

[5].张春兰.绵羊骨骼肌转录组高通量测序从头组装和特征分析[J].潍坊学院学报.2016

[6].杨皓,迟浩,刘超,张昆,曾文锋.pNovo:基于串联质谱的从头测序方法的研究[C].中国化学会第二届全国质谱分析学术报告会会议摘要集.2015

[7].鲍林飞,王新星,何健瑜,范美华,高鹏.基于Illumina平台的厚壳贻贝外套膜转录组从头测序[J].浙江大学学报(农业与生命科学版).2015

[8].梁振山.临床分离的Janibacter全基因组从头测序及比较基因组学研究[D].南昌大学.2015

[9].常征.基于RNA测序技术的转录组从头拼接算法研究[D].山东大学.2014

[10].毕鹏程.基于BWT的DNA从头测序重迭群生成算法[D].哈尔滨工业大学.2012

论文知识图

人类基因组测序的价格Figure1.1Price...软件通过从头测序算法计...2.5图论类从头测序方法的基本流...结构变异检测方式(Alkanetal.,2011)近5年利用RNA-seq研究的非模式生物数量...

标签:;  ;  ;  ;  ;  ;  ;  

从头测序论文_李森,何子文,郭子骁,施苏华
下载Doc文档

猜你喜欢