基因组注释论文_祝海栋,李瑞琳,何小雨,赵丹,韩鑫胤

导读:本文包含了基因组注释论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:基因组,注释,黄瓜,基因组学,多倍体,基因,高通。

基因组注释论文文献综述

祝海栋,李瑞琳,何小雨,赵丹,韩鑫胤[1](2019)在《六倍体小麦基因组注释流程构建与优化》一文中研究指出野生小麦是异源六倍体,基因组规模较大(约14 GB),且包含大量重复序列.为了培育具有优良性状的新品种,首先要定位控制目标性状的基因,因此建立一个完整准确的基因组注释软件流程至关重要.传统的基因组注释方法基于数据库比对,具有叁个明显的缺点:一是比对速度慢;二是难以发现新基因;叁是软件选择没有统一标准.本文提出了一种新的生物信息学注释流程,结合了基因数据库比对、转录组高通量测序数据分析、全长转录组单分子测序数据分析等多种技术手段,实现了六倍体小麦科农9204基因组完整准确的注释,为揭示小麦生长发育规律和培育新品种提供了重要参考和软件技术支撑.(本文来源于《计算机系统应用》期刊2019年08期)

叶昕海,杨义,梅洋,肖花美,李飞[2](2019)在《草地贪夜蛾基因组注释及分析》一文中研究指出草地贪夜蛾Spodoptera frugiperda近年来在我国迅速扩散,造成了重大的经济损失,引起社会关注。草地贪夜蛾基因组序列对深入研究其迁飞、入侵和抗药性等特性具有十分重要的作用。目前,已有5个版本的基因组序列被公开报道,但3个版本无基因组注释信息。除以Sf 9细胞系为DNA来源的基因组版本外,其他版本的scaffold N50过小,拼接质量偏低。为此,本研究选取了scaffold N50最大的草地贪夜蛾Sf 9细胞系基因组进行了蛋白编码基因注释。该版本的基因组重复序列占比28.1%。CEGMA评估显示该本版本基因组可覆盖93.6%的核心基因,BUSCO评估显示可覆盖90.8%的核心基因。利用OMIGA注释流程预测到25 699个蛋白质编码基因,详细的基因序列可从InsectBase网站获得(http://www.insect-genome.com/FAW/),其中具有GO注释的基因为15 623个,具有KEGG注释的基因共有9 213个。选取了12个鳞翅目昆虫进行比较基因组学分析,发现草地贪夜蛾与斜纹夜蛾的亲缘关系最近,两者分化时间大约在1 284万年前。对12个鳞翅目昆虫蛋白质编码基因进行同源分析,在草地贪夜蛾中发现了2 490个单拷贝基因、891个鳞翅目特有基因、2 360个物种特异扩增基因和4 180个物种特异基因。GO富集分析显示,2 360个物种特异扩增基因主要参与DNA整合、代谢相关的生物过程;4 180个物种特异基因主要参与酶活性、光感受、糖代谢等,KEGG通路富集发现草地贪夜蛾特异基因主要参与氨基酸代谢、糖代谢和Wnt信号通路。本研究结果丰富了草地贪夜蛾的基因信息,对进一步了解其生物学特性、开发新型绿色防控方法具有指导意义。(本文来源于《环境昆虫学报》期刊2019年04期)

王益青[3](2019)在《B族链球菌耐药基因分析和构巢曲霉基因组注释》一文中研究指出近年来测序技术不断更新,测序成本大大降低。利用高通量测序技术结合生物信息学分析病原微生物的遗传特征,使我们对微生物的起源、演化、传播和致病机制等方面有了更深入的了解。本研究分为两部分,分别对临床样本中细菌和真菌病原进行高通量测序,结合序列分析和表型验证试验,揭示病原的遗传特征,耐药性和毒力特点。多耐药B族链球菌基因组序列分析研究目的B族链球菌(Group B Streptococcus,GBS)是引发新生儿感染主要病原之一。然而中国目前对GBS研究还处于初级阶段,缺乏对中国GBS菌株的基因组研究。本研究将通过基因组分析,获得中国GBS菌株的致病分型和耐药特点,为临床新生儿GBS感染的预防和治疗提供理论依据。研究内容通过高通量测序和公共数据库基因组数据收集,本研究对102株GBS中国株进行了分型鉴定,构建中国GBS菌群结构,结合菌株致病信息,分析致病菌株分型特点。并对所有菌株进行耐药基因筛查,结合药敏试验验证,分析中国GBS菌株的耐药特点和耐药菌株分布情况。研究方法使用高通量测序技术获得临床样本中GBS菌株的全基因组序列,并收集公共数据库中GBS中国菌株的测序数据,通过组装基因组共得到102株GBS全基因组序列。使用分子分型方法对所有菌株分型。分析基因组数据提取核心基因组SNP数据,系统演化分析构建中国GBS种群结构。通过序列比对,筛查GBS基因组中的耐药基因,分析耐药基因元件结构,并结合药敏试验,测试GBS菌株的耐药性。研究结果102株GBS主要分为5个群,中国GBS种群结构与国外报道结果一致。新生儿感染多由ST17型菌株引起,相比其他菌株ST17型菌株多携带有多重耐药基因。对ST17型菌株进一步分析显示,ST17型菌株在演化过程中分为两群,主要来自广州、深圳两地。ST17型菌株基因组内携带两种耐药基因元件,耐药菌株对四环素、大环内酯类和氨基糖苷类抗生素表现出很强的抗性。研究结论本研究首次从群体水平对中国GBS菌株基因组进行分析。分析得到新生儿感染菌株的分型特点,和GBS菌株的耐药性。耐药菌株携带的耐药基因元件可以通过水平基因转移使敏感菌株获得耐药性。以上结果表明,在应对新生儿GBS感染中要控制抗生素的使用,加快疫苗的开发与普及,控制耐药性毒力菌株在抗生素压力下发生扩张。构巢曲霉临床株基因组注释研究目的构巢曲霉(Aspergillus nidulans,A.nidulans)是曲霉属代表性物种,作为遗传学研究模式生物已有70多年的历史。同时构巢曲霉也是一种机会致病菌,感染多见于CGD或免疫缺陷患者,健康人感染构巢曲霉十分罕见。我们应用多种测序技术,对一株构巢曲霉进行基因组测序,并进行精细的基因组注释,为下一步比较基因组学和系统演化分析奠定基础。研究内容我们从罕见病例样本中分离得到一株构巢曲霉,命名为BJCH M5。我们对这株构巢曲霉进行分子生物学鉴定和形态学观察,并对其进行全基因组测序,整合转录组、蛋白质组数据完成了高精度的基因组注释。研究方法结合单分子实时测序(Single molecule real time sequencing,SMRT sequencing)技术和高通量染色体结构捕获(High throughput chromosome conformation capture,Hi-C)技术,我们对BJCH M5进行基因组测序和组装校正。因真核生物基因结构复杂,我们整合了转录组数据和蛋白质组质谱数据对基因组进行注释,并对注释结果进行验证。使用多种生物信息学软件和数据库对BJCH M5进行功能注释,最终得到高精度的基因组注释数据。研究结果我们首次发现一例无免疫功能缺陷的儿童患有构巢曲霉中枢神经系统感染的病例,对病原真菌进行鉴定和形态学观察。我们发现临床菌株BJCH M5与参考菌株FGSC A4表型差异很大,为进一步研究BJCH M5的遗传特征,我们对BJCH M5进行全基因组测序和高精度的基因组注释。BJCH M5共有8条染色体和一条线粒体,全基因组共有10949个基因,编码11470条转录本,其中17.6%的转录本有明确的功能注释,注释结果得到蛋白质组数据的验证。研究结论在本研究中,我们利用最新的测序技术和全面的数据分析流程,克服以往在真菌基因组测序和注释中的难点,首次获得了高质量的临床构巢曲霉菌株的基因组数据,为以后的曲霉基因组分析和致病机制研究奠定了坚实的基础。(本文来源于《军事科学院》期刊2019-05-27)

孙千代,徐杰英[4](2017)在《真核生物基因组注释的主要步骤及方法》一文中研究指出本文简要介绍了真核生物基因组注释的主要内容、步骤及方法。(本文来源于《生物学教学》期刊2017年12期)

谭涛,马明月[5](2017)在《借助野生黄瓜与栽培黄瓜的共线性分析改善基因组注释》一文中研究指出近缘物种基因组间保留了祖先的大量信息,具有较好的保守性。通过比较近缘物种的基因组序列可以获得大片段的共线性区域,而这些区域内包含了丰富的同源信息,可用来发现未知基因、改善基因组注释的质量。本研究中,首先,借助同样的基因组注释平台对它们进行了基因组注释。其次,通过比较两个全基因组序列获得共线性信息,然后基于共线性信息对他们的基因组注释进行改善。最终,在野生黄瓜中新注释出了909个基因,栽培黄瓜中新注释出了853个基因。结合野生与栽培黄瓜的转录组信息,在野生黄瓜中发现了87例开放阅读框(ORF)较长的基因被错误注释成多个ORF短基因,40例多个ORF较短的基因被过度预测成单个长ORF基因;相应地在栽培黄瓜中分别确定了166例和36例错误注释。(本文来源于《基因组学与应用生物学》期刊2017年10期)

刘金定[6](2017)在《EGAS:一个通用一体化真核基因组注释分析平台》一文中研究指出随着高通量测序技术发展,生物学研究中获得基因组序列变得越来越容易,大量真核基因组测序项目得以启动并相继完成。真核基因组注释分析工作具有跨学科、数据容量大、计算复杂性高等特点,因此基因组注释分析工作相对滞后。为此,我们设计并实现了一个通用一体化的在线服务平台(EGAS:Eukaryotic Genome Analysis Server)用于真核基因组注释和分析工作。用户通过WEB接口提交任务后,一个自动化的分析处理流程将被创建。该流程不仅涵盖了重复元件、非编码RNA和编码基因等常规的基因组结构注释功能,而且还包括上游基因组组装质量评估、下游编码基因功能注释和比较基因组学分析等功能。此外,它还能够产生丰富的图和表帮助研究人员快速了解基因组特征。(本文来源于《“农业健康与环境”组学大数据整合生物信息学研讨会论文集》期刊2017-08-04)

尤琪[7](2017)在《组学数据整合与功能模块化分析构建棉花全基因组注释体系》一文中研究指出棉花是世界上重要的经济作物之一,涉及农业和纺织工业两大重要的国民经济支柱产业。自2012年起,随着雷蒙德氏棉(D基因组)、亚洲棉(A基因组)和陆地棉(AD基因组)全基因组测序组装工作的相继完成,对棉花基因组结构和功能进行精细注释也越发迫切。目前公共平台已积累了大量的组学数据,通过对高通量转录组和表观基因组数据的整合与分析,在全基因组水平上对棉花基因进行精细注释,将有助于研究棉花生长发育和应对胁迫的调控机制。本研究以A基因组亚洲棉和异源四倍体AD组陆地棉为主要研究对象,整合现有转录组数据,分别构建了两种棉花的全基因组共表达网络,并根据不同的生长阶段和胁迫处理条件,利用基因表达谱展示手段进行网络动态解析,成功预测了调控重要农艺性状(如纤维生长和水分胁迫应答)的功能模块。为了提高预测的可信度,将全局共表达网络作为研究基础,加入直系同源分析、顺式作用元件分析和基因集富集分析(GO、KEGG和基因家族)等手段对基因功能进行模块化注释,并利用集团渗透算法分别在亚洲棉和陆地棉中确定了 1,155和1,884个共表达功能模块以及213和135个miRNA靶基因功能模块,对参与诸如代谢、病原体和胁迫应答、激素响应和生长发育等生物学过程的功能基因进行模块化挖掘。同时,结合单个棉花物种的模块化注释手段和比较基因组学分析,通过利用96,466对直系同源基因或16,142个同源基因群功能网络,比较子网络的组成、启动子区调控元件、基因表达谱和同源基因对,从而提高预测基因功能的可信度和降低复杂模块功能预测的难度。此外,使用实验室已有的棉花H3K4me3 ChIP-seq表观基因组数据和多种组织的RNA-seq转录组数据,对进化过程中基因组结构和基因功能的保守性和差异性进行分析和注释,从而在亚洲棉和陆地棉中预测出6,773和12,773个新转录本,并经过基因组共线性、ESTs和qRT-PCR的验证提高了转录本的可信度。运用H3K4me3修饰图谱结合共表达网络进行模块化分析的方法,试图解析了棉花生长发育中组蛋白修饰差异和基因表达差异间的联系。最后,构建的二倍体和多倍体棉花共表达网络分析平台ccNET,形成了整合基因组、转录组和表观基因组的多层面模块化比较分析体系,从而提高了棉花功能基因注释效率和注释范围(http://structuralbiology.cau.edu.cn/gossypium/)。另外,基于多组学整合和模块化分析手段,成功构建了谷子功能基因组数据库SIFGD(http://structuralbiology.cau.edu.cn/SIFGD/)来提高其基因功能注释率。整合的拟南芥表观基因组和转录组的公共数据实现了对miRNA基因初始转录起始位点的预测,并且通过构建PTSmiRNA(http://structuralbiology.cau.edu.cn/PTSmiRNA/)平台实现了结果的可视化。本研究采用多组学整合和模块化比较分析方法,充分发挥了多组学整合分析的互补性和高效性,实现了对棉花的基因组结构和功能基因的精细注释,以期对棉花生长发育和胁迫应答的功能模块研究提供新视角,并为刚刚测序的植物和多倍体植物或作物提供可行的模块化功能挖掘手段和功能基因组精细注释分析方案。(本文来源于《中国农业大学》期刊2017-06-01)

胡晓蓉[8](2017)在《基于二代叁代测序序列的热带爪蟾基因组注释》一文中研究指出测序技术发展日新月异,第二代高通量测序已成为主流技术广泛应用于各个领域,与此同时基于单分子读取的第叁代测序技术也逐渐发展起来。越来越多的测序项目得以开展,随之产生了大量各具特点的测序数据:第二代高通量测序精确度较高,但是测序序列读长较短;第叁代测序序列读长较长,但测序误差较大。充分挖掘并科学整合两种测序序列中的生物信息资源,进一步得到生物完整的基因组注释,对转录组学的研究具有重要意义。热带爪蟾凭借自身生长周期短、胚胎发育快、染色体为二倍体等优点,发展成为基因组学、早期胚胎发育学和遗传学等领域中重要的两栖类模式物种。本文针对热带爪蟾,基于二代叁代测序序列,设计了一套完整的基因组注释流程,注释流程分两部分:二代叁代序列的转录组组装和基于组装结果的基因组注释。第一部分利用二代序列通量高、精确度高的优势进行了从头组装和有参考组装两种方式初步构建转录本;借助二代序列对叁代序列进行校正得到全长转录本;将上述两种转录本比对到参考基因组上,获得具有更长序列的转录组。第二部分依赖从转录组中提取的开放型阅读框架构建热带爪蟾的隐马尔科夫模型,进行基因结构从头预测;比对获得热带爪蟾同源转录本;以组装获得的转录组为基础,结合基因结构从头预测结果和同源转录本,参考同源蛋白质序列等公共数据,最终整合得到热带爪蟾基因组注释。分析结果表明,本文设计的基因组注释流程有效发挥二代叁代测序序列的各自优点,整合两种测序序列进行转录组组装,参考不同来源的生物数据,获得丰富准确的注释证据,完整注释出两栖类真核生物的基因组信息。与已有的注释版本相比,本文最终获得热带爪蟾基因组注释增加了基因和编码区的数量,扩充了原有基因的长度,为后续的基因组功能注释、比较基因组分析和重测序等相关研究奠定了良好的基础。(本文来源于《厦门大学》期刊2017-04-01)

周永称,崔雷[9](2017)在《文本挖掘在基因组注释中的应用》一文中研究指出为了解生物医学文本挖掘技术在基因组注释方面的基本应用,以Web of Science(WOS)数据库中收录的关于生物医学文本挖掘技术在基因组注释方面的基本应用的文献作为来源文献,利用书目共现分析软件提取文献中的高被引论文,形成来源文献——高被引文献词篇矩阵,利用聚类软件对高被引论文进行同被引聚类分析,最后得到生物医学文本挖掘技术在基因组注释方面的基本应用,主要包括权威工具的使用、文本挖掘工具和算法的开发、文本挖掘工具的检验。(本文来源于《中华医学图书情报杂志》期刊2017年03期)

赵丽娜,郑金金,贺宝玲,李巍伟,唐红梅[10](2016)在《应用蛋白质组学方法完善福氏志贺菌基因组注释的研究》一文中研究指出常规的应用计算机软件注释基因存在缺陷,目前对基因组的准确注释依然是一项富有挑战性的任务本研究旨在应用蛋白质基因组学(proteogenomics)方法完善福氏志贺菌的基因组注释。提取福氏2a志贺菌301株(Sf2a301)的全菌蛋白,胰蛋白酶水解的肤混合物经二维液相色谱分离、在线ESI串联质谱分析,质谱数据检索Sf2a301的6个读码框数据库,鉴定结果进一步经过生物信息学分析和实验验证。本研究共验证了729个Sf2a301已注释基因的蛋白编码产物,鉴定蛋白在分子量、等电点和疏水性等理化性质方面的分布与Sf2a301基因组已注释蛋白的趋势一致。共发现了6个未注释的新基因,新基因得到了RT-PCR在转录水平上的进一步验证。蛋白质基因组学能够有效的完善志贺菌的基因组注释,不仅验证了已注释基因,而且能够发现新的基因补充其原有基因组注释库,这种策略有望被推广到其他经过测序的生物体基因组注释工作中。(本文来源于《基因组学与应用生物学》期刊2016年06期)

基因组注释论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

草地贪夜蛾Spodoptera frugiperda近年来在我国迅速扩散,造成了重大的经济损失,引起社会关注。草地贪夜蛾基因组序列对深入研究其迁飞、入侵和抗药性等特性具有十分重要的作用。目前,已有5个版本的基因组序列被公开报道,但3个版本无基因组注释信息。除以Sf 9细胞系为DNA来源的基因组版本外,其他版本的scaffold N50过小,拼接质量偏低。为此,本研究选取了scaffold N50最大的草地贪夜蛾Sf 9细胞系基因组进行了蛋白编码基因注释。该版本的基因组重复序列占比28.1%。CEGMA评估显示该本版本基因组可覆盖93.6%的核心基因,BUSCO评估显示可覆盖90.8%的核心基因。利用OMIGA注释流程预测到25 699个蛋白质编码基因,详细的基因序列可从InsectBase网站获得(http://www.insect-genome.com/FAW/),其中具有GO注释的基因为15 623个,具有KEGG注释的基因共有9 213个。选取了12个鳞翅目昆虫进行比较基因组学分析,发现草地贪夜蛾与斜纹夜蛾的亲缘关系最近,两者分化时间大约在1 284万年前。对12个鳞翅目昆虫蛋白质编码基因进行同源分析,在草地贪夜蛾中发现了2 490个单拷贝基因、891个鳞翅目特有基因、2 360个物种特异扩增基因和4 180个物种特异基因。GO富集分析显示,2 360个物种特异扩增基因主要参与DNA整合、代谢相关的生物过程;4 180个物种特异基因主要参与酶活性、光感受、糖代谢等,KEGG通路富集发现草地贪夜蛾特异基因主要参与氨基酸代谢、糖代谢和Wnt信号通路。本研究结果丰富了草地贪夜蛾的基因信息,对进一步了解其生物学特性、开发新型绿色防控方法具有指导意义。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

基因组注释论文参考文献

[1].祝海栋,李瑞琳,何小雨,赵丹,韩鑫胤.六倍体小麦基因组注释流程构建与优化[J].计算机系统应用.2019

[2].叶昕海,杨义,梅洋,肖花美,李飞.草地贪夜蛾基因组注释及分析[J].环境昆虫学报.2019

[3].王益青.B族链球菌耐药基因分析和构巢曲霉基因组注释[D].军事科学院.2019

[4].孙千代,徐杰英.真核生物基因组注释的主要步骤及方法[J].生物学教学.2017

[5].谭涛,马明月.借助野生黄瓜与栽培黄瓜的共线性分析改善基因组注释[J].基因组学与应用生物学.2017

[6].刘金定.EGAS:一个通用一体化真核基因组注释分析平台[C].“农业健康与环境”组学大数据整合生物信息学研讨会论文集.2017

[7].尤琪.组学数据整合与功能模块化分析构建棉花全基因组注释体系[D].中国农业大学.2017

[8].胡晓蓉.基于二代叁代测序序列的热带爪蟾基因组注释[D].厦门大学.2017

[9].周永称,崔雷.文本挖掘在基因组注释中的应用[J].中华医学图书情报杂志.2017

[10].赵丽娜,郑金金,贺宝玲,李巍伟,唐红梅.应用蛋白质组学方法完善福氏志贺菌基因组注释的研究[J].基因组学与应用生物学.2016

论文知识图

大豆疫霉基因组数据库注释两个编码Th...石:011K12基因组注释图:红色...常用的基因和基因组注释及存储...参与基因组的注释对蝴蝶兰基因组注释的可视...基于、珑b服务的基因组注释现...

标签:;  ;  ;  ;  ;  ;  ;  

基因组注释论文_祝海栋,李瑞琳,何小雨,赵丹,韩鑫胤
下载Doc文档

猜你喜欢