张天则
(北京师范大学附属实验中学北京100032)
摘要CRISPR/Cas9是近年来发展起来的一种非常高效的基因组定点编辑技术。然而,很多研究表明设计的单一向导RNA(SingleguideRNA,sgRNA)通常会与基因组DNA发生一定概率的序列错配,从而引起非预期的基因组编辑,即所谓的脱靶效应(Off-targeteffects)。脱靶效应是制约CRISPR/Cas9基因编辑技术得以迅速发展的重要掣肘,CRISPR/Cas9脱靶检测则成为降低脱靶率的重要前提,引起了很多科学工作者的关注。本文将重点介绍现行的几种脱靶检测方法,并对其原理进行分析与对比研究。
关键词CRISPR/Cas9;脱靶检测基因组编辑;
CRISPR/Cas9系统最早于原核生物Streptococcuspyogenes的获得性免疫系统中发现,主要包括Cas9蛋白质、向导RNA(crRNA,CRISPRRNA)以及转运激活RNA(tracrRNA)。Cas9将基因组切割成DNA双链锻裂(doublestrandbreak,DSB),而crRNA与tracrRNA组成单一向导RNA(sgRNA)完成对于切割位点的识别。2012年,Jinek等首次在体外实验中发现CRISPR/Cas9技术的脱靶效应。2013年,JKeith团队等在人类细胞内的体内实验中也发现类似现象,并证实CRISPR/Cas9可以切割与crRNA存在5个碱基以内差异的基因序列。随后Patrick等人以人EMX1基因的4个不同位点为例,系统地验证了CRISPR/Cas9在人类细胞中的脱靶效率。本文将重点介绍近年来相对比较成熟的几种方法。
1CRISPR/Cas9脱靶体内检测方法
1.1生物信息预测结合基因检测或者酶切技术
生物信息预测结合基因检测技术是最早用来检测脱靶效率的方法。当前预测脱靶位点的权威生物信息软件较多,例如CRISPRDesign、E-CRISPR、Cas-OFF-inder、TargetFinder及CRISPRDesignTool。在生物信息预测完脱靶位点后,也可以使用T7核酸内切酶1(T7E1)进行酶切检测。T7E1能对DNA双链中不完全结合的碱基序列进行切割,用来检测特定位点基因的脱靶率。由于T7E1的酶切相比测序在时间成本及经济成本方面有优势,该法也得到较多应用。
1.2全基因组深度测序结合Sanger测序
全基因组测序实现可以通过呈现基因组全部信息,通过选择恰当的参照基因组过滤背景突变,通过数据分析获得含有PAM基序的潜在修饰位点,继而通过基因扩增以及Sanger测序等方法进行验证。然而该方法的测序成本以及数据分析成本不存在优势,同时由于测序精确度则限制了该法仅限于高频脱靶检测,而对于低频脱靶无法检出。
1.3体内检测标签法
在检测CRISPR/Cas9形成的DSB时,很多方法通过对DSB进行标签修饰。而通过检出标签实现对脱靶率的检测,这一大类方法称为标签法。本部分将介绍CRISPRCas9切割发生在细胞内的标签法,故称体内检测标签法,大致包括LAM-HTGTS,GUIDE-seq,BLESS等法。
1.3.1LAM-HTGTS
高通量全基因组易位测序(HTGTS)最早是用来检测DNA双链锻裂后发生染色体重组的一种方法。在CRISPR/Cas9相关的脱靶率检测中,Frock等人利用LAM-PCR替代传统的adapter-PCR或者circulation-PCR,极大地提高了检测通量。该法称为LAM-HTGTS,检测范围仅限于基于已知DNA双链断裂而检测与之融合的较近距离的片段。
1.3.2GUIDE-seq
2015年,Tsai等人建立了基因组范围通过测序无偏好检测DNA双链断裂的一种方法,即GUIDE-seq法。该法技术核心是利用两端均磷酸化修饰的双链DNA序列与Cas9/sgRNA一起转染靶细胞,继而将修饰标签整合到基因组中发生DSB的位置。该法能突破全基因组深度测序的检测频率,对低频突变也有较高的效果(可低至0.1%)。但该法由于受限于转染效率,仅限于对于容易发生转染细胞的脱靶率检测。
1.3.3BLESS
Crosetto等人于2013年建立了BLESS方法。通过利用生物素标签对DSB进行原位标记,并结合二代测序的检测方法进行脱靶率检测。PCR扩增可以实现对于生物素标记片段的富集,并通过二代测序实现脱靶位点检测。
2CRISPR/Cas9脱靶体外检测方法
2.1ChIP-seq
ChIP-seq或称染色质免疫共沉淀测序法,是基于失活的Cas9-sgRNA与靶序列及脱靶序列的结合,并通过传统的ChIP的方法获取与失活Cas9-sgRNA结合DNA片段并进行测序,从而获取潜在的脱靶位点。该法将Cas9切割功能失活,仅探讨与Cas9结合的位点,得到的脱靶率过高。2014年,Cencic等利用ChIP-seq方法获得43个潜在的脱靶位点,而实际过程中仅1个位点为实际切割位点,即实际脱靶位点。
2.2Digenome-Seq
Digenome-seq或称数字基因组测序,是基于计算机计算能力,将Cas9切割产生的平末端与其它粘性末端区分开,实现对脱靶位点的高效、高敏感度地检测。2016年,Kim将Cas9的片段扩展为0-2个碱基突出,提升了检测敏感度,可同时检测高达10个sgRNA介导的脱靶位点。
2.3体内检测标签法
如1.3中所述的体内检测标签法原理类似,当CRISPRCas9切割发生在细胞外时也可以对DSB进行标签标记,便称为体外检测标签法。
2.3.1Circle-seq
Circle-seq法是由Joung和Tsai等与2017年建立的一种方法,该法将剪切后的基因组进行环化处理,并用Cas9将环化后的基因组切割成线性基因组。通过二代测序获取切割位点信息,即脱靶位点。
2.3.2SITE-seq
与Circle-seq类似,SITE-seq也是通过Cas9对目的基因组进行体外切割,并在切口添加生物素及接头。通过PCR富集片段后由二代测序获取脱靶位点的信息。2017年,Cameron等在VEGFA和FANCF基因的研究中发现,SITE-seq的检出效率相较于GUIDE-seq、LAM-HTGTS以及Digenome-seq均有明显优势。
3体内检测和体外检测方法比较
生物信息预测结合基因检测或者酶切技术以及深度测序等均需要借助生物信息软件对目的基因组的潜在脱靶位点进行预测,但难以避免存在遗漏。GUIDE-seq、LAM-HTGTS以及BLESS检测中没有生物信息软件预测环节,对于基因组覆盖程度以及灵敏度等方面有大幅度提高。但GUIDE-seq等技术却对于细胞转染效率有较大依赖性。LAM-HTGTS检测法由于原理限制,其漏检问题依然是值得关注。BLESS方法的克服了核酸酶的限制,但只能检测固定时期内的切割,漏检率也偏高。体外检测法中,ChIP-seq方法使用了失活的Cas9,仅能检测与Cas9结合的位点,假阳性非常高。Digenome-seq的检测通量受到很大限制,但改进算法后的方法实现多个sgRNA共检的可能性。Circle-seq和Site-seq方法覆盖率以及灵敏度均非常让人满意,但由于其体外检测的本质,难以确定检测结果是否与体内中是否一致。
结语
CRISPR/Cas9技术的快速发展导致基因组定点编辑越来越容易,于此伴随而来的脱靶现象已经成为限制其广泛应用的重要因素。当前主要的脱靶检测技术在检测度准确性方面非常关注,但相伴而来的偏高的假阳性需要Sanger测序进行确认,增加了检测成本及工作量。当前主流的检测技术的精确度大致在0.1%的范围(0.01%–1%之间),然而该精确度依然不能确保CRISPR/Cas9技术推广的安全隐患。人们还需通过进一步的提高测序深度、优化检测试剂及改善检测方法等,优化检测系统将脱靶检测精确度提升至0.01%以内。本文通过对于检测脱靶方法的原理分析及对比,以期能帮助更多学者了解CRISPR/Cas9脱靶现象及检测方法,从而为脱靶检测技术的优化提供参考价值。
参考文献
1.CrosettoN,MitraA,SilvaMJ,BienkoM,DojerN,WangQ,KaracaE,ChiarleR,SkrzypczakM,GinalskiK,PaseroP,RowickaM,DikicI(2013).Nucleotide-resolutionDNAdouble-strandbreakmappingbynext-generationsequencing.NatMethods10,361–365.
2.HsuPD,LanderES,ZhangF(2014).DevelopmentandapplicationsofCRISPR-Cas9forgenomeengineering.Cell157,1262–1278.