测序,简单来说就是将DNA化学信号转变为计算机可处理的数字信号。
一代测序
首先讲一下测序的基础方法,Sanger测序(Sanger et al.,1977)
1977年Frederick Sanger和同事发展出双脱氧测序法(dideoxy sequencing method)或称链终止法,对噬菌体phiX-174测序以来,测序原理并未有太多变化。后来测序方法的改革也几乎都是在此基础上,缩短时间,降低人力,比如①在每一种ddNTP中掺入不同的荧光标记,使测序在单一反应中就能进行。②使用极薄极长的充胶玻璃毛细管代替大的聚丙烯酰胺凝胶块,新的介质散热更快,使电泳能在高压下进行,降低分离时间等诸如此类的变革。③更换探查单一核苷酸的方法,用微转换器控制通过的电流检测核苷酸等等。
Sanger法测序需要引物,DNA聚合酶,脱氧核糖核苷三磷酸(dNTPs),有限量的双脱氧核苷三磷酸(ddNTPs)。按照碱基配对原则,dNTPs在引物之后按照模板延伸,ddNTPs的随机加入会由于它缺乏连接下一个的3’羟基而导致反应终止,由于ddNTPs的结合位置随机,我们会得到一系列大小不同的片段,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或同位素标记进行检测。也正是这个原理,所以测序得到较长的序列的概率低,长序列往往需要双向测序再进行拼接。
https://www.sigmaaldrich.com/technical-documents/articles/biology/sanger-sequencing.html
Maxam gilbert化学法测序(Maxam and Gilbert,1977)
几乎同时,Maxam和Gilbert发明了化学链降解法测序。
通过化学终止反应测序。首先双链变单链,准备工作完成。采用特定的化学试剂来从DNA链上断裂特定碱基,在5’端磷酸化(32P),四种化学反应:G反应,A+G反应,T+C反应,C反应,分别进行并产生一系列片段。然后进行电泳(electrophoresis),放射自显影(radioautography),最后可以整理得到序列。
二代测序(目前拥有这些测序仪的公司主要有Illumina,Thermo Fisher Scientific(已收购life,ABI, Ion torrent公司,所以在TFS官网可以找到这些测序仪),Roche)
一些和前后都没有紧密联系的概念
深度测序(deep sequencing)不是什么测序方法,而是根据对目的基因测序的depth和coverage(C)对测序方法的归类。如果这个片段被测序了大于7次(coverage>7),那么基本可以说是深度测序,大于100×称为ultra deep sequencing。还有一些概念比如length of genome(G)指全基因组长度,number of reads(N)片段数量,average read length(L)。
C=N×(L/G)
pyrosequencing焦磷酸测序法(Ronaghi, 2001)-454二代测序(Jarvie, 2005)
焦磷酸测序法
它后来发展称为Roche公司454技术所使用的测序方法。
是一种酶联级联测序技术,准确度可与Sanger媲美,且速度大大提高。具备同时对大量样品进行测序分析的能力,为大通量,低成本,快速地进行单核苷酸多态性(single nucle-otide potymorphisms, SNPs)研究提供了理想的技术支持。改进后的焦磷酸测序技术可以满足上百个核苷酸测序。但是测序长度一般在100bp左右,一直用于短序列分析。它的技术原理是4种酶在同一反应体系种级联化学发光反应,引物与模板DNA退火后,在DNA聚合酶,ATP硫酸化酶(ATP sulfurytase),荧光素酶(luciferase)和磷酸酶(Apyrase)协同作用下,检测荧光,实时测定DNA序列。
https://en.wikipedia.org/wiki/Pyrosequencing
454测序-固定的焦磷酸测序体系(2016年被Roche公司淘汰)
首先是序列处理:全基因组DNA处理为小的片段(鸟枪法处理的),在末端分别连接A和B(A,B是互补,可以在PCR中产生大量的目的序列),然后解链变成带有adaptors的单链DNA,这个adaptorA的序列可以与小珠子上面的短序列B匹配,这样我们要测序的片段就被固定了。小珠子是不可溶的且与酶不反应的分子,作为固定表面。然后进行乳化PCR,得到了满载分子的小珠子并将它们放入小孔。接下来是焦磷酸测序的原理,引物是adaptorA,每次反应加一种dNTP,如果可以碱基配对,会在DNA聚合酶下结合在引物末端,释放一个分子的焦磷酸(PPi)。在ATP硫酸化酶作用下,PPi与APS结合形成ATP,ATP与荧光素在荧光素酶作用下形成氧化荧光素,产生可见光。反应后冲洗掉剩余dNTP和少量ATP。
https://www.researchgate.net/figure/The-454-pyrosequencing-approach_fig1_221779630
大多数现代测序方法都是分为这几步,主旨是实现高通量和自动化。①全基因组片段化。②adapter ligation末端连接短序列。③目标DNA与分子小珠子的结合。④将小珠子加载到孔板。⑤采用适合的方法测序。⑥数据处理。
连接酶法测序(Sequencing by ligation)(Albrecht et al.,2000)-ABI公司SOLID测序 (Hedges et al.,2011)
连接酶测序法
利用的是DNA ligase的一个特性。连接酶是将DNA分子末端连接在一起的酶,它对DNA结构敏感,如果两条链的碱基不匹配,那么酶的效率很低。
具体如下图,模板链连接P1Adaptor,引入引物Pn与探针寡核苷酸混合物,一般8-9bp,前两个是与模板结合的碱基,中间三个为universal配对,后三个也是且5’连接荧光标记。在酶的作用下,正确配对的探针偏向与模板结合,然后荧光信号被检测并切除,露出5’端,继续反应。中间NNN的碱基部分可以通过加入引物Pn-1的方法,进行错位测序,之后整合数据。
https://www.researchgate.net/figure/Schematic-representation-of-SOLiD-sequencing-by-ligation-Primers-hybridise-to-the-P1_fig2_46158532
ABI公司SOLID测序平台
在前期准备上与454测序相似,也会用到小分子的beads。但是测序方法为连接酶法,不是焦磷酸。
鸟枪法(shotgun sequencing)(Sutton et al.,1995)测序- Ion torrent 公司PGM测序(Merriman et al.,2012)
鸟枪法
传统的sanger法适合短一些的序列,当处理比如人类基因组的长序列时,需要鸟枪法将长序列变成短序列。并不是一个独特的测序方法,应该算是前处理技术。这些通过鸟枪法处理得到的短序列位点和长度随机,称为contigs(重叠群/连接片段)。然后用不同的测序方法测序,将结果输入电脑,它用算法(algorithm)将contigs的重叠部分进行拼接,得到完整序列。
https://www.genome.gov/genetics-glossary/Shotgun-Sequencing
Ion Torrent公司Proton测序仪
此方法比较快速。测序的原理与其他的不同,检测的不是荧光信号,而是核苷酸结合时释放的氢离子H+。同样全基因组→片段化,单链→连接adaptor→adaptors配对连接beads小分子→乳化PCR amplify。这些步骤与其他二代测序一样,不同的是Ion Torrent采用半导体芯片代替之前的孔板,加载携带序列的小分子在芯片上,芯片由可以承载小分子beads的孔和感受pH的传感器构成,这样前期准备就完成了。测序也是逐个加入四种核苷酸,检测产生的氢原子对溶液pH的影响,收集处理信号。
http://www.genomics.cn/en/
illumina公司测序平台目前占据大部分市场,以HiSeq系列为主(Quail et al., 2008)
特点是很便宜,速度也很快。①前期对基因组的片段化以及两端连接adaptorA,B与其他二代测序技术类似,②不同的是它没有用beads,核心反应容器是可以吸附流动DNA片段的测序流动槽(flowcell),每个flowcell上有8个道(lane),lane上面有与adaptorA,B相互配对的序列,所以可以固定DNA。③桥式PCR扩增与变性。先因为adaptorA,B序列而结合,形成拱桥性状,开始扩增,完成后双链和两端会再变性分开,新产生的单链作为模板再开始桥式反应。最后的结果是会产生一簇正反向的目的片段(详见下图)。④测序,检测荧光信号,整合结果。
https://en.wikipedia.org/wiki/Illumina_dye_sequencing
第三代测序
PacBio公司的SMRT和OxfordNanopore Technologies纳米孔单分子测序技术被称为第三代测序技术。其特点是不需要进行扩增,就是说小分子beads/桥式PCR的步骤是不需要的,而且产生的reads(读长)较长(>20kb)。
PacBio公司的SMRT(Rhoads and Au,2015)
这个方法有点在上面提了,且速度快,由于是实时检测,所以还可以检测碱基的表观修饰情况,如甲基化。但是缺点是错误率太高,以缺失序列和错位居多。SMRT芯片为测序载体(如同flowcell),不同碱基用不同荧光标记,在合成配对时检测荧光信号。
实现实时长序列测序的关键第一是采用的DNA聚合酶的活性保持,第二是区分配对的反应信号与周围游离碱基的强大背景荧光,采用零模波导孔原理,在反应管(SMRTCell:单分子实时反应孔)中有许多圆形纳米小孔达到降噪检测的目的。
https://www.sciencedirect.com/science/article/pii/S1672022915001345
Oxford Nanopore 的MinION(Mikheyev and Tin,2014)
是基于电信号的测序。它的特点是仪器真的非常小,reads更加长(几十甚至上百kb),而且DNA在测序中不被破坏,但是错误率同样很高。它能够直接读取出甲基化的胞嘧啶,而不必像二代测序方法那样需要事先对基因组进行bisulfite处理,这是因为存在表观修饰的碱基激发的电流强度是不同的。这对于在基因组水平直接研究表观遗传等相关现象有极大的帮助。
技术核心是特殊的纳米孔,孔内共价结合分子接头。当DNA分子通过纳米孔时,它们使电荷发生变化,从而短暂地影响流过纳米孔的电流强度(每种碱基所影响的电流变化幅度是不同的),最后高灵敏度的电子设备检测到这些变化从而鉴定所通过的碱基。
https://zhuanlan.zhihu.com/p/28299643
参考文献
Albrecht, G., Brenner, S., Dubridge, R.B., Lloyd, D.H., and Pallas, M.C. (2000) Massively parallel signature sequencing by ligation of encoded adaptors. In: Google Patents.
Hedges, D.J., Guettouche, T., Yang, S., Bademci, G., Diaz, A., Andersen, A. et al. (2011) Comparison of three targeted enrichment strategies on the SOLiD sequencing platform. PloS one 6.
Jarvie, T. (2005) Next generation sequencing technologies. Drug Discovery Today: Technologies 2: 255-260.
Maxam, A.M., and Gilbert, W. (1977) A new method for sequencing DNA. Proceedings of the National Academy of Sciences 74: 560-564.
Merriman, B., D Team, I.T., and Rothberg, J.M. (2012) Progress in ion torrent semiconductor chip based sequencing. Electrophoresis 33: 3397-3417.
Mikheyev, A.S., and Tin, M.M. (2014) A first look at the Oxford Nanopore MinION sequencer. Molecular ecology resources 14: 1097-1102.
Quail, M.A., Kozarewa, I., Smith, F., Scally, A., Stephens, P.J., Durbin, R. et al. (2008) A large genome center's improvements to the Illumina sequencing system. Nature methods 5: 1005.
Rhoads, A., and Au, K.F. (2015) PacBio sequencing and its applications. Genomics, proteomics & bioinformatics 13: 278-289.
Ronaghi, M. (2001) Pyrosequencing sheds light on DNA sequencing. Genome research 11: 3-11.
Sanger, F., Nicklen, S., and Coulson, A.R. (1977) DNA sequencing with chain-terminating inhibitors. Proceedings of the national academy of sciences 74: 5463-5467.
Sutton, G.G., White, O., Adams, M.D., and Kerlavage, A.R. (1995) TIGR Assembler: A new tool for assembling large shotgun sequencing projects. Genome Science and Technology 1: 9-19.