SARS-CoV-2基因组测序专题(一)

浅谈SARS-CoV-2基因组测序

写在前面的
由于全球COVID-19疫情的持续且越来越严重。使用大规模测序监测SARS-CoV-2的流行已经成为一种常规手段。然而在SARS-CoV-2的测序过程中经常出现不能完全覆盖基因组的情况。这是由于SARS-CoV-2属于RNA病毒,常规的测序样本大多来自于鼻咽拭子样本。因为鼻咽拭子样本中富含大量宿主背景核酸、微生物组背景核酸,相比之下SARS-CoV-2的核酸丰度很低。因此,针对SARS-CoV-2的基因组测序通常采用微量RNA建库模式。(注意,如果采用普通RNA建库策略是基本测不到SARS-CoV-2的)。在选择微量RNA建库模式下,一般选择测序量10G左右。通常能通过基因组数据监测到SARS-CoV-2相关reads。

10G换一个SARS-CoV-2是否划算?

        首先,这个问题不能以偏概全。这个问题需要看场合,例如某个地方突然的爆发一个疫情,第一个患者的样本测10G数据获得SARS-CoV-2的全基因组可以说很划算了,甚至在某些特殊情况下,10G能拿到全长都算便宜了。因为第一个全基因组数据对于疫情的溯源、病毒全基因组分析等具有极其重要的意义。这个情况下,10G真的算便宜!但是,如果一个地方经常出现COVID-19患者,此时10G换一个全长基因组可以说真的太贵了!(按照1G 50元成本计算,那也是500的支出,算上建库成本等,价格更高)如果这10G还没有拿到全基因组,那称得上巨亏!有没有一种方法可以保证以很低的测序量获得覆盖度很高的SARS-CoV-2全长?答案是有的,而且不止一种!

Targeted Capture Sequencing VS Amplicon Sequencing

        其实,SARS-CoV-2之所以较难拿到全长基因组序列还是因为其相对很低的丰度导致了测序数据中有效reads数少。那么,如果能在测序前就特异性增加SARS-CoV-2核酸的丰度,那么在测序数据中SARS-CoV-2的reads也随之增加了。在相同数据量下更容易拿到全长基因组。因此,有两种较好的方法随之被应用于SARS-CoV-2的基因组测序。

1.Targeted-Capture Sequencing

        Targeted-Capture Sequencing 也叫Capture based Sequencing。中文名叫目标序列捕获测序。这种测序模式是将目标基因组对应的多对目的基因区域特异性探针进行杂交(固相或液相),以此富集目标基因组核酸,从而增加目标核酸在样本中的相对丰度以达到增加目标基因组在测序数据中的相对丰度。与传统的测序方法相比,该测序方法显著增加了目标基因组的测序通量,在获得相同的目标基因组有效测序量下,比传统测序方法节省大量的时间及成本。
下图为目标序列捕获测序的基本概念图。

SARS-CoV-2基因组测序专题(一)

图1.目标序列捕获测序示意图

2.Amplicon sequencing

        该方法中文名译为多重PCR扩增子测序。顾名思义该方法首先以目标基因组的参考基因组为模板,设计几十甚至上百对能够覆盖目标全基因组的引物序列。并利用这些引物序列在制备高通量测序前的样本中进行目标序列特异性多重PCR,以显著增加目标核酸在样本中的相对丰度从而增加测序数据中的目标基因组序列。该方法与捕获法类似,均能在获得同样有效目标基因组数据的前提下节约测序成本和时间。事实上,扩增子测序目前是微生物组研究中的常用测序手段(16s/18s/ITS 扩增子测序)

SARS-CoV-2基因组测序专题(一)

图2.扩增子测序概念图

        上面的两个原理图大致阐述了两种测序模式的基本概念。总结一下,二者的目标都是相同的:即通过一定手段:特异性捕获或特异性扩增显著增加目标序列在样本背景序列中的丰度,从而保证最后测序时被测序的有效数据量增加。

两种测序模式与普通测序方法的差异

        虽然上述两种方法在理论上均能增加目标序列在背景序列中的丰度。但是考虑到目标病原的基因组每一个区域能否以相同的效率或比例被特异性扩增或捕获是无法肯定的。这取决于特异性引物或探针的初始设计。所以在实际的特异性基因组测序中有可能遇到目标病原的基因组在某些区域具有极高的测序深度,在另一些区域有极低的测序深度。在同一基因组上存在极端测序深度差不利于目标基因组的从头组装。因为大部分组装软件在绘制De Bruijn图时会考虑两段overlap kmer的丰度(如果这两段kmer来自不同的reads)。详细的基因组组装原理可以参考本人以前的相关推送。(如下)

什么是De Bruijn图

        如果丰度差异太大,组装软件甚至不认为这两段序列来自同一基因组。因此,如果以从头组装基因组为目标,普通的基因组测序仍然是最佳推荐。因为无偏移测序(unbiased sequencing)是普通基因组测序的特点之一。因此,如果选择了目标序列特异性测序,使用短序列比对的方法是下游分析的最佳推荐方法!

写在后面的
本期专题简要介绍了SARS-CoV-2基因组测序的两种方法。这两种方法主要应用于获得样本中SARS-CoV-2核酸载量低的情景。通过特异性扩增或捕获增加病毒在样本中的核酸拷贝数以达到增加病毒的有效测序数据是该方法的显著结果。下一次推送将专门针对这两种方法,利用公共数据比较进行两种方法在获取高质量SARS-CoV-2基因组的优劣性。

SARS-CoV-2基因组测序专题(一)》来自互联网,仅为收藏学习,如侵权请联系删除。本文URL:http://www.hashtobe.com/2564.html