2013年,权威技术期刊《Nature Methods》将年度技术授予了单细胞测序。正如社论中所说,每个细胞都是独一无二的--它占据了独特的空间位置,它的复制基因组中携带了独特的错误。然而,过去以细胞群体为对象的研究只获得了平均值,而忽略了异质性。目前多种新型分析技术,如NGS,都是为细胞群体而设计的,需要一定的样本量。对于一些特殊样本或应用,如CTC或PGS/PGD应用等,它们需要分析单个细胞中的体细胞DNA突变或从胚胎细胞分化至8个细胞时取出一个单细胞,对里面的全基因组进行扩增以便进行胚胎植入前的遗传病诊断或筛查。显而易见的是,单细胞中的DNA(大约只有6 pg DNA)无法满足测序的mg级样品量需求。为了从少量样品中获得更多信息,全基因组扩增技术(WGA)应运而生。
目前的WGA策略主要有三种:简并寡核苷酸引物PCR扩增(DOP-PCR)、多重置换扩增(MDA),以及置换预扩增和PCR扩增的组合(MALBAC)。这三种WGA策略采用不同的实验操作和不同的酶,表现出不同的性能和偏向,适合不同的应用。
当然,全基因组扩增有可能会引入假象,导致变异检测出现错误。目前,市场上出现了多种扩增试剂盒,它们的表现如何,还没有一个综合的评估。为此,华大基因的研究人员利用7种试剂盒开展单细胞全基因组扩增,系统地比较了不同WGA方法的优点和缺点,尤其关注变异检测。这项成果于今年8月发表在《GigaScience》期刊上。
实验设计在这项研究中,华大基因的侯勇等人设计了一种缩小范围(narrowing-down)的策略,来研究7种试剂盒的扩增和变异检测表现。这7种试剂盒具体如下图。
具体策略如下:首先,研究人员利用单细胞的低覆盖度全基因组测序(LWGS)数据或提取出的单细胞LWGS数据,评估了基因组比对率、重复率和覆盖均一性。通过评估扩增质量,他们选择出了灵敏度或均一性最佳的试剂盒。随后利用精选试剂盒扩增后的深度测序全基因组测序(WGS)数据,他们进一步研究了扩增偏向和变异检测能力。
孰优孰劣?
他们利用20个YH单细胞开展低覆盖度的测序比较,这些细胞经过7种WGS试剂盒扩增,并在Illumina测序仪上测序。他们发现,MDA-2扩增数据有着最高的基因组平均覆盖度(8.84%),甚至高于MALBAC(8.06%)。
与DOP-PCR扩增的数据相比,MDA和MALBAC扩增数据的重复率较低,但比对率更高。他们发现,DOP-PCR、MDA-2和MALBAC扩增后的数据均表现出高的均一性和重复性。这三种扩增策略都有望带来测序读取的均匀分布,这对单细胞水平的CNV分析很重要。
为了进一步探索全基因组扩增引入的基因组覆盖度偏向,研究人员比较了DOP-1、MDA-2、MDA-3以及MALBAC扩增的深度测序数据(~30x),因为这些试剂盒有着更好的灵敏度和均一性。研究发现,在高的测序深度下,MDA有着明显更高的基因组回收灵敏度(~84%),远高于DOP-PCR(~6%)和MALBAC(~52%)。
之后,他们进一步证明,利用MDA或MALBAC对一种胃癌细胞系进行扩增后,从单细胞重测序的数据中能准确发现胃癌CNV,包括12p11.22(KRAS)和9p24.1(JAK2、CD274和PDCD1LG2)的扩增,且灵敏度和特异性相当。
之前有研究表明,MALBAC在SNV和CNV检测上比MDA有优势。不过,研究人员此次发现,在相同的测序深度下,MDA-2(Qiagen REPLI-g Single Cell Kit)的数据比MALBAC数据有着更高的基因组回收。更重要的是,MDA-2在SNV和CNV检测的准确性上与MALBAC相当。
作者支招
作者总结道,对于那些需要低重复率和高基因组覆盖度的研究,如疾病研究中的SNV检测, MDA和MALBAC策略比较合适。此外,如果同时开展SNV和CNV检测,他们建议使用MDA-2和/或MALBAC,因为它们在变异检测上的效率和准确性更高。
当然,另外一点不得不考虑的是成本。与大量细胞的测序不同,单细胞分析首先需要扩增单细胞的基因组。若有大量细胞需要扩增,这个成本也是相当可观的。MDA和DOP-PCR是最常用的全基因组扩增方法,成本相对较低。相比之下,MALBAC的成本要更高一些。