加州大学张鹍团队发布新型单细胞测序技术实现mRNA与染色质可及

purplesoul
紫色灵魂 10月17日 字数 5601

加州大学张鹍教授团队发布新型单细胞测序技术,高效实现mRNA与染色质可及性并行分析

https://mp.weixin.qq.com/s/XvGDwnkssR4op_AD0Tq2lA

原创: Cristina  测序中国  前天

基于单个细胞或细胞核的RNA测序可以揭示细胞的转录状态,而染色质可及性测序(ATAC-seq)则可以对细胞内转录因子的结合位点和染色质调控区域进行分析,帮助探索DNA转录的上游调控机制。但当前的单细胞测序技术,基本上都是在不同细胞中分开进行RNA测序或是染色质可及性测序,并通过统计学方法进行计算整合,进而实现对以上组学信息的整合分析。但实际上,这种分析方法牵涉到一系列假设,准确性难以保证,在实际应用中仍然困难重重。

为了对同一细胞内mRNA和染色质可及性两层组学信息进行联合分析,使转录调控与其产物的信息直接匹配,从而更精确、更全面地描述单细胞的类型以及分子状态,日前,由美国加州大学圣地亚哥分校张鹍教授领导的研究团队利用微液滴平台,突破性地开发了一种名为“SNARE-seq”(Single-Nucleus chromatin Accessibility and mRNA Expression sequencing)的新型单细胞测序技术,可以对单个细胞或细胞核中的转录组和染色质可及性进行联合测序。英国伦敦当地时间2019年10月14日,这一突破性成果发表在国际顶级学术期刊Nature Biotechnology (IF:31.864)上,论文题为“High-throughput sequencing of the transcriptome andchromatin accessibility in the same cell”。这是继今年6月底,张鹍教授团队与华盛顿大学医学院Sanjay Jain教授团队合作,利用snDrop-seq技术绘制了首份成人肾脏单细胞草图后,在单细胞测序领域又一重磅研究成果。

一、SNARE-seq技术有何独到之处?

与以往的单细胞测序技术不同的是,SNARE-seq技术在液滴形成之前,Tn5转座酶就插入了细胞核中的开放染色质。如图1所示,转座酶在转座后与其DNA底物结合,可以维持原始DNA链的连续性,从而使来自单个细胞核的可及基因组位点和mRNA共同包裹在同一液滴中,并在下一步反应的同时加上单细胞特异分子标签。

图1. SNARE-seq工作流程

简单来讲,SNARE-seq的原理就是将ATAC-seq插入基因组的接头序列(adapter)转换成了可以被mRNA测序引物识别的多聚A尾 (poly A tail),从而可以利用已有的单细胞测序手段同时检测基因表达和染色质可及性。该技术在最低干扰和损失下,将单个细胞的mRNA和开放染色质进行“配对”后测序,从而实现大规模的单细胞多组学高通量测序,得到更具关联性、更真实的单细胞生物状态。

研究团队在论文中写道,尽管从概念上讲SNARE-seq显示出与早先发表的sci-CAR 方法有相似之处,但是SNARE-seq可在常用的Drop-seq平台上进行,并且由于在设计上先捕获了染色质信息,然后将其链接到转录组,从而确保提供了更密集的染色质信息。

二、SNARE-seq技术可靠性验证

在设计好SNARE-seq的具体测序流程之后,研究团队对SNARE-seq技术捕获开放染色质能力与识别细胞类型的准确性进行了验证。

为了评估SNARE-seq捕获开放染色质的能力,研究团队选用了具有广泛表征染色质特征的淋巴母细胞系GM1287进行验证实验。实验结果显示,SNARE-seq可及性数据的集合图显示出与传统的ATAC-seq 和改进版的Omni-ATAC类似的信噪比,如图2;将三种数据中的峰进行重叠,结果表明,SNARE-seq与ATAC-seq共享85.9%的峰,与Omni-ATAC共享高达87.6%。SNARE-seq数据还显示了预期的周期性核小体模式和规范启动子区域内片段的强烈富集,而这正是大量ATAC-seq数据的典型特征。滤除低质量数据后,利用SNARE-seq技术,研究团队获得了每个核2727个中位数的可及位点,这与已发布的单细胞/核ATAC-seq技术相当。

图2. SNARE-seq、ATAC-seq 、Omni-ATAC三种可及性数据的信噪比对比

上述验证实验数据表明,SNARE-seq捕获开放染色质的能力是毋庸置疑的,可与最新单细胞测序技术媲美。

三、SNARE-seq技术分析新生和成年小鼠大脑皮层,揭示表征组织的复杂性

为了进一步展示SNARE-seq技术识别细胞类型的强大能力,研究团队将SNARE-seq技术用于分析新生小鼠的大脑皮层细胞, 并产生了5081个单细胞的配对数据。研究团队根据小鼠大脑皮层转录组的无监督聚类(Unsupervised clustering )确定了19个细胞簇,UMAP投影揭示了一条从放射状角质细胞状态延伸的轨迹,反映了大脑皮质细胞的发育过程。更引人关注的是,他们还发现了密切相关的细胞状态之间的细微差别,并确定了三个中间细胞亚群:簇IP-Hmgn2,表达Mki67,Top2a和Kif23,代表循环祖细胞; 簇IP-Gadd45g,富含Gadd45g,代表从细胞周期退出的顶端祖细胞;簇IP-Eomes,代表了脑发育过程中神经元前体细胞的分化路径。

研究团队进一步进行了SNARE-seq染色质图谱的差异可及性(Differential accessibility,DA)测试,在19种鼠类大脑皮层细胞类型中鉴定出35,166个位点,其中有2,835个位点位于启动子区域内,还有128个在细胞簇之间也显示了差异性基因表达,对于这128个基因,在所有细胞类型中的表达水平及其启动子可及性大多呈正相关,表明染色质可及性与相应的转录组直接相关。

为了展现SNARE-seq能够用于分析成体组织细胞多样性,研究团队对成年小鼠大脑皮质进行了测序,获取了10,309个配对图谱(每个核中位数1,332个RNA UMI和中位数2,000个染色质可及性位点)。研究团队根据从头聚类定义的细胞类型识别结果,汇总了成年小鼠大脑皮层细胞SNARE-seq中链接转录组的染色质数据,该数据显示出与大量ATAC-seq数据高度相似。再运用主题建模方法( the topic modeling method)执行峰值调用和集群,研究发现,与新生皮层的染色质分布相比,细胞簇更干净,更清晰地分离,这可能是由于成年大脑的细胞状态更加离散所致。接下来,研究对所有细胞簇中识别出的差异可及峰进行基因本体和基序富集分析,结果表明,大多数细胞簇显示出不同于发育中小鼠大脑皮层中相应细胞的特征调节,这反映了小鼠大脑皮层细胞出生后在大脑中的成熟状态。

SNARE-seq的一个最大优点是能够用RNA信息对细胞做分类,然后再利用单细胞分子标签,把细胞类型映像到染色质可及性数据上做进一步分析,更灵敏搜索细胞特异的染色质可及性调控区。 团队列举了两个例子(图3),在发育脑中血管壁周细胞(Pericyte)和小胶质细胞(microglia)数目比较少,在5081个细胞里仅分别有51个和37个;用SNARE-seq,可以清楚找到这两类细胞在Vim和CD45的特异调控区。但是如果用常用的方法单独分析单细胞染色质可及性数据,这种罕见细胞的特异调控区往往就被其他丰度高的细胞的信号淹没了。

图3. SNARE-seq高灵敏度发现罕见细胞在Vim、CD45两个基因的特异调控区

总体而言,SNARE-seq是继sci-CAR以后第二个高通量单细胞二维测序方法。SNARE-seq产生的数据质量更高,可通过对转录调节单位的输入和输出进行分析来揭示组织表征的复杂性,具有高灵敏度、高特异性、高分辨率、提高测定通量、易于推广等全面、独特的测序优势,这对于创建人体各个器官的单细胞图谱和开展临床疾病研究意义非凡。

原文链接:https://doi.org/10.1038/s41587-019-0290-0