首页> 关于我们 >新闻中心>技术分享>新闻详情

SCENIC单细胞转录因子调控网络分析

2022-03-04

SCENIC是一种重建基因调控网络(GRN)并从scRNA-seq数据中鉴定stable cell states的工具。基于共表达和DNA模基序 (motif)分析推断基因调控网络 ,然后在每个细胞中分析转录因子基因集活性进而鉴定细胞状态[1]。SCENIC分析由于其能够关注转录因子与靶基因互作等额外信息,在很多单细胞文章中都得到了应用[2-3]

主要的原理如下:首先使用GENIE3、GRNBoost推测共表达调控网络,Co-expression network; 然后RcisTarget通过识别regulator的binding motif,在基因网络中识别直接靶向的Regulons。基于TF + targets基因集,通过AUCell对每个细胞的每个Regulons进行评分,然后产生预测细胞活性的二进制(on和off)矩阵(图1)。

image.png

图1  SCENIC分析流程

接下来以PBMC数据为例,介绍SCENIC分析,首先我们需要载入和安装一些对应的R包,然后读入上游Seurat分析中的pbmc对象,准备好SCENIC分析需要的表达矩阵和meta信息。

  • image.png

构建scenicOptions对象,接下来的SCENIC分析都是基于这个对象的信息生成的。在cistarget [4]中下载转录因子注释的数据库;接下来安装流程进行SCENIC分析,R版本的SCENIC将主要流程封装为了4个函数,很容易得到结果。

image.png


SCENIC会生成int和output两个文件夹,int存放中间结果,如基因相关系数矩阵、GENIE3调控网络文件、regulon和靶基因的信息以及AUC活性矩阵等;这些文件可以进行进一步可视化,例如可以导出regulon和靶基因在Cytoscape等中绘制网络图。

image.png

图2 SCENIC分析结果

Output文件夹存放主要的输出结果,如转录因子调控活性热图和对应的二进制的热图,便于研究这些Regulons在不同细胞分群中的调控模式。我们可以对这个热图进行进一步的美化,例如增加meta分组或者更改不同meta信息的分组颜色(如下代码所示)。

image.png

图3 二进制Regulons热图(corr表示对AUC矩阵指控过滤后的Regulons)

  • image.png

接下来我们讲讲每个Regulons的活性分析,UCell使用曲线下面积(AUC)来计算基因集是否富集于每个细胞中的表达基因,AUCell和GSVA算法类似,都是基因集的排序(Rank),计算获得一个评价指标。每个细胞对应的Regulon都有一个对应的AUC值,但是在细胞水平,大多数基因都不是稳定表达,细胞活性的“ON”和“OFF”应该是部分细胞有较高的AUC而大多数有较低的AUC,最理想的分布是双峰分布bi-modal distribution,也就是数据集中部分细胞有较高AUC而大多数的细胞有较低的AUC,我们可以设置一个阈值来划分(图4 AUC阈值为0.11),大于该阈值的细胞对应的Regulons活性越高,图5的t-SNE图可以展示出这一群活性高的细胞亚群。

image.png

图4 Regulon AUC分布,横着代表AUC值,纵轴代表AUC对应的细胞数目

image.png

image.png

图5:AUC t-SNE图,左图为AUC活性,颜色越深活性越高,右图为AUC二进制活性

总而言之,SCENIC分析能够挖掘单细胞转录组数据中转录因子的信息,已经在很多研究中受到欢迎,通过SCENIC分析我们可以辅助细胞亚型的注释和探究细胞的异质性,或者结合拟时序分析,探究细胞分化过程中转录因子活性的变化,这些在肿瘤免疫、干细胞和骨髓等领域都有重要的应用价值。欢迎各位老师进一步咨询关于SCENIC分析的细节,以及如何将其应用到具体的项目研究中。