2023-03-02
当跑完常规的细胞过滤,拿到单细胞测序数据后,紧接着就是做细胞类型鉴定,如果这一步不准确,那么后续所有分析都是不可靠的。我们知道使用各类marker gene进行专业的人工注释是细胞注释的金标准,但是其过程是缓慢和比较繁重的,而且可能是主观的。在对大量数据集开展具体的鉴定之前,我们还是希望能有一些自动化的软件给我们的鉴定工作提供一些指引和参考,本期文章就是向大家介绍一些辅助我们的自动化注释软件,加快我们的科研速度!
1、SingleR 相信这个软件大家都已熟悉,可能是目前应用较为广泛比较被认可的注释软件,如此耳熟能详可能让很多人误以为它已有悠久的历史,但实际上这款软件于2019年一篇发在Nature Immunology上的文章面世,也才4年时间。SingleR是一款R包,内置的背景数据库包含人和小鼠两种物种的数据,5个人的数据库HumanPrimaryCellAtlasData、BlueprintEncodeData、DatabaseImmuneCellExpressionData、MonacoImmuneData、NovershternHematopoieticData;2个小鼠的数据库ImmGenData、MouseRNAseqData所以分析工作也主要针对这2个物种来进行。 (参考文献:Reference-based analysis of lungsingle-cell sequencing reveals a transitional profibrotic macrophage. NatureImmunology, 2019)原理示意图: 2、scCATCH 相比于SingleR,scCATCH的结果会有一定的差异,这种差异在一些研究较少的细胞类群上体现的尤为明显,同时对于可能难以区分的细胞,scCATCH会比较实诚地标注上unknown,而不是像SingleR一样一定要迭代出一个最相近的结果出来。 (参考文献:scCATCH: Automatic Annotation onCell Types of Clusters from Single-Cell RNA Sequencing Data. iScience, 2020.)注释工作原理图解: 3、Garnett Garnett是一个单细胞自动注释软件包,输入数据包括一个单细胞数据集和细胞类型定义文件。Garnett使用弹性网回归模型的机器学习算法训练出一个基于回归的分类器。随后训练好的分类器就可以用于更多数据集的细胞类型定义。Garnett的工作方式是获取单细胞数据和细胞类型定义(marker)文件,并训练一个基于回归的分类器。一旦被训练成一个针对某一组织/样本类型的一个分类器,它就可以应用于从相似组织中对未来的数据集进行分类。 (参考文献:Supervised classification enablesrapid annotation of cell atlases.Nature Methods, 2019.) 4、CellAssign 基于marker基因的信息自动将单细胞RNA-seq数据分配注释到已知的细胞类型中。它以marker基因的细胞类型矩阵作为输入,提供先验的已知marker基因是否属于某种细胞类型。然后,cellassign会概率性地将每个细胞分配给一个细胞类型,从而消除了典型无监督聚类中的主观偏见。 (参考文献:Probabilistic cell-type assignment of single-cell RNA-seq for tumor microenvironment profiling) 5、Cell Blast Cell BLAST是一个自带高质量参考数据库的scRNA-seq数据检索/注释工具。这个网站由北京大学的研究团队研发,论文发表在在《Nature Communications》:基于深度学习模型的scRNA-seq数据检索和注释的新方法Cell BLAST,以及具备高质量注释的scRNA-seq参考数据库ACA。这一数据库为有效利用现有数据进行细胞注释和跨数据集研究提供了新的工具和资源。 (参考文献:Searching large-scale scRNA-seqdatabases via unbiased cell embedding with Cell BLAST.Nature Communications, 2020.) 从第一款单细胞自动注释软件在2019年面世以来,短短的4年时间里已经有几十款同类软件了。自动注释的软件对于我们的研究工作能够起到一定的先导意义,不过这种先导意义一定是建立在对分析过程的理解之上的,不能够进行生搬硬套。以上是本期为大家介绍的常见的几款,如果你也正在从事单细胞数据分析的相关工作并且正在入门的阶段徘徊,不妨试一试这几种自动注释的软件,也许它们会给你提供一些思路。