2023-03-23
单细胞空间的分析技术无疑是目前科服较火热的研究手段,时至今日已经形成了“百家争鸣”的态势。2016年,10Xgenomics率先推出商业化单细胞分析系统Chromium以来,激发了单细胞市场的巨大潜力,国内外各大公司也先后进入到了单细胞领域以寻求突破,如Rhapsody系统,同一年人类细胞图谱计划启动;2018年单细胞被Science评为十大科学突破技术;2019年单细胞技术被Nature评为生命科学领域年度技术,而同一年,口袋单细胞分析系统DNBelab C4也一起问世;此后,国内公司纷纷加入了这场“盛宴”,众多公司纷纷推出了各自的单细胞平台及分析系统,以寻求打破10X的垄断。而与此同时,技术也在不断推进,10Xgenomics在2019年率先推出了空间平台技术,引发了另一个分析热点。
目前而言,单细胞的市场已经得到了很大程度的释放,但是空间转录组仍然是一片“处女地”,由于空间转录组价格、认知、技术特点等一些限制,目前仍需要更大的努力推动空间转录组的发展,其中最为关键的就是空间转录组的精度问题,许多空间转录组技术不具有单细胞分辨率,而是测量来自潜在异质细胞类型的细胞混合物中每个点的平均基因表达,即使空间技术达到了亚细胞级精度,但是在空间注释的时候还是需要将spot合并形成super spot进行下游分析,所以单细胞空间强强联合的交叉领域,成为了研究的关键点。
单细胞空间联合分析方法汇总 针对单细胞空间联合分析的问题,已经运用了诸多方法来解决,汇总如下: 上述都是针对单细胞空间联合分析发表高分文章方法的汇总,当然还有很多其他的方法,例如STRIDE、CellDART、Tangram、DSTG等等,几乎运用了可以运用到的所有相关算法,但是常用、文献引用率较高的方法,主要集中在Seurat[1]、cell2location[2]这两种,当然,其他方法也有适用的情况。 单细胞空间联合分析的方法流派 关于用单细胞数据解析空间位置的细胞类型,主要分为两大流派: 流派1:映射,分析的第一步是基于scRNA-seq数据建立细胞类型的表达特征。然后,映射的主要挑战是将基于scRNA-seq的细胞类型是把空间数据分配到每个细胞上。其中典型的代表就是前面提到的Seurat[1]。 流派2:去卷积,去卷积有两种主要方法:推断一个特定spot的细胞亚型比例和对一个特定的空间转录组spot进行评分,以确定它与单个细胞亚型的对应程度。基于此来推断空间每个spot的细胞比例。这种形式的去卷积的方法之一是采用基于统计回归的模型,各种线性回归模型已被应用于解卷bulk RNA-seq混合物。估计每个细胞类型在给定捕获点中的确切比例的补充方法是通过贝叶斯统计框架,将概率分布与scRNA-seq数据的基因计数分布相适应。这个流派的经典方法就是cell2location[2]、Spotlight。 图1 单细胞空间联合分析策略 单细胞空间联合分析引用较多的方法—Seurat 因为Seurat[1]在单细胞运用中的巨大成功,所以Seurat自带的单细胞空间联合的分析方法也得到了研究者的青睐,其原理就是映射:以单细胞分辨率创建空间分辨率的细胞类型映射。首先第一步,依据单细胞注释好的数据构建细胞类型的表达特征;其次,依据细胞类型的表达特征,计算细胞类型在每个空间位点的相似程度,如下图: 图2 单细胞空间寻找anchors 利用该方法,借助定义好的单细胞数据,通过FindTransferAnchors函数可以找到相关单细胞空间两种数据之间的anchors,从而识别可能的细胞类型,Seurat在做单细胞和空间的联合分析的时候用到了该方法。目前很多文献就是采用此方法,例如发表在Cell的文章Spatiotemporal analysis of human intestinal development at single-cell resolution[3],就是借助Seurat 的方法判断肠道发育中细胞类型的位置,如下图: 图3 借助Seurat的方法预测空间数据的细胞类型 单细胞空间联合分析高性能的方法—cell2location[2] 目前cell2location[2]由于其准确的性能得到越来越多的广泛运用,Cell2location[2] 采用分层贝叶斯框架,假设基因表达计数遵循负二项分布。它首先使用外部 scRNAseq 数据作为参考来估计细胞类型特异性特征。观察到的空间表达计数矩阵用负二项分布建模,其中基因可用的特定技术敏感性、基因和位置特定的加性偏移作为平均参数的一部分包括在内。然后cell2location[2] 使用变分贝叶斯推理来近似后验分布并相应地产生参数估计 。分析示例如下: 图4 cell2location预测细胞类型的空间分布 总 结 总而言之,在分析中没有一种方法能够在不同的组织类型中始终准确推断。在研究中测试的大多数概率方法,尤其是RCTD、Cell2Location[2] 和 Stereoscope,在整个组织中都表现出始终如一的高性能。STdeconvolve 作为唯一的无参考方法,具有识别组织结构和细胞混合物的能力,但必须仔细处理细胞类型映射,Seurat、liger更适合处理大数据集。每种联合分析的方法都有其适用的场景和优势,因此,建议研究者首先确定评估的一些与自己的数据最匹配的情景,并在这些情景下选择表现最佳的方法。 [1]Yuhan Hao et al.Integrated analysis of multimodal single-cell data.Cell.Volume 184, ISSUE 13, P3573-3587.E29 [2]Vitalii Kleshchevnikov, Artem Shmatko, et al.Cell2location maps fine-grained cell types in spatial transcriptomics.Nature Biotechnology volume 40, pages 661–671 (2022) [3]David Fawkner-Corbett ,Agne Antanaviciute ,et al.Spatiotemporal analysis of human intestinal development at single-cell resolution.Cell.Volume 184, ISSUE 3, P810-826.e23, February 04, 2021