2025-03-24
Highlights
1、单细胞时空组学助力精准医学发展;
2、全文解析如何利用单细胞测序挖掘生物学故事;
3、派森诺单细胞转录组测序高级分析助力老师科研。
各位老师们,开学了开学了!
哎但为啥派派发现你愁眉苦脸的
难不成是因为基金本子没写完
思路有点卡顿了?
还是因为数据分析卡住了,找不到突破口?
那怎么样才能解决你的困扰呢?做个单细胞测序吧,通过火红的组学技术,深入研究生命科学的无穷奥秘吧!那么敢问天下单细胞技术谁比较优秀,请看下图!

但也许有老师会问到,单细胞测序是什么?单细胞测序是一种能够解析单细胞维度的基因表达变化的检测手段,如果把普通转录组测序比做将水果打匀后后的果汁奶昔,那么单细胞测序就好比是果盘,能直接观察每一个细胞的特征。所以单细胞测序可以很好的去解析组织内部异质性,为解析低占比但可能扮演疾病演化、生理发生中的重要作用的细胞提供强有力的研究工具。

从2009年汤富酬教授划时代地在Nature Methods上发表单细胞测序mRNA测序方法学文章开始,单细胞便开始作为生命科学研究领域的“网红”大杀四方,在各种顶刊曝光,并解决数以万计的科学难题,让我们为单细胞测序点个赞。

15年过去了,他不断演变,变成高通量、高效率的生命科学工具,并扩展到了单细胞ATAC,单细胞ChIP以及单细胞微生物等技术,围绕着生命中心法则不断发展壮大他的应用场景。随着热潮的不断来临以及高分文章的不断发表,有不少的老师会发出疑问:
如此多领域的生命科学研究已经用单细胞测序技术进行了机理挖掘以及细胞类型的梳理,那单细胞测序技术是否还有应用场景,他是否还值得被人们重视呢?
答案是:他依然作为一款高效便捷的科学工具在生物医学、农学以及畜牧类领域发挥着巨大作用。
那么单细胞的应用场景在于哪些呢?人类最得力的助手deepseek的回答是这样的:

那么让课代表来升华下deepseek的话语:
1、单细胞测序可以发现生命体中同种细胞间是如何相互间转化以及分化过程中的驱动基因;
2、单细胞测序可以挖掘细胞群内各种细胞间是否存在相互交流以及交流的细胞间是通过哪些基因去进行信息传递的;
3、比较同一种细胞群内,在不同阶段或者不同处理的影响下,基因表达的变化是什么。
以及其他进一步的数据挖掘需求,那么单细胞测序是如何通过生信分析来实现上述功能的呢?接下来我们婉婉道来。
对于单细胞数据分析来说,主要分为三大模块,即:数据的前处理、细胞鉴定、以及下游功能研究分析,以上三者共同构成了单细胞测序数据分析大厦的地基、骨架以及墙壁。

1.数据前处理
单细胞转录组主流的技术路线仍然以微流控技术形成油包水反应体系去构建单细胞基因捕获和检测体系,其中10x genomics的chromium平台是单细胞微流控的巅峰。

那对于以10x为主的微流控单细胞转录组来说,我们进行分析这些单细胞数据的前提是先明确哪些油滴中有细胞,哪些细胞为高质量细胞,哪些细胞可以用于下游分析,即数据的前处理,包括:数据比对、call cells、低质量细胞以及多胞的清除。
数据比对:通过识别测序序列中特定的标签以及标签对应的cDNA碱基信息知道我们测定的将近100g原始数据中每一条序列来自于哪个油包水以及来源于那个基因。
Call Cells:通过数据比对过程,我们完成测序数据以油包水为单位的测序原始数据分配,此时我们知道了本次测序测了多少个油包水单位,每个油包水中的基因含量是多少。但鉴于我们的油包水包裹的液滴中同时含有细胞、细胞碎片以及细胞悬液中的背景RNA,所以每个油包水或多或少都会被分配测序数据,此时我们需要做的是进行细胞和非细胞包裹的油包水进行区分,此步骤即我们所说的Call Cells。
低质量细胞以及多胞的清除:通过Call Cells,我们完成了包裹细胞的油包水的识别,即明确了我们下有需要分析的数据。在这些细胞中,有些细胞活率高基因表达高,但有些细胞可能由于组织处理导致细胞膜损伤发生坏死,或者存在一个油包水包裹了2个以上的细胞,这些数据不是我们需要分析的对象,所以在这一步进行去除。
通过以上三点,我们完成了单细胞数据的前处理过程,数据前处理的好与坏,直接影响了下游生物学故事挖掘的准确性,所以可谓是整个单细胞数据分析“大厦”的地基工程,我们会在后期进行展开详解。
2.细胞鉴定
单细胞相较于bulk rna sequence的差别在于:单细胞转录组测序可进行针对具体细胞类型进行功能和差异基因的分析。而进行这一分析前,我们需要做的是明确再进行数据前处理结束后留存下来的高质量的细胞中细胞类型有哪些以及留存下来的每个细胞是什么细胞,此步骤即细胞鉴定。那么细胞鉴定应该如何做呢?他分为:基因表达的归一化、细胞降维聚类和细胞分群以及细胞注释。
基因表达的归一化:由于微流控捕获细胞系统的不稳定性造成最终捕获细胞数和预计细胞数有接近50%的上下浮动范围,导致每个细胞的测序深度的不一致,进一步导致细胞基因表达水平检测灵敏度有一定的变化,所以在这里需要通过归一化,把测序深度导致的检测灵敏度拉到同一水平。
细胞降维聚类和细胞分群:单细胞测序的数据量极大,信息捕获量因此也和常规组学不一样,所以直接分析庞大的数据会很有困难,聪明的人类永远会化繁为简,通过相关性分析,将表达模式相似度较高的细胞通过二维平面的方式进行展示,并划分细胞群。
细胞注释:细胞注释目前主要有两种流派,分别为自动注释和手动注释。自动注释主要以SingleR,scCATCH为主,通过内置的特定细胞表达矩阵进行目的细胞的相似性比较,最终确定细胞类型;而手动注释则方法众多,最常见的则为marker可视化,通过特定细胞为了发挥功能而特定表达基因的表达水平和表达比例来确定细胞类型。
细胞类型确定的正确与否,直接决定了后期生理学故事挖掘以及靶点确定的可靠性,因此细胞鉴定可以说是整个单细胞数据分析“大厦”的钢筋铁骨,那具体如何进行细胞鉴定,以及方法的派森诺式的多元化,也会在后期进行详细展示。
3.下游功能研究分析
经过单细胞转录组数据前处理和细胞鉴定,我们基本上就把单细胞“大厦”的地基和框架给搭建完成,那么接下来做的就是有效生物信息的挖掘,这包括:组织内细胞分化和演化的探究、转录调控研究、以及差异基因的寻找等,通过以上分析完成对组织内细胞异质性的探究。
拟时序分析:组织微环境内存在大量分化阶段不一样的同种大类细胞,例如:肿瘤组织内良性和恶性的肿瘤细胞,免疫风暴过程中炎症因子表达刚启动和炎症因子表达高峰的免疫细胞,目前也许已经有很多文章或者研究将分化的起点和终点探究明白,但是具体每个时间点的变化是如何的以及是什么基因去进行驱动整个分化过程的,可能没有文章报道也没有比较好的工具和方法去探究。单细胞转录组测序可以通过拟时序分析方法,模拟不同细胞类群在分化阶段的位置,推算出分化阶段,并进一步计算出分化过程可能的推动基因。通过拟时序分析,我们可以挖掘出细胞类型的演化方向,以及推动演化的基因,进行进一步的下游分子生物学验证研究。
细胞互作分析:组织中存在多种不同状态不同类型的细胞,他们各自表达着细胞特异性的蛋白和小分子物质,这些蛋白有些可以分泌到细胞基质间,并通过其他细胞感应元件调节细胞间的交流,这对于维持微环境的工作起到至关重要的作用。单细胞转录组测序可根据已有数据库中的配体-受体关系对,结合测的对应配受体对应基因的表达水平,挖掘微环境中细胞间通讯信息,为微环境分析提供数据预测分析。
差异基因分析:组织中存在一些占比较低的细胞类型,这些细胞类型一方面无特异性的表面抗原用于细胞分选,另外一方面比例低导致分选困难,因此如果想知道他们间的细胞基因差异便会困难重重。但单细胞可以基于细胞大群和亚群的分析结果,对特定细胞进行基因表达差异分析。
转录调控分析:单细胞转录组揭示的是基因表达变化,但基因表达水平的变化往往由上游的转录因子调控,通过相关性分析,并构建潜在的转录调控网络,便能发现活化的转录因子,为后期做scATAC-seq做数据支持。
通过以上数据的挖掘,我们基本上完成了一篇单细胞数据应该有的图片,高分文章在向我们招手,大家快冲鸭。