首页> 关于我们 >新闻中心>技术分享>新闻详情

【派森诺基因云】5分钟带您看懂QIIME 2云分析:标志物种分析篇

2021-04-02

cover&0.jpg


对于QIIME 2云分析,我们悉心整理了各个分析模块中的热点分析内容,推出了“5分钟小课堂系列”。此前已带来了第1讲(【派森诺基因云】5分钟带您看懂QIIME 2云分析 (1)点击查看)和第2讲(【派森诺基因云】5分钟带您看懂QIIME 2云分析:Beta多样性篇点击查看),对物种组成分析、Alpha多样性分析和Beta多样性分析进行了解读。今天我们更进一步,帮助大家掌握物种差异分析的具体方法,找到标志物种(Biomarker)!


如前所述,Alpha/Beta多样性分析主要用于比较各样本/分组中,微生物群落在多样性水平和整体结构上的差异。当我们通过Alpha多样性指数的箱线图分析、或是Beta多样性的PCoA/NMDS分析,发现存在显著的组间差异时,我们通常需要进一步关注:具体是哪些微生物物种存在组间差异呢?

这时候,我们的“物种差异与标志物种分析”,就可以大显身手啦!

1.jpg


1. 韦恩图分析

在微生物组研究中,韦恩图通常用于分析不同的样本(组)间有哪些物种是共有的、哪些是独有的,在文献中的出镜率也非常高。云分析中,每个样本(组)作为一个集合,根据ASV/OTU在各样本(组)间的有无情况分别统计各个集合的成员数,也就是各个分组独有的、以及组间共有的ASV/OTU的个数(注意不是丰度值)。

图中,每个色块代表一个分组,色块间的重叠区域指示相应样本(组)间所共有的ASV/OTU,每个区块的数字指示该区块所包含的ASV/OTU的数目。

2.jpg

此外,韦恩图有多种展现形式,包括花瓣图、齿轮韦恩图等,都可以通过“图表调整”模块来实现图形修改。

我们还可以对门/纲/目/科/属等分类水平的物种组成,进行韦恩图分析,我们此前也已做过作图方法介绍,大家也可以参考哦(【教程分享】无需代码,3种方法轻松get高颜值韦恩图!点击查看)~


2. 热图和随机森林分析

热图是数据可视化的常用方法之一,也是挖掘多维复杂数据变化规律的重要手段。我们可以将热图应用于ASV/OTU、各分类水平的物种注释结果(如门/纲/目/科/属/种丰度组成)等各个层面的分析中,以展现各样本(组)中物种丰度的变化规律。QIIME2云分析流程自带“物种组成热图”和“随机森林分析热图”,可以根据研究需要,随心调整出图效果:

3.gif

随机森林是一种基于决策树(Decision tree)的高效的机器学习算法(Machine-learning methods),属于非线性分类器(Non-linear classifier),能够深入挖掘变量之间复杂的非线性相互依赖关系,对于经常呈现离散、不连续分布的微生物群落数据而言尤其适用。

通过随机森林分析,我们可以筛选对组间差异具有重要影响的标志物种,默认展示的是重要度排名前20的标志物种(可以是ASV/OTU,也可以是门/纲/目/科/属/种的分类水平)。结果图由左右两部分组成,左侧为每个标志物种对应的丰度热图,而右侧则是每个标志物种的重要度得分值柱状图,柱子越长,表明该标志物种对于组间差异影响的重要性越大;从上到下,物种对组间差异影响的重要性依次递减。

4.jpg


3. PCA和OPLS-DA分析

PCA和OPLS-DA分析基于物种组成信息(门/纲/目/科/属/种),可用于分析组间差异,并筛选潜在的标志物种。PCA和OPLS-DA的样本排序图与PCoA类似,也是观察样本在坐标轴上的投影,样本(组)间投影越远,则两样本(或分组)在该坐标轴上的差异越大。

与PCoA不同的是,PCA与OPLS-DA还提供了物种载荷图,点击右上角图表切换即可获得。物种载荷图可用于寻找标志物种。图中,每个点代表一个物种(默认为属),点的横坐标和纵坐标为该物种的VIP值(Variable importance in projection),可分别认为是该物种对样本在这两个维度上组间差异的贡献大小;两个坐标轴括号中的百分数分别为所有样本在该维度上的组间丰度差异占总的组间差异的比值。横纵坐标轴的绝对值越大的物种越关键,可关注。

5.jpg

除了上述标志物种的分析筛选方法,我们还可以使用LEfSe和MetagenomeSeq这两大神器来进行分析,具体方法,我们会在下次小课堂带来讲解哦~敬请关注!

我们也衷心欢迎大家进入基因云(https://www.genescloud.cn/)尝试使用,也可关注我们已经上线的网络直播系列课程,每周四下午15:00不见不散,大家一起在线互动交流哦!