2024-04-03
一、新增6大数据库!拓展宏基因组数据分析!
BacMet(antibacterial biocide and metal resistance genes database) BacMet数据库全称为抗菌杀菌剂与金属抗性基因数据库。数据库包含了抗金属离子的基因(metal resistance genes, MRGs)和抗杀菌剂的基因(biocide resistance genes, BRGs)两大类,共计753个基因。 ARDB(Antibiotic resistance genes database) 抗生素的过度使用以及随之而来的残留抗生素对环境的污染,使得耐药基因 (antibiotic resistance genes,ARG) 相关信息受到关注。ARDB是最早的耐药基因数据库,除此之外,整合ARDB数据库的CARD数据库,也已纳入派森诺宏基因组/宏转录组标准交付结果中。 MGE(MobileGeneticElements) MGE是一个可移动元件参考基因数据库。它包含了278个不同的基因和超过2000条参考序列,涵盖了各种可移动基因元件(Mobile genetic elements,MGEs)。与利用CARD/ARDB数据库获得的耐药基因(ARG)、BacMet数据库获得金属抗性基因(MRGs)和抗杀菌剂的基因(BRGs),可以进一步研究耐药基因,金属抗性基因,可移动元件三者之间的关系。 TCDB(Transporter Classification Database) TCDB转运蛋白分类数据库是生物化学和分子生物学国际联盟(IUBMB)批准用于膜转运蛋白,包括离子通道的分类(TC)系统。TC系统类似于酶分类系统(EC系统),不同之处在于它同时包含了功能和系统发育信息,提供了1920个转运蛋白家族的注释,TC编号等。 Probio Probio益生菌数据库,提供了448个已经上市的益生菌菌株的功能及综合信息;167个进行过临床试验/现场试验、382个有研究报道。不仅涵盖了人类益生菌,还包括了动物和植物相关的益生菌的数据。可用于探究环境和医学领域的益生菌信息。 QS(Quorum sensing) 细菌群体感应(Quorum sensing,QS)作为细菌进行信息交流和相互作用的最常用手段,具有广泛性、特异性和调控性等特点。QS广泛存在于人体微生物群、土壤等生态系统中,并潜在地影响着生物体/环境中微生物群的组装过程。
二、新增三大分析内容!助力宏基因组结果深度挖掘! 全新差异基因富集分析! 富集分析的目标是验证数据中观察到的差异目标基因是否在特定的功能或通路中显著富集。除了差异基因火山图/Venn图、富集分析气泡图/柱状图/网络图以外,新鲜的圈图也强势加入! 差异基因火山图 富集分析圈图 富集分析网络图 全新随机森林ROC分析! 随机森林是一种基于决策树 (Decision tree) 的经典高效的机器学习算法,近几年已有研究证明这一算法能够对微生物群落样本进行有效且准确的分类。受试者工作特征曲线(ROC)是以真阳性率为纵坐标,假阳性率为横坐标绘制的曲线。ROC分析常用来验证构建预测模型的准确性,常配合验证随机森林分析构建的环境预测模型使用。 随机森林分析 ROC分析 全新菌群分型分析! 菌群分型分析可以帮助我们深入了解不同环境样本中微生物群落的组成和结构,主要通过统计聚类的方法研究不同样本优势菌群结构的分型情况。通过该分析,可以将优势菌群结构近似的不同样本聚为一类,主要适用于特定环境样本的菌群分型。常见的菌群分型可视化方法包含BCA(Between-class analysis)和PCoA(Principal coordinates analysis)。 Calinski-Harabasz (CH): BCA和PCoA: 菌群分型之间差异微生物分析:
本次升级后的宏基因组分析流程如下: