首页> 关于我们 >新闻中心>公司新闻>新闻详情

派森诺宏基因组“龙”重升级,20大数据库分析一次性交付!

2024-04-03

一、新增6大数据库!拓展宏基因组数据分析!

BacMet(antibacterial biocide and metal resistance genes database)

BacMet数据库全称为抗菌杀菌剂与金属抗性基因数据库。数据库包含了抗金属离子的基因(metal resistance genes, MRGs)和抗杀菌剂的基因(biocide resistance genes, BRGs)两大类,共计753个基因。

ARDB(Antibiotic resistance genes database)

抗生素的过度使用以及随之而来的残留抗生素对环境的污染,使得耐药基因 (antibiotic resistance genes,ARG) 相关信息受到关注。ARDB是最早的耐药基因数据库,除此之外,整合ARDB数据库的CARD数据库,也已纳入派森诺宏基因组/宏转录组标准交付结果中。

MGE(MobileGeneticElements)

MGE是一个可移动元件参考基因数据库。它包含了278个不同的基因和超过2000条参考序列,涵盖了各种可移动基因元件(Mobile genetic elements,MGEs)。与利用CARD/ARDB数据库获得的耐药基因(ARG)、BacMet数据库获得金属抗性基因(MRGs)和抗杀菌剂的基因(BRGs),可以进一步研究耐药基因,金属抗性基因,可移动元件三者之间的关系。

TCDB(Transporter Classification Database)

TCDB转运蛋白分类数据库是生物化学和分子生物学国际联盟(IUBMB)批准用于膜转运蛋白,包括离子通道的分类(TC)系统。TC系统类似于酶分类系统(EC系统),不同之处在于它同时包含了功能和系统发育信息,提供了1920个转运蛋白家族的注释,TC编号等。

Probio

Probio益生菌数据库,提供了448个已经上市的益生菌菌株的功能及综合信息;167个进行过临床试验/现场试验、382个有研究报道。不仅涵盖了人类益生菌,还包括了动物和植物相关的益生菌的数据。可用于探究环境和医学领域的益生菌信息。

QS(Quorum sensing)

细菌群体感应(Quorum sensing,QS)作为细菌进行信息交流和相互作用的最常用手段,具有广泛性、特异性和调控性等特点。QS广泛存在于人体微生物群、土壤等生态系统中,并潜在地影响着生物体/环境中微生物群的组装过程。



二、新增三大分析内容!助力宏基因组结果深度挖掘!

全新差异基因富集分析!

富集分析的目标是验证数据中观察到的差异目标基因是否在特定的功能或通路中显著富集。除了差异基因火山图/Venn图、富集分析气泡图/柱状图/网络图以外,新鲜的圈图也强势加入!

差异基因火山图

图片1.png

富集分析圈图

图片6.png

富集分析网络图

图片5.png


全新随机森林ROC分析!

随机森林是一种基于决策树 (Decision tree) 的经典高效的机器学习算法,近几年已有研究证明这一算法能够对微生物群落样本进行有效且准确的分类。受试者工作特征曲线(ROC)是以真阳性率为纵坐标,假阳性率为横坐标绘制的曲线。ROC分析常用来验证构建预测模型的准确性,常配合验证随机森林分析构建的环境预测模型使用。

随机森林分析

图片7.png

ROC分析

图片8.png


全新菌群分型分析!

菌群分型分析可以帮助我们深入了解不同环境样本中微生物群落的组成和结构,主要通过统计聚类的方法研究不同样本优势菌群结构的分型情况。通过该分析,可以将优势菌群结构近似的不同样本聚为一类,主要适用于特定环境样本的菌群分型。常见的菌群分型可视化方法包含BCA(Between-class analysis)和PCoA(Principal coordinates analysis)。

Calinski-Harabasz (CH):

图片9.png

BCA和PCoA:

图片10.png

图片11.png

菌群分型之间差异微生物分析:

图片12.png


本次升级后的宏基因组分析流程如下:

图片13.png