首页> 关于我们 >新闻中心>技术分享>新闻详情

宏组学潮流分析方法大盘点(三)

2022-12-16

近年来研究微生物在碳(C)、氮(N)、磷(P)、硫(S)的生物地球化学循环中扮演的角色成为微生物生态学领域的热点内容。宏基因组测序数据分析的一个关键步骤是推断由宏基因组测序数据集生成的蛋白序列的功能,这在很大程度上依赖于直系同源数据库的覆盖率和准确性。因此,合适的数据库对于表征元素循环、发现相关微生物新的代谢基因、途径具有重要意义。


MCycDB


甲烷是一种重要的温室气体,对环境和全球变化具有重大影响。然而,CH4 循环过程和与环境中其他元素(碳、氮、硫和金属)循环的耦合机制仍然难以捉摸。

2022年1月Molecular Ecology Resource期刊上发表了MCycDB: A curated database for comprehensively profiling methane cycling processes of environmental microbiomes,文章作者构建了一个甲烷循环数据库(MCycDB),用于全面、准确地分析甲烷循环微生物群落。MCyc基因家族的蛋白质序列在UniProt数据库筛选后在多个数据库(COG、arCOG、eggNOG和KEGG)中进行鉴定和整合,从而构建核心数据库。MCycDB中包含298个甲烷循环基因家族,涵盖10个甲烷代谢途径,其中包括610,208个代表序列。相关参考序列来自NCBI RefSeq数据库,包含48个门2197个属。与其他直系同源数据库相比,MCycDB具有更高的特异性、覆盖率、准确性和更短的运行时间。

9518822dc5c3288cfe257472f1b06860.png

构建MCycDB主要步骤流程图

固定布局                                                        
工具条上设置固定宽高
背景可以设置被包含
可以完美对齐背景图和文字
以及制作自己的模板


NCycDB


氮(N)循环是由微生物和化学过程介导的重要生物地球化学途径的集合,确定氮循环基因家族与环境和生态过程的关系是环境基因组学和微生物生态学研究的重要热点之一。

2018年8月Bioinformatics期刊上发表了NCycDB: a curated integrative database for fast and accurate metagenomic profiling of nitrogen cycling genes,文章作者开发了一个人工搭建的集成数据库(NCycDB),用于从宏基因组测序数据中快速准确地分析N循环基因(亚)家族。通过在KEGG/UniProt数据库中检索蛋白质序列,整合COG、eggNOG、KEGG、SEED等数据库中的靶基因,构建完整的数据库。NCycDB共包含68个基因(亚)家族,覆盖8个N循环过程,相似度95%和100%下包括84759个和219146个代表序列,还确定了1958个同源直系同源组(homologous orthology groups),并将相应的序列纳入数据库以避免假阳性分配。NCycDB与其他的直系同源数据库相比,更加全面和准确。

b5ea8eebdd70fd68f9d1f0f8aab08337.png

构建NCycDB主要步骤流程图

固定布局                                                        
工具条上设置固定宽高
背景可以设置被包含
可以完美对齐背景图和文字
以及制作自己的模板



PCycDB


磷(P)是地球上最重要的宏量营养元素之一,微生物(包括细菌和古生菌)在所有生物和生态系统中的磷循环中起着关键作用。然而,随着宏基因组测序技术的快速发展,我们对关键磷循环基因(PCGs)和微生物(PCMs)及其生态功能的全面认识仍然是一个模糊的概念。其中一个主要的挑战是缺乏全面和准确注释的P循环功能基因数据库。

2022年7月Microbiome期刊上发表了PCycDB: a comprehensive and accurate database for fast analysis of phosphorus cycling genes,文章作者构建了一个良好的磷循环数据库(PCycDB),涵盖139个基因家族和10个磷代谢过程。通过整合UniProt、arCOG、COG、eggNOG、KEGG和NCBI古细菌和细菌RefSeq数据库构建PCycDB。模拟基因数据集的注释准确性、阳性预测值(PPV)、敏感性、特异性和阴性预测值(NPV)分别达到99.8%、96.1%、99.9%、99.8%和99.9%。与其他直系同源数据库相比,PCycDB更准确、更全面、更快。PCycDB可以促进我们对环境中微生物驱动的磷循环的理解,具有高覆盖率、高准确性,支持宏基因组测序数据的快速分析。

f4106be35a4e7c740d32bec4ade70afe.png

构建PCycDB主要步骤流程图

固定布局                                                        
工具条上设置固定宽高
背景可以设置被包含
可以完美对齐背景图和文字
以及制作自己的模板


SCycDB


硫(S)是地球生物圈中必不可少的元素,是氨基酸、维生素和酶等重要生物分子的基本成分。S循环是地球生物圈中一个重要的生物地球化学过程。微生物在硫的生物地球化学循环中发挥着重要作用。研究S循环微生物群落的功能和分类对于理解微生物介导的S循环过程及其在环境中的调控机制至关重要。宏基因组测序为我们研究S循环微生物群落开辟了一条新的途径。

2020年12月Molecular Ecology Resources期刊上发表了SCycDB: A curated functional gene database for metagenomic profiling of sulphur cycling pathways ,文章作者开发了一个人工搭建的S循环数据库(SCycDB)来分析S循环功能基因和宏基因组的分类群。SCycDB中包含207个基因家族和585055个代表序列,隶属于细菌/古菌52个门2684个属,还包括20761个homologous orthology groups,以减少假阳性序列分配。SCycDB为S循环提供了一个全面、快速的宏基因组分析工具,并会持续更新。

c904e1a2e5808d455eb413f7dd1726d1.png

构建SCycDB主要步骤流程图

固定布局                                                        
工具条上设置固定宽高
背景可以设置被包含
可以完美对齐背景图和文字
以及制作自己的模板



部分分析结果展示


20d314bf71da756d073f6fb6fbdbefa7.jpg

氮循环Ncyc功能组成柱状图

5991262a93baa63f26a35124da95f14c.jpg

氮循环Ncyc功能组成Circos图

b536e6bd25859c6411d46fd49066bca3.jpg

氮循环Ncyc功能组成差异分析

e6d49217695bf57cce1701660834de04.jpg


氮循环Ncyc功能——物种贡献度分析

固定布局                                                        
工具条上设置固定宽高
背景可以设置被包含
可以完美对齐背景图和文字
以及制作自己的模板


以上就是我们本期精心整理的生物地球化学循环数据库的相关内容,以上这些数据库和分析内容,都已纳入派森诺最新宏组学分析流程中,并且也将在派森诺基因云——宏基因组云分析可视化系统中与大家相见,欢迎大家尝鲜体验!