2025-08-08

Highlights
1.精选7个转录组测序研究高频使用的疾病数据库,覆盖铁死亡机制、药物重定位、基因集富集、多组学分析等核心研究场景。
2.详解数据库核心功能与实操价值,助力快速挖掘测序数据中的疾病关联机制、潜在药物靶点及临床转化线索。
3.附官方链接与应用场景提示,零基础也能轻松上手,让你的转录组研究从数据到结论一步到位。
转录组测序作为解析疾病分子机制的黄金手段,能产出大量差异表达基因数据。但如何从成百上千个差异基因中锁定关键通路、挖掘潜在靶点、关联临床意义呢?答案就藏在高质量的疾病数据库中。高分研究从不满足于简单的差异基因罗列,而是通过数据库将测序数据与疾病表型、分子机制、药物信息等深度关联,让结果更具说服力和转化价值。今天就为大家盘点7个转录组测序高分案例反复引用的疾病数据库,从铁死亡等热门机制到药物——基因关联分析,一篇搞定核心工具!
一、铁死亡数据库-FerrDb数据库
FerrDb是一个专门用于铁死亡(Ferroptosis)研究的数据库。由广州医科大学附属脑科医院、四川大学生命科学学院以及生物资源与生态环境教育部重点实验室的研究团队共同开发。铁死亡是一种依赖铁的细胞死亡形式,近年来在生物医学研究中备受关注。FerrDBV2是该数据库的最新版本,提供了丰富的铁死亡相关数据和功能。
核心功能:
系统收录铁死亡相关基因(包括驱动基因、抑制基因、标记基因)、小分子化合物(诱导剂、抑制剂)及相关疾病案例。
提供基因功能注释、表达谱数据及文献证据,支持按基因名称、疾病类型快速检索。
研究价值:
转录组测序筛选出差异基因后,可通过FerrDb快速判断是否涉及铁死亡通路,结合数据库中的基因互作关系,构建差异基因-铁死亡-疾病调控网络,为机制研究提供直接证据。

网址:http://www.zhounan.org/ferrdb/current/
二、基因集富集分析“金标准”:MSigDB数据库
分子特征数据库(Molecular Signatures Database, MSigDB)是一个包含数万个注释基因集的资源库,这个数据库是专门为了GSEA设计的。基因集富集分析(GSEA)是一种计算方法,用于确定预先定义的基因集在两个生物状态(如表型)之间是否具有统计学显著且一致的差异。简单来说就是根据两个条件下(实验组和对照组)下,基因表达在同一个预先定义的基因集合中有没有显著性差异,这个基因集都是根据某一个特征对基因进行分组归类,有利于探索我们的数据有没有此类功能的变化。
核心功能:
包含上万个人类基因集,涵盖hallmark通路(如细胞凋亡、氧化磷酸化)、GO功能注释、KEGG通路、癌症特征基因集等。
支持与GSEA软件联动,对转录组数据进行基因集富集分析,揭示差异基因背后的生物学功能。
研究价值:
告别单一基因分析,通过MSigDB将差异基因富集到特定通路或生物学过程,明确转录组数据的功能方向(如免疫应答、代谢紊乱),是解析测序数据机制的必经之路。

网址:https://www.gsea-msigdb.org/gsea/msigdb
三、癌症多组学分析平台:cBioPortal数据库
聚焦癌症研究的小伙伴,cBioPortal绝对是绕不开的核心工具,尤其适合结合转录组数据进行多维度分析。cBioPortal是一个开源的综合性癌症基因组学数据库和分析平台,由Memorial Sloan Kettering Cancer Center(MSK)开发并维护。它整合了来自TCGA、ICGC等大型项目以及已发表研究的癌症基因组数据,为研究人员提供可视化和分析工具。
核心功能:
整合TCGA、ICGC等大型癌症项目的多组学数据(基因突变、拷贝数变异、mRNA/蛋白质表达)及临床信息。
支持查询特定基因在癌症中的表达变化、共突变模式及与患者生存率的关联。
研究价值:
将转录组测序发现的差异基因在cBioPortal中验证,查看其在大规模癌症队列中的表达趋势及临床预后价值,让研究结论更具普适性,轻松提升文章说服力。

网址:https://www.cbioportal.org
四、药物重定位神器:CMap数据库
CMAP(Connectivity Map)数据库,是由Broad研究所开发建构,该数据库基于164种药物/小分子化合物和过表达或基因敲除工具处理的细胞表达谱数据,借助L1000分析平台,探讨药物/小分子化合物、基因和疾病状态之间的交互网络关系。
核心功能:
收录数千种小分子化合物处理细胞后的基因表达谱变化,构建化合物-基因表达特征关联数据库。
输入差异基因列表,可匹配出能逆转该表达特征的化合物(如抑制疾病相关通路的药物)。
研究价值:
转录组测序得到疾病相关差异表达谱后,通过Cmap筛选潜在干预药物,无需从零开始进行药物筛选,大幅缩短从基础研究到临床转化的距离,是高分文章临床意义部分的常用工具。

网址:https://portals.broadinstitute.org/cmap/
五、药物信息“百科全书”:DrugBank数据库
从药物化学结构到靶点信息,DrugBank堪称药物研究的全能数据库。
DrugBank是一个综合性的生物信息学和化学信息学数据库,由加拿大阿尔伯塔大学创建。它提供了详细的药物信息和全面的药物目标数据,结合了药物化学、生物学和药理学信息。DrugBank数据库不仅为科研人员提供了丰富的数据资源,也为临床医学和药物研发领域提供了重要的参考。
核心功能:
收录超10000种药物信息,包括批准上市药物、实验药物及天然产物,详细标注药物靶点、作用机制、药代动力学参数。
关联药物对应的基因信息,支持按靶点基因、疾病类型检索相关药物。
研究价值:
当转录组测序锁定潜在靶点基因后,通过DrugBank查询靶向该基因的已上市或在研药物,为后续功能验证提供药物选择依据,加速从基因到药物的机制研究。

网址:https://go.drugbank.com/
六、药物-基因相互作用利器:DGIdb数据库
DGIdb数据库(Drug-Gene Interaction Database),是一个药物-基因相互作用数据库,提供了基因与其已知或潜在药物关联信息,目前已经更新到4.0版本。里面的基因主要是癌基因,但是也有一些其他疾病(例如阿尔兹海默病、心脏病、糖尿病等)的相关基因。DGIdb一共有超过14000种药物-基因的相互作用,涉及2600个基因和6300中靶向这些基因的药物,还包括了6700个其他的基因,这些基因很有可能成为未来药物的靶标。
核心功能:
整合多个权威数据库的药物-基因相互作用数据,涵盖小分子药物、生物制剂与基因的激活/抑制关系。
支持输入基因列表,批量输出靶向这些基因的所有已知药物及作用类型(如抑制剂、激动剂)。
研究价值:
转录组差异基因筛选后,通过DGIdb快速构建基因-药物调控网络,筛选出可干预核心靶点的药物,为后续细胞实验、动物实验的药物选择提供直接参考。

网址:https://www.dgidb.org
七、化学物-基因-疾病关联数据库:CTD数据库
CTD数据库(Comparative Toxicogenomics Database)是一个集成了大量化学物质、基因、功能表型和疾病之间相互作用数据的资源库。CTD数据库的主要目的是帮助科研人员了解化学物质的毒性和与之相关的基因和疾病,为研究疾病相关的环境暴露因素和药物潜在作用机制提供了极大的便利。数据库目前更新至2021年版本,包含超过4664万条相互作用数据,涵盖了超过230万种化学物质、46689个基因、4340个表型和7212种疾病信息。
核心功能:
收录化学物质、基因、疾病三者间的相互作用,包括化学物如何通过调控基因表达影响疾病发生发展。
提供基因表达谱、通路富集等分析工具,支持挖掘环境因素与转录组数据的潜在关联。
研究价值:
在环境相关疾病(如职业病、环境污染导致的疾病)的转录组研究中,通过CTD分析差异基因与特定化学物的关联,揭示环境暴露的分子机制,拓展研究的深度和广度。

网址:https://ctdbase.org/
用好数据库是转录组测序研究从数据堆积到机制深挖的关键一步。上述7个数据库覆盖了从机制解析到靶点挖掘再到药物关联的全流程需求。下期我们将继续盘点更多高分必备的疾病数据库,助力你的研究快速突破!