分析项目 | 类别 | 分析 | 备注 |
原始数据整理、过滤及质量评估 | A | √ | |
与参考基因组序列比对 | A | √ | |
Peak Calling | A | √ | |
基因附近及Peak中心信号分布图 | A | √ | |
Peak邻近基因功能分析 | A | √ | |
差异Peak序列Motif及注释分析 | A | √ | |
差异Peak邻近基因功能分析 | A | √ | |
Overlap基因功能分析 | A | √ |
Peak Calling
使用统计学方法计算出参考基因组上比对上的 Reads 显著富集的区域(称为 Peak),这些区域在不同的实验中表示不同的研究重点,获得 Peak 后,可对 Peak 进行后续的 Peak 序列 Motif 分析、 Peak 注释等分析,进一步挖掘感兴趣的方向。Peak 在外显子、内含子、5’UTR、3’UTR、基因间区等区域上的分布情况如下:
功能性区域Peak分布
Peak序列Motif分析
转录因子往往倾向于结合在特定的 DNA 序列上,这些 DNA 序列通常具有高度相似的核苷酸序列模式,即每个转录因子都有一个目标 DNA 序列的 Motif,公开发表的转录因子数据库中一般记录了转录因子对应的 Motif 信息。对 Peak 序列计算 Motif,在公共数据库中搜索这些 Motif 对应的转录因子,即可得到此种状态下染色质开放区可能结合的转录因子。
Motif分析示意图
Peak邻近基因GO富集分析
统计Peak邻近基因显著富集的GO条目,从而展示可能被转录因子调控的基因功能,对每个Peak邻近基因进行GO注释,得到其所有的GO功能条目。
GO富集柱状图
差异Peak邻近基因Pathway富集分析
统计各个KEGG Pathway上包含的差异Peak邻近基因数目及富集程度,进而确定差异Peak邻近基因主要参与的代谢途径和信号通路。
KEGG富集分析
Overlap基因分析
为了研究转录因子/组蛋白修饰是如何调控下游基因,通常要结合表达数据 RNA-seq 分析,进一步研究转录因子/组蛋白修饰的调控作用,即促进或抑制基因表达。
韦恩图