表观遗传—全基因组甲基化:有图有真相!

DNA甲基化是植物表观遗传的一种重要形式,包括异染色质和影响基因表达两种方式。DNA甲基化引起的大量变异已经被揭露。然而,开花植物的DNA甲基化修饰尚不清楚。国际著名学术期刊Genome Biology在线发表了美国佐治亚大学研究组的题为“Widespread natural variation of DNAmethylation within angiosperms”研究论文。Niederhuth等通过DNA甲基化测序比较了34个不同被子植物的单碱基分辨率全基因组DNA甲基化图谱。

1 全基因组DNA甲基化修饰

图1a-c全基因组甲基化水平最终提供了一个不同物种的比较标准;图1d揭示不同的DNA甲基化修饰方式的组成比例,各物种之间mCG修饰方式最普遍存在,其次为mCHG和mCHH;图1e-g显示每个位点的DNA甲基化水平分布规律,揭示了细胞被甲基化的比例。可将以上植物分为三类家族:

(1) Brassicaceae家族:每个位点发生mCHG甲基化的水平较低,CMT3路径对Brassicaceae家族植物的基因组影响较小;

(2) Fabaceae家族:每个位点发生mCHH甲基化的水平较低;

(3) Poaceae家族:虽然有CMT2存在,但是mCHH路径效率较低可能直接导致每个位点发生mCHH甲基化的水平更低;

2. DNA甲基化的基因组结构

DNA甲基化往往会引起异染色质。导致基因组大小变化的主要一两个因素,全基因组重复(WGD)事件和重复元件的重复。本研究发现,mCG以及mCHG和基因组大小之间存在正相关,但是mCHH和基因组大小无关(图2a)。同时发现,编码区mCHG和mCHH甲基化水平和基因组大小有关,而mCG和基因组大小无关(图2b)。着丝粒和着丝粒区域是DNA甲基化最频发的区域。用100kb的滑动窗口检测染色体上DNA甲基化分布(图2c)。mCG和mCHG和DNA甲基化及基因数量存在负相关,也就是说这两种DNA甲基化形式在异染色质区频发(图2d)。然而,几个Poaceae家族的物种基因数量和mCHH水平无关甚至正相关(图2d)。

 

图1. 全基因组甲基化水平

3. 重复序列的DNA甲基化

全基因组mCG和mCHG水平和重复元件的增殖有关,而mCHH水平和重复元件的增殖无关(图3a)。CDS区mCHG和mCHH与重复元件数量有关,而CDS区mCG和其无关。在所有物种中,CG区域常被甲基化,但CHG和CHH区域甲基化频率更高(图3b)。mCHG在大多数物种的重复区域频发,除了Brassicaceae家族物种之外,同时,mCHH在Poaceae家族物种中最少(图3c)。

 

图2. DNA甲基化和基因组的关系

4. CG基因甲基化

三种甲基化形式都和基因的过表达有关,基因发生mCG甲基化也会继续表达。图4a显示,所有物种同源基因的DNA甲基化。图4b统计了所有物种中gbM基因的百分比。GbM基因即在转录起始位点(TSS)周围DNA甲基化急剧下降、整个基因mCG甲基化增加以及在转录终止位点(TTS)形成的。GbM基因在大多数物种中显示出一致的甲基化趋势(图4c)。基因的过表达表明,尽管位于基因区的mCG没有抑制基因表达,但是当它在TSS区时就会一直基因表达(图4d)。

5. 非CG甲基化基因

基因内存在非CG甲基化会使得基因过表达。基因的mCHG和mCHH甲基化方式类似。基因的mCHG和mCHH甲基化方式和基因表达水平下降有关(图5b),mCHG可以单独影响基因表达水平的下调。基因发生非CG甲基化的概率为3-32%(图5c)。在Poaceae物种中,发生mCHG甲基化的基因占5%。而在Brassicaceae物种中mCHG方式较少,而mCHH为主要的甲基化方式。

 

图3. 全基因组甲基化水平

6. 非编码序列和调控区

在编码区外,结合邻近的转录因子结合位点(TFBS)或者其他调控元件发生DNA甲基化来影响基因的表达。我们验证了所有物种非编码区(CNS)DNA甲基化水平(图6a),三种形式甲基化的水平都较高。每个物种注释基因上下游2kb区域进行mCHH岛分析,发现所占比例(图6b)。虽然一些物种的mCHH和基因表达存在一定的关系,但是大多数没有关系(图6c)。基因mCHH岛的远极面mCG和mCHG甲基化频发(图6d)。

 

图4. 基因过表达影响因素

 

图5. 基因的甲基化水平

 

图6. 非编码序列的甲基化模式

总结

本研究揭示了DNA甲基化广泛存在于十字花科植物。鉴定了开花植物的DNA甲基化图谱,揭示出这些表观遗传标记与植物进化历史之间的关系。利用全基因组亚硫酸氢盐测序来评估34种被子植物的胞嘧啶甲基化模式。对于十字花科植物,它包括模式生物拟南芥及甘蓝,研究人员发现基因体上CG甲基化水平低于平常;对于禾本科开花植物,研究人员发现异染色质CHH甲基化的缺乏或减少,但CHH甲基化集中在基因区域上;开花植物之间存在广泛的DNA甲基化差异。无论是DNA甲基化的水平,还是DNA甲基化的分布,各个物种之间都存在广泛的差异。

参考文献

Niederhuth C E, Bewick A J, Ji L, et al. Widespread natural variation of DNA methylation within angiosperms[J]. Genome Biology, 2016, 17(1):194.