2025-06-26


文章亮点
1.文章突破四倍体基因组组装难题,构建首个整合433,765个结构变异(SVs)的苜蓿泛基因组,为多倍体作物研究提供新范式。
2.评估基于SNP或SV的GWAS分析方法对性状预测的准确度,基于SV的方法使品质性状预测准确率提升至96.63%,QTL检出效率较SNP方法提高47%。
3.派森诺提供全基因组关联分析(GWAS)一站式解决方案:从样本检测到基因定位,专业解析复杂性状遗传机制,助力精准育种与医学研究突破。
文章信息
文章题目:Pan-genomic analysis highlights genes associated with agronomic traits and enhances genomics-assisted breeding in alfalfa
中文题目:泛基因组分析揭示紫花苜蓿农艺性状相关基因并强化基因组辅助育种效能
发表期刊:Nature Genetics
影响因子:29
发表时间:2025年4月
涉及组学:基因组Denovo、全基因组测序、转录组测序
摘要
苜蓿(Medicago sativa L.)是一种全球重要的牧草作物,因其高营养价值和固氮能力而备受重视。本研究基于24个遗传背景多样的苜蓿种质,构建了高质量泛基因组。通过全面分析,共鉴定出433,765个结构变异(SVs)和54,002个泛基因家族,揭示了基因组多样性在苜蓿驯化和适应中的关键作用。研究发现与耐盐性和品质性状相关的关键SVs,并通过功能分析验证了MsMAP65和MsGA3ox1等基因的作用。该文章为苜蓿育种提供了宝贵的基因组资源,为重要农艺性状的遗传基础提供了新见解,并为未来作物改良奠定了坚实基础。
研究背景
苜蓿因其高品质、高产性、生物固氮能力和抗逆性的独特组合,在牧草作物中意义重大。作为历史上重要的作物,经过长期驯化和栽培,苜蓿已演变为高产且适应性强的牧草。 此外,苜蓿与根瘤菌形成共生关系,促进大气固氮,这不仅减少生长期间对氮肥的依赖,还带来经济效益和环境效益。因此,苜蓿在全球粮食供应和土壤修复中扮演关键角色。
传统依赖单一参考基因组序列往往无法充分捕捉物种序列多样性的全貌,尤其是在复杂大片段SVs的背景下。SVs在决定农艺性状、作物驯化、遗传改良和进化过程中发挥关键作用。在此背景下,泛基因组通过整合物种内多个基因组的复杂变异,为基因表征提供了更准确和全面的方法。这一综合方法有望推动苜蓿的可持续发展和改良,为培育更高产、适应性更强的新品种提供坚实支持。
研究结果
1.ZM4苜蓿单倍型基因组组装改进
本研究针对同源四倍体苜蓿(2n=4x=32)基因组复杂性问题,通过创新性单倍型组装策略,显著提升了ZM4品种的参考基因组质量。采用Khaper算法对初始2.74 Gb的contigs进行去冗余处理,获得826.16 Mb的单倍型contigs(N50=1.05 Mb),并通过Hi-C数据锚定至8条伪染色体(锚定率99.93%)。基因组质量评估显示:BUSCO完整性达97.4%(1,572/1,614核心基因),长末端重复序列组装指数(LAI=20.44)达到黄金标准,且与近缘物种(M. truncatula和M. sativa ssp. caerulea)的共线性分析验证了组装的准确性。

图1 ZM4苜蓿基因组组装
2.变异检测和群体结构分析
研究人员对176份苜蓿核心种质资源进行重测序,旨在深入解析其遗传多样性与群体结构。通过ADMIXTURE软件分析全球苜蓿遗传结构,采用交叉验证误差率评估不同亚群数量模型(K=2-9),最终确定最优分组为三个亚群(Group1-3)。Group1:以美国种质为主(占比63.2%);Group2:以中国种质为主(71.8%);Group3:以土耳其种质为核心(58.3%)。主成分分析(PCA)结果与群体结构高度一致。三组间遗传分化指数FST为0.011-0.018,显示:亚群间分化程度低(FST<0.05)、基因流水平较高(Nm>10),种质交换可能维持了遗传相似性。

图2 苜蓿的群体结构特征
3.组装和注释24份苜蓿基因组种质
研究人员通过对24个代表性苜蓿种质(涵盖野生型2个、改良品种2个、地方品种11个和栽培品种9个)进行PacBio HiFi测序和高质量基因组组装,建立了首个全面的苜蓿基因组资源库。研究获得染色体水平单倍型基因组(801.7-891.8 Mb),平均contig N50达1.05 Mb,BUSCO完整性93.1%,重复序列占比59.93%;预测47,587-53,837个蛋白编码基因/基因组,93%获得功能注释,核心基因显著富集于跨膜转运等基础功能(P<0.05);通过比较基因组分析发现染色体间存在倒位等结构变异,为后续泛基因组研究奠定基础。
4.SV检测与泛基因组构建
研究人员从24个苜蓿种质中共鉴定出433,765个SVs,平均每个品种含108,441个变异。变异类型分布呈现显著差异:插入(216,955个,49.9%)和缺失(185,289个,42.7%)占主导,而重复(23,541个,5.4%)和倒位(8,980个,2.1%)相对较少。基于1,267,755个预测基因模型,通过OrthoFinder聚类获得54,002个非冗余基因家族。按存在频率划分为:core基因(存在于所有25个基因组)6,116个(11.3%)soft-core 基因(存在于22-24个基因组)12,697个(23.5%),shell基因(2-21个基因组)33,147个(61.4%),以及种质特异基因2,042个(3.8%)。

图3 SV检测与泛基因组的构建
5.基于图基因组的盐胁迫与品质性状变异分析
为了鉴定与农艺性状相关的结构变异(SVs),研究人员将短读长序列比对至基于图形的泛基因组,对176份苜蓿种质资源中的54,649个有效SVs进行基因分型。首先分析了盐胁迫条件下的相对叶长、叶宽和叶面积,发现这些性状间存在强相关性(相关系数0.73-0.92)。GWAS鉴定出与盐胁迫下叶片性状持续关联的SV,表明这些SV可能包含植物生长和盐胁迫形态适应的关键基因。在苜蓿品质相关遗传性状的综合研究中,于1号染色体上鉴定到一个233 bp的显著SV。具体而言,该SV与单糖含量显著相关(P<2.44×10⁻⁷),并与24小时(P<7.50×10⁻⁷)和30小时(P<4.42×10⁻²¹)体外消化率密切关联,表明SV变异可能在调控苜蓿消化率和营养价值中起关键作用。

图4 SV-GWAS关联盐胁迫下结构变异功能位点
基于对苜蓿品质遗传影响的理解,研究人员聚焦另一个关键表型性状——茎叶比(SLR)。在各类表型性状中,SLR作为植物茎叶相对比例的指标,对评估植物结构形态和生态适应性具有关键作用。采用SV-GWAS方法,成功鉴定出与SLR表型密切关联的SVs。在该SV上下游50 kb区域内鉴定出8个基因,为后续功能研究提供关键线索。具体而言,分析显示该SV位于关键基因GA3-氧化酶(MsGA3ox1,Msa.H.0115520)的下游,该酶在赤霉素合成途径中起调控作用,对植物生长和适应性至关重要。为评估候选基因MsGA3ox1在苜蓿中的作用,研究人员构建了四个独立过表达株系(MsGA3ox1-OE)进行了功能验证。

图5 基于SNP-GWAS与SV-GWAS的泛基因组关键基因功能验证
6.图泛基因组赋能紫花苜蓿分子育种
为了提升不同环境条件下的育种能力并更有效地利用遗传资源,研究人员对54个不同表型进行了GWAS和GS的综合研究。研究发现,与传统基于SNP的方法相比,整合SVs的GWAS效率显著提高,特别是在某些性状上。具体而言,47%(59个)的检测信号或数量性状位点(QTL)是通过SV-GWAS独特鉴定的。此外利用SNP和SV的结果进行GS,预测与耐盐性、发育性状和苜蓿品质相关的表型。统计分析显示,在预测耐盐胁迫、发育性状和苜蓿品质表型时,SV预测的准确性在大多数情况下优于基于SNP的预测。这一结果进一步强调了在预测复杂性状时考虑SVs的重要性。与传统SNP方法相比,SVs的使用展现了更高的预测准确性,为理解和利用遗传多样性提供了新视角。

图6 基于SV与SNP标记的全基因组关联分析和基因组预测准确性评估
总结
本研究针对苜蓿四倍体基因组复杂性,通过整合24个种质数据构建首个图形化泛基因组,鉴定出433,765个结构变异和54,002个泛基因家族。研究发现:耐盐相关SV(SV_8_28977998)调控MsMAP65基因影响叶片适应性(P<2.44×10⁻⁷);1号染色体233 bp SV与单糖含量(P<4.42×10⁻²¹)和消化率相关;MsGA3ox1基因下游SV使茎叶比降低22-31%,粗蛋白提升9.5%。开发的SV-GWAS方法比SNP多检测47%的QTLs,品质性状预测准确率达96.63%,基因组选择模型使耐盐、发育和品质性状选择效率提升29-44%。该研究建立了多倍体泛基因组研究新范式,为苜蓿分子设计育种提供关键基因资源和精准育种技术。