首页> 关于我们 >新闻中心>技术分享>新闻详情

BSA问答——入门篇

2020-10-27

封面.png

之前小编给大家介绍了做性状定位简便又实用的混池分组分析法(BSA),相信大家对这种研究方法已经有了一定的了解,那大家的课题适不适合采用BSA分析法?做BSA项目前,必须要了解哪些知识点呢?

今天小编为大家整理了那些做BSA项目前,你必须要了解的知识点,希望能解答您的疑惑!


Q1什么课题适合BSA?

A1:理论上来讲,任何两个具有相对性状的亲本杂交后产生的分离群体都适用于BSA分析。但在实际应用中,一般选择研究物种亲本为纯系,杂合度较低(判断依据:自交亲和度是否高),研究性状(需要定位的)最好为质量性状或由少数几个主效QTL控制的数量性状。


Q2为什么建议选择单一家系,不建议混合家系、自然群体以及林木等群体?

A2:混合家系、自然群体以及林木等为高杂合群体,遗传多样性较高,即使在很小一段DNA区域也有很大可能存在多种等位基因基因型。DNA池中存在多种基因型,将导致SNP检测和基因型频率计算可靠性降低。

在杂交家系中,一段DNA一般只含有两种来自两个亲本的等位基因,所以reads比对参考序列和变异检测相对简单。高杂合的群体混池后,DNA多样性提高,reads多样性自然也提高,比对参考基因组的错误率以及SNP检测的错误率等都会提高。

基于双亲杂交的BSA-seq分析,大部分突变基因型都是高频的(≥0.5),检测相对容易。在MutMap中,有文章将频率≤0.3的SNP过滤掉。但在自然群体中,低频SNP大量存在,混池后,无法区分哪些是真实的低频SNP,哪些是测序或比对错误导致的SNP,会给数据分析带来困难。


Q3群体构建时对亲本有什么要求?

A3:亲本要选用尽量纯的个体,可通过自交进行纯化,两个亲本要在目标性状上有显著差异,但其他性状尽量保持一致,以降低后期定位分析的干扰。


Q4亲本为什么要求目标性状基因位点纯合?

A4:BSA性状定位的核心原理是检测双亲的SNP并计算子代池间全基因组水平的SNP-index,如果亲本不是纯合,会导致子代SNP的检出率和SNP-index降低,如果要进行定位,则必然会降低筛选SNP-index的阈值,会导致假阳性的出现。在计算SNP-index的过程中,目前依据的原则是以亲本为参考,且筛选亲本纯合的位点,计算子代池在这些位点的SNP-index。


Q5对子代群体有什么要求?

A5:理论上来说,只要目标性状不同的亲本杂交后代产生了性状分离都可以拿来做BSA,但是比较常用的群体有:F2、回交群体、重组自交系等。

如果是质量性状,子代的显隐性个体比值可能有1:1、3:1等情况;数量性状的话,子代性状应当符合正态分布为佳,如果严重偏离,需要考虑是否有隐性致死基因产生了作用。


Q6为什么群体要选择F2、RILs群体?

A6:F2和RILs分别是定位控制质量性状和数量性状基因或QTL最常用的群体。对于质量性状来说,F2完全可以满足分析需求,缩短群体构建周期。而数量性状通常由多基因控制,而且表型易受环境影响,用RILs可以进行多次表型调查,获得准确的表型数据。对于基因组较小较简单的一些物种,如果目标数量性状是由个别主效QTL控制,也可使用F2。此外,F1代仅用于林木或鱼类等亲本杂合度较高的物种中基因的定位。这类物种本身就不适合BSA。如果坚持用F1代做林木或鱼类等的基因定位,风险较高,可能出现较多的假阳性,甚至会出现无法定位出候选区域的情况。


Q7子代取多少样品才够呢?

A7:子代的取样应当符合以下原则:

定位质量性状的,应该取尽可能多的隐性个体,最低不能低于20个,一般在30-50之间,然后取对应数量的显性个体;

定位数量性状的,一般是选择最极端的各5%-10%性状的个体,还可以将子代的性状数据做个类似如下的直方图:

微信图片_20201026161309.png


Q8子代群体规模不够,应该优先取极端还是优先取数量?

A8:很多物种的子代群体很难做到200个以上,就会出现极端个体不足20的情况,这时我们建议宁可少取些样品,也不要把性状居中的样品选择进去,这些样品只会对后期分析产生干扰。当然每一个池只有十来个样品的实验,是否能够得到满意的结果,是存在一定风险的。


Q9如果F2单株DNA量不足该怎么办?

A9:F2单株有时由于取样量少,提取的DNA量较少,如果无法提供足够的DNA,可从该F2单株的后代F3中,随机选择6~10株混提DNA来代替该F2。


Q10重测序时对亲本和子代的测序深度要求是多少?

A10:为保证SNP、InDel标记的准确性,测序应当保证一定的深度,亲本建议不低于20×,混池应当结合取样数量来定,平均每个样品不低于1×,比如子代是30+30,那么每个子代混池的测序深度就不能低于30×,经费允许的话,可以再适当加深。


Q11参考基因组的质量有什么要求?

A11:参考基因组组装得越好,信息越全,注释文件信息也相对较全;即便是草图,如果scaffolds能有染色体定位信息,对于后续基因定位和候选基因注释都会更加精确,可以估计候选区域的大小。没有组装到染色体的参考基因组分析思路是一样的,但只能得到某个或某些scaffolds中的SNPs与性状相关,无法估计候选区域的大小,但是如果组装结果差的话,有可能遗漏掉一些候选基因。


Q12为什么不用具有极端性状的亲本直接做混池测序而需要进行杂交群体构建?

A12:亲本之间遗传背景具有一定差异,除了关注的目标性状位点的差异外,其他的基因位点肯定也会存在差异,而且亲本都为纯系,不存在混池一说,所有SNP位点的△SNP-index都是1。双亲杂交后代中由于染色体自由组合和遗传重组,非目标性状基因位点的变异在极端性状的两个子代池中均有分布,通过两个混池的频率差异,可消除目标性状外背景差异的干扰。


Q13只测2个子代池是否可行?

A13:如果研究性状为EMS诱变的质量性状,同时所研究物种已有组装质量较好的参考基因组,研究品系亲本为普通野生型,与参考基因组品系为相同生态型的情况下,是可以只测2个子代池的,以参考基因组为一致性序列计算SNP-index。但是一般情况下,由于参考基因组和所研究品种之间原本就可能存在较大的差异,会导致出现大量假阳性SNP。所以,还是推荐测双亲和2个子代池,尽可能排除背景噪声,减少假阳性SNP。

如果研究的性状是数量性状,最好是2个亲本和2个子代池都测,其次是1个亲本和2个子代池。不推荐只测2个子代池,会出现较多假阳性SNP。


Q14简化基因组测序能用于BSA性状定位吗?

A14:简化基因组BSA技术仅能捕获全基因组的1%~10%,如果研究物种基因组较大,对于微效多基因控制的数量性状与目标性状相关位点很多,可能会捕获到个别位点,但会遗漏大部分位点,对后续研究不利。对质量性状或由主效基因控制的数量性状,简化基因组BSA风险很高,建议将亲本和群体都做简化基因组测序,构建全基因连锁图谱进行性状基因定位。


以上就是我们精心整理的BSA项目前你应该了解的知识点,希望能够帮助大家解决项目前期的一些疑惑,选择更适合自己群体的研究方法。

下期我们将继续推出BSA问答系列-结果解读篇,总结BSA项目中数据挖掘的各种问题,下周不见不散咯!