首页> 关于我们 >新闻中心>技术分享>新闻详情

基于全基因组数据解析新型冠状病毒的演化和传播

2020-02-26


2019年12月底,爆发于湖北省武汉市的新型冠状病毒(简称“2019-nCoV”),与2003年的SARS冠状病毒以及2012年的MERS冠状病毒同属于冠状病毒科β属,由于其迅速的传播性和感染性引发社会广泛关注。

1.png

冠状病毒结构


当前,确定华南海鲜市场是不是唯一的发源地,对于寻找病毒的来源,以及确定中间宿主,对疫情的控制和避免再次爆发具有至关重要的意义。中国科学院西双版纳热带植物园联合华南农业大学和北京脑科中心的科研人员一起收集了全世界各领域共享到GISAID EpiFluTM数据库中覆盖了四大洲12个国家的93个新型冠状病毒样本的基因组数据(截止2月12日),通过全基因组数据解析,追溯传染源及扩散路径。

研究发现,收到的93个样本包含58种单倍型,可以归纳为五组(图1),包括3个古老超级传播者单倍型(H1,H3和H13)和2个新的超级传播者单倍型(H56和mv2);华南海鲜市场的新型冠状病毒是从其他地方传入进来,在市场中发生快速传播蔓延到市场之外;同时,现扩散的病例至少来自于3个途经。新型冠状病毒在2月12日之前发生过2次明显的种群扩张(分别是12月8日和1月6日)。


华南海鲜市场的新型冠状病毒是从其他地方传入的

基于120个变异位点得到58种单倍型(基因类型),单倍型演化关系显示,单倍型H13和H38是比较“古老的”单倍型,通过一个中间载体(mv1,可能是一个祖先单倍型,可能是来自中间宿主或者“零号病人”)与蝙蝠冠状病毒RaTG13关联,并通过单倍型H3衍生出了单倍型H1。与华南海鲜市场有关联的患者样品单倍型都是H1及其衍生的单倍型H2,H8-H12(图1,A),而一份武汉样品单倍型H3与华南海鲜市场无关。可见,华南海鲜市场的新型冠状病毒是从其他地方传入进来,在市场中发生快速传播蔓延到市场之外。另外,根据病患发病时间记录和种群扩张时间推断,也印证了华南海鲜市场不是病毒发源地的推论。

对“古老的”单倍型H13和H38的病毒样品溯源发现分别是来自深圳的病患(广东首例)和美国华盛顿州的病患(美国首例)。他们的旅行记录表明应该都是2019年12月底至2020年1月初在武汉探亲期间被感染的。现有武汉样本中没有检测到H13和H38单倍型,可能是因为现有样品主要采自几家定点医院,而且样品采集时间局限于2019年12月24日和2020年1月5日。如果能在武汉其他医院早期的病患检测到这两种单倍型,将对于寻找病毒来源非常有帮助。

2.png

图1. 新型冠状病毒58种单倍型的演化关系和地理分布格局(A,B),单倍型之间的可能演化关系(C),以及新型冠状病毒的可能传播和扩散路线(D)。A和B圆圈中的数据是样本数量。



新型冠状病毒在2月12日之前发生过2次明显的种群扩张 

根据新型冠状病毒基因组数据推算1月之前的种群扩张发生时间是12月8日,该结果暗示病毒可能在12月初,甚至11月下旬即已经开始有人际传播,随后在华南海鲜市场加快了人际传播(图2)。研究推算2月份之前的种群扩张时间在1月6日,这个可能与元旦假期有关联。需要指出,这一天国家疾控中心发布了2级应急响应。当时的预警起到了一些警示作用,公众活动和出行都有所减少。如果当时的警示能引起大众更广泛的重视,那么1月份中下旬向全国和全球蔓延的病例会有所降低。研究人员进一步确认我国其他9个省区和其他11个国家的感染病例基本都是从武汉直接或者间接输入而来。


3.png

图2. 新型冠状病毒单倍型的样品采集时间情况。红色圈的样品是确认与华南海鲜市场有关;蓝色圈的样本确认与海鲜市场无关。



现扩散的病例至少来自于3个途径

根据新型冠状病毒基因组数据推算1月之前的种群扩张发生时间是12月8日,该结果暗示病毒可能在12月初,甚至11月下旬即已经开始有人际传播,随后在华南海鲜市场加快了人际传播(图2)。研究推算2月份之前的种群扩张时间在1月6日,这个可能与元旦假期有关联。需要指出,这一天国家疾控中心发布了2级应急响应。当时的预警起到了一些警示作用,公众活动和出行都有所减少。如果当时的警示能引起大众更广泛的重视,那么1月份中下旬向全国和全球蔓延的病例会有所降低。研究人员进一步确认我国其他9个省区和其他11个国家的感染病例基本都是从武汉直接或者间接输入而来。


新型冠状病毒基因组尚未发生重组事件 

研究人员发现新型冠状病毒基因组没有发生重组事件,93个基因组之间有120核苷酸发生了突变(0.41%序列长度),并均匀分散在10个编码区(χ2=1.958, df=9, P=0.99)。120个突变的核苷酸关联了119个氨基酸密码子,其中79个密码子 (65.83%)改变了氨基酸类型,并有42个(53.17%)氨基酸理化性质都被改变(图3)。这些氨基酸类型以及理化性质改变是否会影响新型冠状病毒的活性暂不清楚,需要其他蛋白组学和结构生物学方面的专业人士进行验证。本研究是版纳植物园综合保护中心生物多样性研究组的科研人员利用其在系统与演化领域的专长开展的,本研究提到单倍型演化关系分析方法可以结合到传染病学研究中,对于寻找传染源,以及精确的传播和扩散方向能提供非常重要的信息。

4.png

图3. 120个变异位点在8个编码区的分布情况。统计类型包括替换或替代(左上角),密码子位置1-3(右上角),同义突变或非同义突变(左下角),和氨基酸性质(右下角)。



总之一句话:根据基因组分析,新冠病毒的源头并不在华南海鲜市场,其源头究竟在哪?还需要继续追踪。

(来源中国科学院西双版纳热带植物园科技外事处)


中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长、从磨难中奋起。针对冠状病毒,相信我们也终究可以打赢这场战“役”,没有一个冬天不可逾越,没有一个春天不会来临。

派森诺生物可提供病毒(DNA/RNA病毒)全基因组测序服务,基于高通量测序技术,获得病毒基因组的图谱信息,并在结构基因组学、比较基因组学层面通过差异分析、同源基因分析、共线性分析、物种进化分析等手段探究病毒的性质,为病毒的溯源和进化研究提供证据。

如果您想了解更多内容,欢迎在下方留言给我们,或发邮件到我们微生物基因组产品线邮箱:microsupport@personalbio.cn,我们期待您的咨询!