2019-04-09
2019年2月,派森诺生物与中国科学院海洋研究所合作发表了石鲷鱼基因组测序组装与注释的文章。该研究使用二、三代测序结合Hi-C技术组装出石鲷科染色体水平的条石鲷鱼基因组,并利用二代转录组测序,完成基因组的结构注释。文章发表在《GIGASCIENCE》,影响因子7.267。

研究背景
研究背景
条石鲷(Oplegnathus fasciatus),中脊目中脊鱼科的一员,是原产于东亚的一种具有重要商业价值的礁岩鱼。在中国以及日韩等国家,条石鲷已成为海洋网箱养殖和海洋牧场鱼类储备的重要渔业资源。近年来,新性染色发育过程中的性二态性现象和广泛存在的生物病害引起了人们越来越多的关注,然而,目前还缺乏完善的基因组资源来深入了解性别决定机制和建立生殖抗性育种体系。
研究方法

研究方法

研究结果
研究结果
▶ Part 1 基因组测序
利用Illumina二代测序平台进行DNA测序以评估基因组的大小,获得80.8Gb的clean data。最终拼接得到744.5Mb大小的基因组,GC含量为41%。获得的基因组质量较低,因为得到的基因组有大量的重复内容。

图1:O.fasciatus基因组的K-mer分布
基于Pacbio平台的三代DNA测序共得到62.9Gb的raw reads,并组装得到875.9Mb的条石鲷鱼基因组,比二代测序评估的基因组稍大。考虑到基因组序列的复杂性,在利用Redundans v0.13c去除冗余序列之后,得到778Mb大小的基因组。再经过二代测序结果的校正完善之后,最终获得778.7Mb大小的石鲷鱼基因组草图。
继二代与三代DNA测序之后,实施Hi-C技术,并将Hi-C数据比对到石鲷鱼基因组草图上,组装获得24条染色体序列,最终的确定了768.8Mb的基因组,占基因组草图大小的98.7%。

图2:O.fasciatus 基因组的Hi-C染色体间相互作用
▶ Part 2 转录组测序
利用Illumina二代测序平台进行转录组测序,以获得基因组的注释信息。RNA-Seq共获得42.2Gb的高质量序列。基于同源性以及转录组测序结果,利用de novo 对基因组进行注释。使用TopHat1.2软件将二代转录组数据比对到基因组,并利用Cufflinks预测基因结构,进行基因的结构注释,最终的总基因集由24003个基因组成,平均每个基因有10.1个外显子。
基因组的功能注释通过利用BLASTX以及BLASTN与Swiss-prot、NR、GO与KEGG等数据库比对获得,24003个基因中有97.3% (23364个基因)被至少一个数据库注释。另外,使用tRNAscan-SE (tRNAscan-SE, RRID:SCR_010835)和Rfam数据库对四种非编码RNA (microRNAs、转运RNA、核糖体RNA和小核RNA)进行了注释。

图3:O.fasciatus 与其他鱼类的系统发育关系
研究结论
研究结论
本研究成功组装了染色体水平的O.fasciatus 基因组,这是基于三代测序平台的条石碉鱼的基因组的测序、组装与注释的研究。本研究中获得的染色体水平的基因组以及为雌鱼生成的基因注释数据,将为进一步研究性别决定机制,特别是获得雄鱼Y染色体的组装提供有价值的资源。
参考文献
参考文献
Xiao Y, Xiao Z, Ma D, Liu J, Li J. Genome sequence of the barred knifejaw Oplegnathus fasciatus (Temminck& Schlegel, 1844): the first chromosome-level draft genome in the family Oplegnathidae.Gigascience. 2019;8(3):giz013. doi:10.1093/gigascience/giz013

