首页> 关于我们 >新闻中心>技术分享>新闻详情

科研干货 | 细菌基因组数据NCBI上传教程2.0

2024-10-29

细菌基因组数据NCBI上传教程2.0-(1).jpg

号外~号外~细菌基因组数据NCBI上传教程更新啦!

图片1.png

上传教程千千万,不如小派这一篇!

单样本、多样本基因组数据上传全部轻松拿捏~

咱们废话不多说,直接上超详细干货


基本流程

图片2.png



一、NCBI注册及上传

1、注册网站:

https://www.ncbi.nlm.nih.gov/account/register/?back_url=http%3A%2F%2Fwww.ncbi.nlm.nih.gov%2Fhome%2Fsubmit.shtml&partners-uri=cms:/account/partners

打开NCBI注册网站,选择第三方平台进行注册登录

图片3.png


2、进入提交页面

打开NCBI官网https://www.ncbi.nlm.nih.gov/,输入账号和密码,点击网页上的Submit栏可进入GenBank界面,找到细菌基因组提交栏,点击进入即可开始本次的提交(或直接点击https://submit.ncbi.nlm.nih.gov/subs/genome/进入提交界面)。

具体步骤如下:

图片4.png

图片5.png


3、点击New submission进入,此步操作可以得到SUB号;

图片6.png



Part 01、单样本基因组上传

二、基本信息填写

1、单个样本基因组上传——选择Single genome,点击continue;

图片7.png


2、进入SUBMITTER完善个人信息,带*为必填项,填写完点击continue。此处的邮箱不建议使用qq邮箱、163邮箱和foxmail邮箱;

图片8.png


3、General Information信息填写(此处以未申请BioProject和BioSample号为例,如果已经申请过可以直接将对应的BioProject和BioSample号直接填写即可):

(1)BioProject和BioSample处选择NO,释放数据日期可根据自己的需要来进行选择;

图片9.png

(2)组装和测序信息填写(组装软件及版本可在结题报告附录-软件列表查看):

细菌框架图项目的组装软件:spades,版本v3.15.4

细菌完成图项目的组装软件:Fyle,版本v2.9.1-b1781;Unicycler,版本 v0.5.0;

图片10.png


(3)测序深度及测序平台的选择:

测序深度=测序数据量/基因组大小(可在结题报告-二代测序数据过滤部分查看);

测序平台:二代一般为Illumina Novaseq平台,三代一般为Pacbio/Nanopore平台(可在结题报告-文库信息部分查看);

图片11.png


(4)填写基因组的组装信息以及是否有关联的文章,填写完成后点击Continue进入下一步;

图片12.png



三、BioProject信息填写


菌株英文描述(大概100个左右word ):描述下该菌株进行全基因组测序的目的、意义及用途(工业/农业/医疗等等)等信息(共性\不同),填写完成后点击Continue进入下一步;

图片13.png



四、BioSample信息填写


1.选择Microbe,点击Continue进入下一步;

图片14.png


2.BioSample Attributes:填写物种拉丁名称及菌株名;菌株的来源,保存单位(xxx单位分离及分离信息 xxx单位保存或 xxx保藏中心保存)和样本收集时间;

图片15.png


3.source:是否需要NCBI注释——选择Yes;

图片16.png



五、Sequence上传,信息填写


1.Files:细菌完成图如果只组装出一条染色体,没有质粒可选择选项1;细菌框架图组装出多条scaffold或细菌完成图组装出了多条完整的染色体/质粒可选择选项2;

图片17.png


2.选择网页版上传,并将基因组中的染色体和质粒的fasta文件全部上传(细菌完成图上传Assembly文件夹*.fasta文件,细菌框架图上传Assembly文件夹*.scaffolds.fna文件),上传后点击Continue进入下一步;

图片18.png


3.Assignment:需要确认组装得到的染色体有几条、是否含有质粒,染色体和质粒是否为完整的环状的,以及Sequence ID需要与fasta文件中>后名字一致。在提交质粒信息的时候,质粒的命名为以“P”开头的名字或者命名为unnamed、unnamed1......

图片19.png


4.填写作者名字及排序,以及该基因组是否有相关联的文章,点击Continue进入下一步;

图片20.png



六、数据提交


核查已填入的信息是否有误,有问题的话返回对应的界面进行修改,确认无误后点击Submit完成本次NCBI上传。一般上传一个星期内NCBI会发邮件到邮箱,给出相应的登录号,这个登录号可直接用于后续的文章中。

图片21.png

图片22.png

图片23.png

图片24.png


Part 02、多样本基因组上传(针对于细菌框架图样本)


1、多个样本基因组上传——选择Batch/multiple genomes,点击continue;

图片25.png


2、Gap信息填写

图片26.png


3、BioProject General Info

图片27.png


4、Publications

图片28.png


5、Biosample Type

图片29.png


6、Attributes

图片30.png

图片31.png


7、Genome Info

(1)填写基因组信息

图片32.png


(2)组装和测序信息填写(组装软件及版本可在结题报告附录-软件列表查看)

图片33.png


8、Files:选择网页版上传,并将基因组中的fasta文件全部上传(细菌完成图上传Assembly文件夹*.fasta文件,细菌框架图上传Assembly文件夹*.scaffolds.fna文件),上传后点击Continue进入下一步;

图片34.png


9、References:填写作者名字及排序,以及该基因组是否有相关联的文章,点击Continue进入下一步;

图片35.png


核查已填入的信息是否有误,有问题的话返回对应的界面进行修改,确认无误后点击Submit完成本次NCBI上传。一般上传一个星期内NCBI会发邮件到邮箱,给出相应的登录号,这个登录号可直接用于后续的文章中。

未命名1730165039.png


以上就是细菌基因组上传至NCBI的详细步骤,是不是已经学会了?赶快用自己的数据来试试吧!如果大家在上传过程中有任何疑问,欢迎随时和我们一起探讨,可在文末留言或者邮件交流(microsupport@personalbio.cn)。