2024-10-29
号外~号外~细菌基因组数据NCBI上传教程更新啦! 上传教程千千万,不如小派这一篇! 单样本、多样本基因组数据上传全部轻松拿捏~ 咱们废话不多说,直接上超详细干货 基本流程
一、NCBI注册及上传
1、注册网站: https://www.ncbi.nlm.nih.gov/account/register/?back_url=http%3A%2F%2Fwww.ncbi.nlm.nih.gov%2Fhome%2Fsubmit.shtml&partners-uri=cms:/account/partners 打开NCBI注册网站,选择第三方平台进行注册登录 2、进入提交页面 打开NCBI官网https://www.ncbi.nlm.nih.gov/,输入账号和密码,点击网页上的Submit栏可进入GenBank界面,找到细菌基因组提交栏,点击进入即可开始本次的提交(或直接点击https://submit.ncbi.nlm.nih.gov/subs/genome/进入提交界面)。 具体步骤如下: 3、点击New submission进入,此步操作可以得到SUB号;
Part 01、单样本基因组上传
二、基本信息填写
1、单个样本基因组上传——选择Single genome,点击continue; 2、进入SUBMITTER完善个人信息,带*为必填项,填写完点击continue。此处的邮箱不建议使用qq邮箱、163邮箱和foxmail邮箱; 3、General Information信息填写(此处以未申请BioProject和BioSample号为例,如果已经申请过可以直接将对应的BioProject和BioSample号直接填写即可): (1)BioProject和BioSample处选择NO,释放数据日期可根据自己的需要来进行选择; (2)组装和测序信息填写(组装软件及版本可在结题报告附录-软件列表查看): 细菌框架图项目的组装软件:spades,版本v3.15.4 细菌完成图项目的组装软件:Fyle,版本v2.9.1-b1781;Unicycler,版本 v0.5.0; (3)测序深度及测序平台的选择: 测序深度=测序数据量/基因组大小(可在结题报告-二代测序数据过滤部分查看); 测序平台:二代一般为Illumina Novaseq平台,三代一般为Pacbio/Nanopore平台(可在结题报告-文库信息部分查看); (4)填写基因组的组装信息以及是否有关联的文章,填写完成后点击Continue进入下一步;
三、BioProject信息填写
菌株英文描述(大概100个左右word ):描述下该菌株进行全基因组测序的目的、意义及用途(工业/农业/医疗等等)等信息(共性\不同),填写完成后点击Continue进入下一步;
四、BioSample信息填写
1.选择Microbe,点击Continue进入下一步; 2.BioSample Attributes:填写物种拉丁名称及菌株名;菌株的来源,保存单位(xxx单位分离及分离信息 xxx单位保存或 xxx保藏中心保存)和样本收集时间; 3.source:是否需要NCBI注释——选择Yes;
五、Sequence上传,信息填写
1.Files:细菌完成图如果只组装出一条染色体,没有质粒可选择选项1;细菌框架图组装出多条scaffold或细菌完成图组装出了多条完整的染色体/质粒可选择选项2; 2.选择网页版上传,并将基因组中的染色体和质粒的fasta文件全部上传(细菌完成图上传Assembly文件夹*.fasta文件,细菌框架图上传Assembly文件夹*.scaffolds.fna文件),上传后点击Continue进入下一步; 3.Assignment:需要确认组装得到的染色体有几条、是否含有质粒,染色体和质粒是否为完整的环状的,以及Sequence ID需要与fasta文件中>后名字一致。在提交质粒信息的时候,质粒的命名为以“P”开头的名字或者命名为unnamed、unnamed1...... 4.填写作者名字及排序,以及该基因组是否有相关联的文章,点击Continue进入下一步;
六、数据提交
核查已填入的信息是否有误,有问题的话返回对应的界面进行修改,确认无误后点击Submit完成本次NCBI上传。一般上传一个星期内NCBI会发邮件到邮箱,给出相应的登录号,这个登录号可直接用于后续的文章中。
Part 02、多样本基因组上传(针对于细菌框架图样本)
1、多个样本基因组上传——选择Batch/multiple genomes,点击continue; 2、Gap信息填写 3、BioProject General Info 4、Publications 5、Biosample Type 6、Attributes 7、Genome Info (1)填写基因组信息 (2)组装和测序信息填写(组装软件及版本可在结题报告附录-软件列表查看) 8、Files:选择网页版上传,并将基因组中的fasta文件全部上传(细菌完成图上传Assembly文件夹*.fasta文件,细菌框架图上传Assembly文件夹*.scaffolds.fna文件),上传后点击Continue进入下一步; 9、References:填写作者名字及排序,以及该基因组是否有相关联的文章,点击Continue进入下一步; 核查已填入的信息是否有误,有问题的话返回对应的界面进行修改,确认无误后点击Submit完成本次NCBI上传。一般上传一个星期内NCBI会发邮件到邮箱,给出相应的登录号,这个登录号可直接用于后续的文章中。
以上就是细菌基因组上传至NCBI的详细步骤,是不是已经学会了?赶快用自己的数据来试试吧!如果大家在上传过程中有任何疑问,欢迎随时和我们一起探讨,可在文末留言或者邮件交流(microsupport@personalbio.cn)。