2024-08-05
SRA(Sequence Read Archive)作为NCBI用于保存大规模测序原始数据的数据库,也是绝大多数转录组文章上传原始数据的较优选择。这里我们整理了单细胞转录组原始数据上传SRA的超简单方法,5分钟让你成为平(fei)平(chang)无(li)奇(hai)的数据上传小天才!
1.NCBI登录
1.1 进入网址:https://www.ncbi.nlm.nih.gov/,然后点击右上角的log in进行登录;
1.2 如果您没有NCBI的账号,可以进行申请,或者使用其他登录方式:
1.3 登录完成后依次点击submit,如下:
1.4 点击new submission,创建新的上传任务单;
2.信息填写
2.1 接下来就是信息填写了,只要根据网站提示填写相应内容即可。首先是个人信息,*为必填选项,包括名字,邮箱(这里尽量不要使用qq邮箱,以避免无法正常接收邮件),以及学校信息等,填写完成后点击继续。
2.2 接下来填写General Information,这里主要填写是否已经注册BioProject和BioSample的信息,没有申请直接选择NO即可。另外可以根据您的需要,选择数据是上传后立即公布,还是指定日期公布,填写完成后点击继续。
2.3 之后填写项目信息,*为必填项,填写项目标题及项目信息,根据老师的项目情况及实验处理进行填写即可。非必填内容可以直接跳过,点击continue继续。
2.4 选择样本类型,如植物、动物、人、细菌等,这里我们以人类Human为例,选好后点击continue继续。
2.5 接下来需要提交BioSample attributes,这里有在线填写和下载表格填写两种方式。这里我们推荐下载表格填写。
所有的信息根据提示及项目情况进行填写即可。绿色字段为必填项,如缺少相关信息,如任何必填项没有资料,可以填写'not collected', 'not applicable' 或 'missing';;黄色字段则为非必填项。(注意,这里信息如果填写不符合规范,上传后会报错,只需根据提示的信息对表格内容进行相应修改后重新上传即可)。
2.6 下一步输入SRA Metadata信息,还是可以选择线上填写或下载表格填写,这里还是以表格填写为例。参照示例填写相关信息后,点击continue继续。
以人类肝脏空转举例,单细胞或空间转录组数据在红框部分选择如截图所示即可,测序仪器和型号可咨询公司确定,其他样本信息可自行填写;
File name就是原始数据的名称,双端测序应该有R1和R2两个名字;
3.数据上传
3.1 终于到了最后一步上传数据啦!老师根据自己的数据情况,选择适合的上传方式即可。如果数据较少,可以选择直接网页上传;单细胞转录组数据一般较大,这里推荐Aspera方法上传数据:
3.2 准备好原始数据,原始数据都是xxx.fastq格式;
3.3 准备Aspera上传所需相关文件;
软件下载路径和操作步骤ncbi页面上都会有(请看下面截图),以下是中文操作步骤:
1)下载key file文件(一般会是一个aspera.openssh文件),放在一个固定的位置。
2)在本地找到ascp.exe程序位置。可以先在应用里找到Aspera Connect软件,右键点击“属性”找到Aspera Connect快捷方式,再次右键点击“属性”进入,里面会看到有ascp.exe程序。
比如我的是在C:\Users\psn\AppData\Local\Programs\IBM\Aspera Connect\bin里面。
3)在这个文件夹里面(ascp.exe程序所在位置文件夹),在文件夹的空白处,按住shift键 同时鼠标右击,打开power shell命令窗口。然后输入命令行(ncbi页面上的):ascp.exe -i <key_file< font="">文件所在路径> -QT -l100m -k1 -d <需要上传的原始数据所在路径> subasp@upload.ncbi.nlm.nih.gov:uploads/caihong.song_outlook.com_I6Ezp1wv
举例我的:
.\ascp.exe -i V:\tmp\202402\AAA_ST-seq\aspera.openssh -QT -l100m -k1 -d V:\tmp\202402\AAA_ST-seq\rawdata subasp@upload.ncbi.nlm.nih.gov:uploads/caihong.song_outlook.com_I6Ezp1wv
注意:输入的命令行就是ncbi页面上的命令行,注意最前面要额外加上.\。每个人的都不一样,只是需要把标黄标绿的位置,替换成我们存放这些文件的位置路径即可。
4)然后数据就会自动上传了,显示100%时表明上传完毕;
5)数据上传成功后,最后一步检查一下上传信息是否有误,确定没问题的话点击submit,我们的上传工作就完成啦,接下来就静静的等待NCBI发送邮件给我们了。
注意:如果数据上传中出现了无法修改的错误,或迟迟没有审核完成的情况,大家都可以发邮件给NCBI进行咨询。
本期单细胞转录组原始数据SRA上传教学已结束,大家都学会了吗?