首页> 关于我们 >新闻中心>技术分享>新闻详情

包教包会!单细胞转录组数据SRA数据库上传教程!

2024-08-05

公众号首图封面-0802(1).jpg



SRA(Sequence Read Archive)作为NCBI用于保存大规模测序原始数据的数据库,也是绝大多数转录组文章上传原始数据的较优选择。这里我们整理了单细胞转录组原始数据上传SRA的超简单方法,5分钟让你成为平(fei)平(chang)无(li)奇(hai)的数据上传小天才!



1.NCBI登录




1.1 进入网址:https://www.ncbi.nlm.nih.gov/,然后点击右上角的log in进行登录;

图片1.png


1.2 如果您没有NCBI的账号,可以进行申请,或者使用其他登录方式:

图片2.png


1.3 登录完成后依次点击submit,如下:

图片3.png

图片4.png


1.4 点击new submission,创建新的上传任务单;

图片5.png


2.信息填写

2.1 接下来就是信息填写了,只要根据网站提示填写相应内容即可。首先是个人信息,*为必填选项,包括名字,邮箱(这里尽量不要使用qq邮箱,以避免无法正常接收邮件),以及学校信息等,填写完成后点击继续。

图片6.png



2.2 接下来填写General Information,这里主要填写是否已经注册BioProject和BioSample的信息,没有申请直接选择NO即可。另外可以根据您的需要,选择数据是上传后立即公布,还是指定日期公布,填写完成后点击继续。

图片7.png

2.3 之后填写项目信息,*为必填项,填写项目标题及项目信息,根据老师的项目情况及实验处理进行填写即可。非必填内容可以直接跳过,点击continue继续。

图片8.png

2.4 选择样本类型,如植物、动物、人、细菌等,这里我们以人类Human为例,选好后点击continue继续。

图片9.png

2.5 接下来需要提交BioSample attributes,这里有在线填写和下载表格填写两种方式。这里我们推荐下载表格填写。

图片10.png

所有的信息根据提示及项目情况进行填写即可。绿色字段为必填项,如缺少相关信息,如任何必填项没有资料,可以填写'not collected',  'not applicable' 或 'missing';;黄色字段则为非必填项。(注意,这里信息如果填写不符合规范,上传后会报错,只需根据提示的信息对表格内容进行相应修改后重新上传即可)。

图片11.png

2.6 下一步输入SRA Metadata信息,还是可以选择线上填写或下载表格填写,这里还是以表格填写为例。参照示例填写相关信息后,点击continue继续。

图片12.png

以人类肝脏空转举例,单细胞或空间转录组数据在红框部分选择如截图所示即可,测序仪器和型号可咨询公司确定,其他样本信息可自行填写;

图片13.png

File name就是原始数据的名称,双端测序应该有R1和R2两个名字;

图片14.png



3.数据上传

3.1 终于到了最后一步上传数据啦!老师根据自己的数据情况,选择适合的上传方式即可。如果数据较少,可以选择直接网页上传;单细胞转录组数据一般较大,这里推荐Aspera方法上传数据:

图片15.png

3.2 准备好原始数据,原始数据都是xxx.fastq格式;

图片16.png

3.3 准备Aspera上传所需相关文件;

图片17.png

软件下载路径和操作步骤ncbi页面上都会有(请看下面截图),以下是中文操作步骤:

1)下载key file文件(一般会是一个aspera.openssh文件),放在一个固定的位置。

2)在本地找到ascp.exe程序位置。可以先在应用里找到Aspera Connect软件,右键点击“属性”找到Aspera Connect快捷方式,再次右键点击“属性”进入,里面会看到有ascp.exe程序。

比如我的是在C:\Users\psn\AppData\Local\Programs\IBM\Aspera Connect\bin里面。

3)在这个文件夹里面(ascp.exe程序所在位置文件夹),在文件夹的空白处,按住shift键 同时鼠标右击,打开power shell命令窗口。然后输入命令行(ncbi页面上的):ascp.exe -i <key_file< font="">文件所在路径> -QT -l100m -k1 -d <需要上传的原始数据所在路径> subasp@upload.ncbi.nlm.nih.gov:uploads/caihong.song_outlook.com_I6Ezp1wv

举例我的:

.\ascp.exe -i V:\tmp\202402\AAA_ST-seq\aspera.openssh -QT -l100m -k1 -d V:\tmp\202402\AAA_ST-seq\rawdata subasp@upload.ncbi.nlm.nih.gov:uploads/caihong.song_outlook.com_I6Ezp1wv

注意:输入的命令行就是ncbi页面上的命令行,注意最前面要额外加上.\。每个人的都不一样,只是需要把标黄标绿的位置,替换成我们存放这些文件的位置路径即可。

图片18.png

4)然后数据就会自动上传了,显示100%时表明上传完毕;

未命名1722821392.png

5)数据上传成功后,最后一步检查一下上传信息是否有误,确定没问题的话点击submit,我们的上传工作就完成啦,接下来就静静的等待NCBI发送邮件给我们了。

注意:如果数据上传中出现了无法修改的错误,或迟迟没有审核完成的情况,大家都可以发邮件给NCBI进行咨询。

图片20.png

图片21.png

图片22.png

本期单细胞转录组原始数据SRA上传教学已结束,大家都学会了吗?