首页> 关于我们 >新闻中心>技术分享>新闻详情

转录组验证序列哪里找

2020-09-11


相信不少小伙伴都遇到过这样的疑惑:收到一份转录组测序结果,辛辛苦苦查找文献,挖掘关键基因信息,眼看一篇高大上的文章即将诞生,却卡在了进行qPCR验证这最后一步:我关注的RNA序列在哪里?没有序列信息我要怎么设计引物做荧光定量PCR呢?

莫慌,我们整理了派森诺各种常规转录测序产品的RNA序列信息,下面就一起来看看吧!


1、有参转录组

有参考基因组的转录组项目在进行分析时,我们是将测序reads与参考基因组进行比对,根据比对结果进行基因定量分析,进而进行差异分析的。从分析方法就可以发现,有参转录组的基因信息来自参考基因组,因此基因序列也是来自对应的数据库。

那么,我们如何从数据库中查找目标基因序列呢?我们整理了最常规的两大数据库:Ensembl和NCBI的基因序列查找方法,如果您的基因组也是来自这两个数据库,可点击查看

干货 |如何查找目标基因序列?掌握这几招就够了!(Ensembl篇)(点击查看)

干货 | 如何查找目标基因序列?掌握这几招就够了!(NCBI篇)(点击查看)


2、无参转录组

无参考基因组的转录组项目在进行分析时,我们首先要基于测序结果拼接出一个“基因集”,并对其进行注释,再将测序reads比对到这个基因集上,进而进行表达量分析和表达差异分析。

具体而言,我们首先利用Trinity软件对高质量的测序reads进行从头拼接,得到转录本序列,再对转录本进行聚类,挑选最长的转录本作为Unigene。Unigene的序列存放路径:\report\result\1_RNASeq_Pretreat\Assembly

图片7.png


另外,对于Unigene序列,我们使用Transdecoder软件对其进行ORF(开放阅读框)预测,从而得到CDS和蛋白序列,存放路径:\report\result\6_Structure\ORF

图片8.png



3、LncRNA

LncRNA为片段长度大于200nt的长链非编码RNA。分析时,我们用Stringtie软件利用Hisat2的比对结果来组装转录本,在将链方向不确定的转录本去除之后,在剩下的组装转录本集合中进行LncRNA的筛选,获得候选LncRNA。然后我们利用三种软件:PLEK、CNCI、Pfamscan,对这些候选LncRNA进行编码潜能预测,三种软件均判定为没有编码潜能的新转录本是高可信度LncRNA,可用于后续分析。

LncRNA序列存放路径:\report\result\LncRNA\1_Novel_LncRNA

图片9.png



4、CircRNA

CircRNA是一类特殊的非编码RNA分子,与传统的线性RNA(linear RNA,含5’和3’末端)不同,CircRNA分子呈封闭环状结构,其首尾相连的“接头”位置的序列由于来自相隔较远的外显子区域,直接比对基因组时存在大片段的缺口。利用这一特点,我们鉴定CircRNA时首先筛选未比对上参考基因组的测序reads,再截取两端20bp作为Anchors序列再次比对到基因组上,用于检测CircRNA。

CircRNA序列存放路径:\report\result\CircRNA\1_CircRNA_Prediction

图片10.png



5、miRNA

miRNA是一类长度在18-36nt之间的短链非编码RNA,由于其序列较短,我们对它的获取与鉴定是一般是基于一些miRNA数据库,如miRBase进行的。

miRBase (http://www.mirbase.org/)是由曼彻斯特大学的研究人员开发的一个在线的miRNA数据库,该数据库中收录了来自200多个物种、接近4万个miRNA的信息,是最全面的miRNA数据库。

对于被miRBase收录的物种,我们分析时会下载该物种miRNA的前体和成熟体序列,然后将去重后的测序reads与其进行比对,从而对测到的miRNA进行注释。对于这种miRNA测序项目,最简单的获取序列方式就是从miRBase中下载所有物种的miRNA序列,从中搜索目标miRNA的ID即可:

图片11.png


对于未被miRBase收录的物种,我们将去重后的测序reads与数据库中所有动物(或植物)的成熟miRNA序列进行比对,从中筛选保守miRNA。

得到的保守miRNA序列存放路径:\Results\03_Annotation\miRNA

图片12.png


看到这里各位可能已经发现了,无论是哪一种RNA,似乎所有的序列文件都是以.fasta或.fa为后缀的,这是什么格式呢?我们应该用什么软件打开呢?

在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式,可用文本编辑软件打开,如UltraEdit 、EditPlus等软件,系统自带的记事本(txt)工具也可以。然后利用搜索功能查找序列ID,就可以轻松找到对应的序列啦!


图片13.png

Ediplus搜索界面


图片14.png

记事本搜索界面