首页> 关于我们 >新闻中心>技术分享>新闻详情

图说蛋白组合集—再也不用担心看不懂结果啦!

2020-07-06

一、蛋白鉴定与定量

图片1.png

(重要列说明,部分列隐藏)

A列:蛋白的登陆号。

B列:蛋白的全称。

C-H列:每个样本中蛋白相对定量的值。


二、组间差异分析


蛋白组主要目的是寻找不同比较组之间的差异蛋白。差异分析一般涉及两个标准,差异倍数 fold change 和 p 值,一般认为上调或者下调在2或1.5倍以上,且同时p值小于0.05,才认为该蛋白在两个比较组间发生了显著的差异变化。按照这一标准筛选出来的差异蛋白即为蛋白组找到的显著差异蛋白集。

当差异蛋白的个数太多时,可以考虑收缩筛选标准,比如调大差异倍数,调小p值范围,若差异基因个数仍然较多,可以调整为比p值更严格的 P adj 或者 FDR 来进行筛选;当差异蛋白的个数太少时,可以考虑放宽筛选标准,比如调小差异倍数。


1、组间差异蛋白鉴定

图片2.png

(重要列说明,部分列隐藏)

绿色底纹标记的是下调蛋白,上调蛋白会用红色底纹标示

B-D列:蛋白在GO数据库的三大功能类中的编号。

E列:蛋白在KEGG数据库中的编号。

G-I列:蛋白质氨基酸数目、分子量、等电点。

J列:基于相对定量结果得出的蛋白组间差异倍数。

K列:组间差异鉴定事件对应的显著性P值。



2、组间差异蛋白火山图

图片3.png

差异蛋白火山图

①、红色的点为上调蛋白,蓝色的点为下调蛋白,灰色点为非显著差异蛋白。

②、横坐标为差异倍数,取log2是为了作图的对称性。

②、纵坐标为P值,取-log10(P value)是为了作图的美观性,横向直线对应的值为1.3,对应P = 0.05。


3、组间差异蛋白聚类热图


一般热图都呈现的是双向聚类的结果,即横坐标对样本聚类,纵坐标对蛋白进行聚类,表达模式相近的蛋白或者样本会聚到一起。

图片4.png

①、热图只能做横向比较,即比较同一个蛋白在不同样本中表达变化,纵向没有可比性,因为生物体内不同蛋白丰度本身就有差异。根据图例可知,颜色越红表达量越高,颜色越蓝表达量越低。

②、横坐标为样本名称,纵坐标为蛋白名称。


三、功能富集分析


在进行蛋白质组学研究时,我们的研究对象是细胞、组织或生物体中全部蛋白质的集合,了解哪一些功能或生物学途径受到生物学处理的显著影响是首要任务。因此,需要从更为系统和概括的层次和角度,对所研究的蛋白及其功能进行概括和分析。GO与KEGG为基本的基因或蛋白功能富集分析,两种分析的大部分结果图展示形式相同,为避免重复,下面的分析图片中,相同图形仅在GO或者KEGG部分展示。

功能富集结果挖掘建议:首先结合研究方向与表型等因素考虑,在显著富集的通路中主观选择关键通路查看。如果没有明确目标,可以根据显著性排序、富集因子大小、富集蛋白数目多少等方面筛选关键通路,再进一步查看通路中富集的蛋白。

图片5.png

1、GO功能富集分析

GO(基因本体论联合会建立的数据库 http://geneontology.org/,Gene Ontology)是一个国际标准化的基因功能分类体系,提供了一套动态更新的标准词汇表来全面描述生物体中基因和基因产物的属性。GO 涵盖三个方面,分别描述基因的分子功能(Molecular Function)、细胞的组件作用(Cellular Component)、参与的生物学过程(Biological Process)。GO 的基本单元是 Term,每个 Term 有一个唯一的标示符(由 “GO:” 加上 7个数字组成,例如 GO:0072669)。

图片6.png

①、用不同的颜色代表3个不同的GO功能大类,横坐标为GO term名称。

②、纵坐标为term上富集的蛋白数目以及占分析时提交总蛋白数目的百分比。

图片7.png

图片8.png


2、KEGG功能富集分析

图片9.png

气泡图也是功能富集分析中的常见展示形式。选择显著性排名前10或者20的通路做图形展示。

图片10.png

①、左侧纵坐标为通路名称。右上方图例为FDR值的示意,颜色越红越显著。右下方图例的圆点越大表示该通路上富集的基因数目越多。

②、横坐标为富集因子。为该通路上富集的差异蛋白占分析时该通路上提交所有蛋白个数的百分比。


每个KEGG通路都对应了一张详细的代谢通路图,KEGG通路是跨物种的,分析时会结合实际样本结果对该通路图进行差异蛋白标注。该图查看方式:在KEGG结果表格中打开网页链接即可查看对应通路的通路图,待图形缓冲完成,可以鼠标右击另存为保存。差异蛋白的标注方式会有多种形式,如遇到有疑问的可就具体问题咨询我们。

图片11.png

图中以红色框表示参与该通路的所有差异蛋白质,绿色框线表示本物种中的蛋白(KEGG是跨物种的数据库)。小圆圈表示小分子代谢物,大圆框代表其他通路。


四、蛋白互作(PPI)分析


在生物体中,蛋白质并不是独立存在的,其功能的行使必须借助于其他蛋白质的调节和介导。这种调节或介导作用的实现首先要求蛋白质之间有结合作用或相互作用。对蛋白质之间的相互作用及相互作用形成的网络进行研究,对于揭示蛋白质的功能具有重要意义。

PPI是一般是基于STRING数据库来做的。它(http://string-db.org/)是一个搜寻已知的和基于预测的蛋白质之间相互作用的系统。其中人、小鼠、大鼠、拟南芥等,可获得的互作信息已较为完善,PPI的结果信息多,互作关系准确。但是对于参考基因组蛋白注释不佳,尤其是无考考基因组的物种,我们需要通过寻找数据库中的近源蛋白来做PPI,如果能对应到的近源蛋白不多,那么PPI互作网络中的蛋白则较少,且互作关系的准确性也仅供参考。

图片12.png


每个比较组对应一张PPI图,不同的圆圈代表不同的蛋白,中间有连线表明可能存在互作关系。