2018-07-03
一般做完转录组的基本分析,下一步肯定是对分析数据进行挖掘,后期会经常出现各种各样的聚类图需求,今天我们就来详解一种自己DIY聚类图的方法,快把技能get起来!
首先来看准备清单:
1、两款分析软件的安装
Cluster 3.0 http://bonsai.hgc.jp/~mdehoon/software/cluster/software.htm
TreeView http://jtreeview.sourceforge.net
样品的差异基因表达量通过 Cluster 3.0 进行基因间和样品间的聚类分析,得到的聚类结果通过 TreeView 绘制出来。
2、 输入文件整理
首先对expression.xlsx表格进行整理,原表示例如下:
将表格只保留gene-id 和样本的rpkm列,并将CK1:rpkm改为只有样品名CK1,示例如下:
从修改好的表格中筛选需要进行聚类的目的基因,比如挑选9个基因,得到最终表格如下:
新建一个txt文本文件,将目的表格中的数据粘贴到txt中,比如命名为1.txt,示例如下:
这时输入文件就整理好啦,下面就进入正经的分析步骤,这时候小本本可以拿出来了:
分析步骤:
Cluster分析
将1.txt文件保存后,导入下载的 Cluster 3.0 软件中,可以看到中间有个横条:
第一个Filter Data点击后的内容,不做任何选择,第二个adjust data更改如下,选完后,点击apply键。
第三个是聚类的方法hierarchical,操作如下,选择后点击complete键:
这些操作完成后会形成3个文件:
┃ ├───1.cdt 聚类分析文件
┃ ├───1.gtr 聚类分析基因树文件
┃ └───1.atr 聚类分析样品树文件
cdt是用来用TreeView显示聚类树图的,其他文件都可以用文本或者写字板,或者表格等形式打开,一般比较大的打不开的文件,可以下载editplus软件来进行打开。
TreeView编辑图像
打开TreeView,点开file,open打开上一步生成的1.cdt
结果显示如下:
打开最上面工具条里的settings,选择Pixel settings,设置如下:
设置好后,点close,然后点开工具条中的Export, 选择save tree image,设置如下:
点击save之后会保存图片,结果展示如下,右侧是样本名,下方是基因名:
如果只展示样本名,再上一步export的设置中,如图所示,gene headers 中的gene -id不选择:
然后save结果就会只显示样品名:
最后点开Export,选择export Colorbar to image,设置如下:
点击save之后会出现Colorbar图片,整合图片后,即为聚类结果
心动不如行动,需要聚类图的你赶紧DIY起来吧!
文案:转录调控事业部