各位大侠:

我已经获得了我感兴趣的蛋白的GO号,如下所示:

ensembl_peptide_id go_id

1 ENSP00000023939 GO:0008150

2 ENSP00000023939 GO:0005575

3 ENSP00000023939 GO:0003674

4 ENSP00000201031 GO:0006357

5 ENSP00000201031 GO:0000122

6 ENSP00000201031 GO:0045944

1、请问如何绘制GO分类图?

2、如何处理上述数据获得比较详细的亚细胞定位信息?

谢谢~

回复 第1楼 的 wuxian2r:

如果已经得到了GO ids,绘图可以用:

<br />
goids<-c('GO:0008150',<br />
'GO:0005575',<br />
'GO:0003674',<br />
'GO:0006357',<br />
'GO:0000122',<br />
'GO:0045944')</p>
<p>library(RamiGO)  ####RamiGO 包</p>
<p>color <- c("lightblue","red","yellow","green","pink","gray")<br />
p <- getAmigoTree(goIDs=goids, color=color, filename="example", picType="png", saveResult=TRUE)</p>
<p>
</p>

如果有ensembl_peptide_id,得到GO ids有很多办法,比如可以用biomaRt包得到GO ids。

回复 第2楼 的 luzifer:

谢谢!

这个图很漂亮。

但是用什么包可以得到下面这种类似的结果:

[attachment=233678,1918]

回复 第3楼 的 wuxian2r:

这个要分成两部分:

(1) 得到数据

首先你要确定你的GOids要map到GO的哪个level,一般来说map到BP/MF/CC的直接children就可以了。

比如你的:GO:0000122,一直往上map (找它的parents,再parents...,一直到BP/MF/CC的直接children的level),它属于如下四个GOterms (MF的直接child)

metabolic process

cellular process

negative regulation of biological process

regulation of biological process

如此,把你的所有的GO ids都map到到BP/MF/CC的直接children

(2) 画图

从1) 你可以得到数据,类似如下:

[,1] [,2]

catalytic activity 0.0 0.2

binding 0.4 0.6

enzyme regulator activity 0.0 0.2

membrane 0.4 0.2

cell junction 0.0 0.2

membrane-enclosed lumen 0.2 0.2

macromolecular complex 0.2 0.4

organelle 0.4 0.6

organelle part 0.4 0.2

membrane part 0.4 0.2

cell part 0.4 0.6

metabolic process 0.2 0.4

immune system process 0.2 0.2

viral reproduction 0.0 0.2

cellular process 0.2 0.6

death 0.2 0.2

biological adhesion 0.0 0.2

signaling 0.0 0.4

developmental process 0.2 0.2

positive regulation of biological process 0.2 0.2

negative regulation of biological process 0.2 0.2

regulation of biological process 0.2 0.4

response to stimulus 0.2 0.4

localization 0.2 0.2

establishment of localization 0.2 0.0

multi-organism process 0.2 0.2

biological regulation 0.2 0.4

cellular component organization or biogenesis 0.2 0.2

NotFound 0.4 0.4

这个数据是两个GO lists得到的结果。

然后画图就行了。

图的话除了右边的坐标轴不太好搞定(注意是两套ticks),其与的好做的。

回复 第4楼 的 luzifer:

我得到了GO号之后如何用R map到BP/MF/CC的直接children,并获得相应GO的描述信息如membrane part 来着?

谢谢~

回复 第5楼 的 wuxian2r:

可以利用 Gotools package.

topGO package 等等...

1 个月 后

你可以用clusterProfiler包画。

http://ygc.name/2012/05/07/clusterprofiler-package-comparing-biological-themes-gene-clusters/

6 个月 后