wshoper
GO注释在生物领域的应用越来越广泛,但是在做统计时却非常难。
例如要寻找一批基因中的over-represented基因或者under-represented基因(就是某些功能的基因特别的多或者少),比较了几千次,但是却不能做多重比较的校正,因为他们之间是有联系的,并不独立,总是觉得会有好多错误在里面,或者估计不出FDR来。
我是学生物的,统计很差,只知道有benjamin correction,不知道有没有其他不需要假设各个比较间独立的校正方法呢?bootstrap行吗?请各位大侠不吝赐教。
wshoper
还是大致介绍一下Gene Ontology,以便非生物领域的统计高手能够了解的多一点。
Gene Ontology(GO)是一种对基因功能进行分类的体系,它的结构是这样的:
GO--|---molecular funtion---|
| |-MF1
| |-MF2-|
| | |-MF2a
| | |-MF2b
| |-MF3
|
|---biological process---|
| |-BP1
| |-BP2-|
| | |-BP2a
| | |-BP2b
| |-BP3
其中,MF2a很有可能与BP2a有关系。一个基因的注释很可能为:MF2a,MF3,Bp2a。
rtist
我很难理解为什么要找under-represented GO categories。我自己从来都用单边检验只看over-representation的。这种单边检验下多重比较问题上要难一些。
我倾向于认为benjamini & hochberg的方法仍然可以应用,但是storey & tibshrani的方法就很难用上了。benjamini & young的方法可以应用于任何dependency structure,但是效能很低。
wshoper
看来版主是同道啊,我能否给您聊一下?
digestive
http://david.abcc.ncifcrf.gov/
可以用这个网站上的GO分析,挺方便的。
可以上传背景的基因,在上面进行分析。
rtist
goeman有篇文章讲这个,还没发表,不过网上已经可以下载了,控制FWER的。
biomedStat
hydron
你可以试试这个网站:func.eva.mpg.de
rtist
这种软件太多了。。。鱼龙混杂。
谁有空应该写个comparative review之类的东西。