请教，关于Gene Ontology中的多重比较问题。

wshoper

GO注释在生物领域的应用越来越广泛，但是在做统计时却非常难。

例如要寻找一批基因中的over－represented基因或者under－represented基因（就是某些功能的基因特别的多或者少），比较了几千次，但是却不能做多重比较的校正，因为他们之间是有联系的，并不独立，总是觉得会有好多错误在里面，或者估计不出FDR来。

我是学生物的，统计很差，只知道有benjamin correction，不知道有没有其他不需要假设各个比较间独立的校正方法呢？bootstrap行吗？请各位大侠不吝赐教。

wshoper

还是大致介绍一下Gene Ontology,以便非生物领域的统计高手能够了解的多一点。

Gene Ontology（GO）是一种对基因功能进行分类的体系，它的结构是这样的:

GO--|---molecular funtion---|

| |-MF1

| |-MF2-|

| | |-MF2a

| | |-MF2b

| |-MF3

|

|---biological process---|

| |-BP1

| |-BP2-|

| | |-BP2a

| | |-BP2b

| |-BP3

其中，MF2a很有可能与BP2a有关系。一个基因的注释很可能为：MF2a，MF3，Bp2a。

rtist

我很难理解为什么要找under-represented GO categories。我自己从来都用单边检验只看over-representation的。这种单边检验下多重比较问题上要难一些。

我倾向于认为benjamini & hochberg的方法仍然可以应用，但是storey & tibshrani的方法就很难用上了。benjamini & young的方法可以应用于任何dependency structure，但是效能很低。

wshoper

看来版主是同道啊，我能否给您聊一下？

digestive

http://david.abcc.ncifcrf.gov/

可以用这个网站上的GO分析，挺方便的。

可以上传背景的基因，在上面进行分析。

rtist

goeman有篇文章讲这个，还没发表，不过网上已经可以下载了，控制FWER的。

biomedStat

Multiple Testing Procedures and Applications to Genomics; springer 2007

关于多重比较，这本书好像不错，下面的两个论坛好像有，只是又要权限。希望有人能够借过来，生物医学好多方面要用到这方面的知识。

http://cache.baidu.com/c?word=multiple%2Ctesting%2Cprocedures%2Cand%2Capplications%2Cto%2Cgenomics&url=http%3A//www%2Epinggu%2Eorg/bbs/Archive%5Findex%5F5%5F1%2Ehtml&p=9d70c11285cc42b90dbd9b7f11&user=baidu

http://cache.baidu.com/c?word=multiple%2Ctesting%2Cprocedures%2Cand%2Capplications%2Cto%2Cgenomics&url=http%3A//www%2Ebloomsky%2Ecom/%3Faction%2Dforumdisplay%2Dfid%2D567&p=8a65c54ad6c033f70be2972b5c4e&user=baidu

hydron

你可以试试这个网站：func.eva.mpg.de

rtist

这种软件太多了。。。鱼龙混杂。

谁有空应该写个comparative review之类的东西。