camelbbs

  •  
  • 2016年7月18日
  • 注册于 2009年4月13日
  • 我有两组数据,一组有384个,一组有1006个,平均值分别是214和255,方差分别是31600和53665,标准差分别是177和231,用t.test,双尾检验得到pvalue<0.05,不知道结果是不是可信的?
  • 我有4个样本,

    	a	b
    1	45%	55%
    2	53%	47%
    

    我想表现出两组a b之间的差别,第一组a<b,第二组a>b

    但是我如果直接在excel里做图的话,因为它们都接近50%,差异不是太明显,用什么作图方法能否把这个差异更明显地表现出来。非常感谢!

  • ANCOVA predicting r values for miRNA – host gene co-expression values (r) as a function of whether they are conserved (dashed regression line, open squares) or non-conserved (solid regression line, closed circles), controlling for abundance of the miRNA (logged). In all cases a prior test was run to check that the interaction term between the predictor variables was not significant as such an interaction renders an ANCOVA invalid. In all cases the interaction was non-significant. The P value indicates the significance of the hypothesis that the conserved genes have a higher r than non-conserved ones. In all instances it is significant. Data is the same as employed for Table 3. The order of sample sets for the Supplementary Figures is leukemia set (Fig. S1), myeloma set (Fig. S2), lymphoblastoid cell set (Fig. S3), breast cancer set (Fig. S4), and prostate set (Fig. S5).

    http://postimg.org/image/wj3o7vqsb/

  • 回复 第7楼 的 Wenbao_Yu:

    能不能帮我看下我的两组数是不是正态分布的

  • 回复 第3楼 的 youngtf: 请问R里面怎么看这两组数是不是正态分布的呢

    是不是用nortest包的pearson.test()?

  • a=c(0.021822106,0,0,0,0,0)

    b=c(5.296746475,1.186882639,1.695367802,1.065084839,1.609382065,1.635489571)

    cor.test(a,b)

    p-value = 0.0002642

    cor = 0.986698

    a基本上都是0, 这样的两组值算出来的correlation有意义吗, 能不能说明它们是正相关的呢?

    是不是a至少有3个以上不是0才行

    在计算correlation中,0 是不是和缺失值NA有区别

  • 一个老问题再拿出来问一下

    因为最近想把单样本,多样本比较整理一下,关于这个问题,想再请教一下各位

    我有一列基因在两个样本的表达量:

    <br />
    Gene	S1	S2<br />
    ART4	4.92143	2.89385<br />
    AZGP1	3.87462	3.86413<br />
    C20orf103	3.38678	3.451<br />
    C3	3.85766	3.66852<br />
    C7orf16	4.01758	4.49015<br />
    CDH5	6.68535	3.90784<br />
    CPM	3.57492	4.26991<br />
    CYP4X1	3.45229	3.59845<br />
    DDX3Y	7.3952	7.60647<br />
    EDNRB	6.1241	3.27362<br />
    EIF1AY	8.79199	8.71892<br />
    ELTD1	6.90271	4.9844<br />
    GABRA2	4.28023	3.57325<br />
    GABRP	6.74015	4.95259<br />
    GDF3	3.1609	3.38629<br />
    GLIPR1	5.21847	3.50253<br />
    GPR50	3.93796	3.66198<br />
    HIST1H2BB	4.10468	4.1237<br />
    HPSE	3.67252	3.93885</p>
    <p>
    </p>

    我想找出哪些基因在S1和S2之间是有显著差异的

    t-test 好像只能给出两组数总的pvalue, 如果我想得到每个基因在s1和s2之间的pvalue, 应该用什么test

    如果s1 和s2 有重复,我知道怎么做,但是对于这种没有重复的两个样本比较,除了找fold-change, 统计学上还有什么合适的test吗。。。

    Thanks a lot!

  • 回复 第4楼 的 SPSS17:

    thanks a lot!!

    But can I get which two groups are significantly different.

  • 回复 第2楼 的 SPSS17: 谢谢 They are unpaired.

    但是我做了之后还是有点问题

    kruskal.test只能给出:

    Kruskal-Wallis chi-squared = 22.5146, df = 3, p-value = 5.097e-05

    我想得到的是这几组数里面有显著差异的值,这个有办法么

  • x

    2.06

    1.08

    1.94

    1.32

    0.75

    0.18

    0.72

    0.22

    0.34

    y

    1.71

    2.73

    2.29

    1.71

    2.40

    0.45

    0.58

    0.35

    0.63

    z

    2.47

    1.75

    2.44

    2.50

    4.17

    2.09

    1.77

    1.77

    b

    0.00

    0.00

    0.01

    0.01

    0.01

    0.20

    0.30

    0.10

    请问我有4组数,要比较它们之间有显著差异的数,用什么方法可以做

  • 我不需要模拟得非常精确

    我只要得到第一张图中的红蓝波,和第二张图中的点就行了,不知道R怎么实现

    第一张图中的数据在这里

  • 谢谢!

    [attachment=233502,1906] [attachment=233502,1907]

  • 请问linux下如何更改R包安装路径:错误如下

    'limma' cannot be updated, installed directory '/usr/local/bin/lib64/R/library'

    not writeable

    另外我在运行HCL聚类的时候,出现这个错误

    > hr <- hclust(as.dist(1-cor(t(mydatascale), method="pearson")), method="complete")

    Error in hclust(as.dist(1 - cor(t(mydatascale), method = "pearson")), :

    NA/NaN/Inf in foreign function call (arg 11)

    请高手帮我解答一下,谢谢

  • 向量大小在2000-7000,用BH可以不

    因为我上篇文章用的是bonferroni,似乎太严格了点,BH貌似要宽松一些

  • 回复 第2楼 的 谢益辉:谢谢啊

    我也发现排序原来是多余的

    b[b[,5]<0.001,]我第一次用

    另外b[,5]<-p.adjust(b[,4],method="BH")用不了

    出错信息: subscript out of bound

    只好用cbind

  • 我有个4列的文档如下:

    <br />
    R-185	SIX1	-0.355520013549699	0.053849818409879<br />
    R-138	EGFL7	0.0504840263444323	0.79106202307383<br />
    R-10A	NFKBIA	-0.0573663730902907	0.763334156197386<br />
    


    第三列是correlation的r 值, 第4列是p-value, 想对第4列做BH校正,请问我写的这个代码有问题没</p>

    <br />
    rm(list=ls()) ###清空内存中的变量</p>
    <p>a<-read.csv("test.txt",sep="\t",header=F,quote="")  ###读文件到矩阵中去</p>
    <p>b<-a[order(a[,4],decreasing=TRUE),]  ###按第4列,从大到小排序,因为BH本身要排序,这里排序是为了保证前几列和后面的对应</p>
    <p>b[,5]<-p.adjust(b[,4],method="BH")  ###做BH校正,将校正后的值加到第五列</p>
    <p>c<-b[which(b[,5]<0.001),]  ###按第5列取值</p>
    <p>write.table(c,"zz.txt",sep="\t",col.names=F,row.names=F,quote=F)<br />
    
    </p>
  • 请问类似这样一个matrix,要取第4列小于0.05的行,应该怎么写

    <br />
    hsa-let-7a--MBTD1	0.528239197	2.41E-05<br />
    hsa-let-7a--APOBEC1	0.507869409	5.51E-05<br />
    hsa-let-7a--PAPOLA	0.470451884	0.000221774<br />
    hsa-let-7a--NF2	0.469280186	0.000231065<br />
    hsa-let-7a--SLC17A5	0.454597978	0.000381713<br />
    hsa-let-7a--THOC2	0.447714054	0.000479322<br />
    hsa-let-7a--SMG7	0.444972282	0.000524129<br />
    
    </p>