maopao
有两列数据,一一对应的。我想看这两列数据的关系。因为有近60万条数据,请达人指点一下如何做才好。是应该用plot(x,y)函数吧
yihui
数据再怎么大量,作图方法不会变啊。只不过可能会比较慢,试试便知。
maopao
我不知道运行60万行的矩阵会不会出问题
难道把这60万行数据放在X,Y矩阵里?
yihui
x y向量。
不会出问题。60万不算太多。
cran
ggobi该是不错的选择
maopao
刚刚运行了,没问题。
没出现什么异常。R可以运行60w行的数据
谢谢各位
rtist
处理600k x 2的数据应该没问题,问题是可能会有严重的over-plotting。
ggobi对于visualize高维数据很好,但是我不知道他们是不是对over plotting有特殊处理。
有可能把低维的数据map回高维去,这样在高维空间中数据点就显得稀薄很多?
或者干脆在低维thinning data,然后画图;如果仅仅需要看两个变量之间的关系,这个应该足够了。
额外也可以把pch="."加上,这样一个点的面积很小,与其他点重合的机率也低。
R能处理多少数据,很多情况下取决于你的机器有多大内存以及你使用的什么操作系统/CPU;如果用64位系统并有足够内存的话,我想基本上不用担心R处理不了。