• R语言
  • 原始数据打乱随机抽样的问题

原始数据格式为按行存储的二元组(n行2列的数据,每一行的2个数据均不相同),现在想固定第一列,将第二列打乱与第一列组合生成新的数据,但新的数据不能和原有数据重复(例如,原始数据为(A,B),则新数据中不能有(A,B)或(B,A)),且不能有某一行中两数据相同(如(A,A))。数据示例如下:

原始数据:

A X

B E

C B

D F

A E

G A

新生成的合理数据:

A F

B X

C E

D A

A B

G E

小数据量时候用excel随机排一下再调整一下就好了,但大数据量时(原始数据8000行)无法用excel,请问用R语言如何实现?谢谢

apply()
做重采样,在重采样前用
set.seed()
设置随机值以保证你今后还可以得到同样的一个随机采样集。

另外,在apply()里面用replace=FALSE设置数据没有回放。
</p>

回复 第2楼 的 peterduus:可否说的更具体一些?初学R,只大概知道apply是做循环的。

最关键的问题是,如何做到新的数据和原始数据【无重复】