Ｒ中如何实现去除重复数据？

ypchen · 2010年4月22日

回复第6楼的 ryusukekenji：

我还是不明白你想做什么你到底想实现什么效果可以赐教吗？

512002855 · 2014年8月7日

回复第3楼的谢益辉：

是不是现在的unique可以对数据框等去重了？

dim(iris)

dim(unique(iris))

我试了试，貌似可以。

yanlinlin82 · 2014年8月7日

回复第8楼的 512002855：

<br />
methods("unique")<br />

</p>

lkifish · 2015年5月30日

若source中1、2列数据完全相同则删除此行，代码实现：
index1<-duplicated(source[,1])
index2=duplicated(source[,2])
index=index1 & index2
source2=source[!index,]

colorado · 2015年5月31日

results<-source[!duplicated(source[,c(col_name1,col_name2,...)]),]

scfeng · 2015年6月8日

使用unique函数去除数据框中完全重复观测行，试过可以用。去除指定列重复的还没试

wa2003 · 2015年6月12日

[未知用户]

用unique函数就可以去重，包括行重复和列重复

chaoyuan_101 · 2018年6月11日

lkifish 这个方法不行啊，我试了一下。当两列数据有a，b和b，a时，做索引，两个都是false，怎么能去重呢？如果是如下的这种例子怎么弄呢？
first last
1 q e
2 a b
3 o e
4 b a
5 c h
6 x x

ryo · 2018年6月11日

ryusukekenji，在下@ryusukekenji旧帐户多年前就已没用了。?

zhouwei · 2020年5月23日

colorado Hello. 麻烦问一下你这个代码里，两列指定数据相同的情况下，其他列信息不同，那么默认被删除的是哪些行？

Liechi · 2020年5月23日

zhouwei 查看 fromLast。

a <- c(1, 2, 2, 4, 4)
b <- c("a", "b", "c", "d", "e")
df <- data.frame(a = a, b = b)
df[duplicated(df$a, fromLast = F), ]
df[duplicated(df$a, fromLast = T), ]

ryo · 2020年5月25日

dplyr::distinct()会比较好用