请教数据整形

frankzhang21 · 2020年1月1日

结果貌似和我的不一样。

你的结果是

#>   name   merged
#> a    a 2015-300
#> b    b 2015-700

a应该是2016-400

dhfly · 2020年1月2日

dapengde 受教，拜谢！！

dhfly · 2020年1月2日

frankzhang21 拜谢您的帮助！！

zpmu · 2020年1月2日

借用上面的例子

library(tidyverse)

c1 <- c('a', 2015, 300)
c2 <- c('a', 2016, 400)
c3 <- c('b', 2015, 700)
c4 <- c('b', 2016, 600)
dt <- data.frame(rbind(c1, c2, c3, c4), stringsAsFactors = FALSE)
names(dt) <- c('name', 'date', 'amount')

new.dt <- dt %>%
    group_by(name) %>%
    filter(amount == max(amount)) %>%
    mutate(merged = paste(date, amount, sep = "-")) %>%
    ungroup()

dhfly · 2020年1月2日

zpmu 这个我能看懂。拜谢！！

dhfly · 2020年1月2日

dhfly 请教：继续这个例子，将其中一列拆分成2列怎么写？
例：将id列分为q列和w列，以

sep=“.”
ex=data.frame(id=c("100.a","002.b","003.c"),aumount=c(100,200,300))

用 separate(data = ex, col =id, into = c("q", "w"), sep = ".")报错是什么原因？

frankzhang21 · 2020年1月2日

dhfly

去掉sep = "."

separate(data = ex, col =id, into = c("q", "w")) 即可

如果你一定要手动指定，

separate(data = ex, col =id, into = c("q", "w"),sep="\\.")

报错是因为你传进去的sep会被当做一个正则表达式，.在正则表达式里match任何字符(except new line)。

默认的sep会match任何non-alphanumeric 的字符，绝大多数情况下使用默认的即可。

sep
Separator between columns.

If character, is interpreted as a regular expression. The default value is a regular expression that matches any sequence of non-alphanumeric values.

dhfly · 2020年1月2日

frankzhang21 非常感谢您的热情帮助，原来是这么回事，感觉自己不适合学语言。大白这里再谢！！

dapengde · 2020年1月2日

frankzhang21 已修改。谢谢指正。

chuxinyuan · 2020年1月2日

# 源数据
c1 <- c('a', 2015, 300)
c2 <- c('a', 2016, 400)
c3 <- c('b', 2015, 700)
c4 <- c('b', 2016, 600)
dt <- data.frame(rbind(c1, c2, c3, c4), stringsAsFactors = FALSE)
names(dt) <- c('name', 'date', 'amount')

library(dplyr)
library(tidyr)
dt %>% 
  group_by(name) %>% 
  filter(amount == max(amount)) %>% 
  unite("merged", date, amount, sep = "-") -> dt2
dt2

dhfly · 2020年1月2日

chuxinyuan 谢谢您的不吝赐教，拜谢！！

dapengde · 2020年1月2日

已收进 TNT 擂台赛。