几个常用的数据管理函数
数据合并:
横向合并(添加变量),可以用merge()函数;纵向合并用rbind()函数,用rbind合并数据时要求数据的变量名必须完全一致,数据的变量名不一致时可以用reshape包里面的rbind.fill()函数。
排序:
sort(x, decreasing = FALSE) #常用于单个向量的排序
order(x, y,...) #可以借助order()函数对dataframe按照多个变量进行排序
数据转换:
factor(a) #将某向量转换成因子
cut(x, breaks) #将数值向量按照breaks的要求转换成因子向量
<br />
x <- data.frame(id=1:10,gender = sample(1:2, 10, replace = T), height=seq(1.65,1.80,length=10))<br />
y <- data.frame(id=1:8,weight=seq(60,95,length=8))<br />
z <- merge(x, y)<br />
z$bmi <- z$weight/z$height^2<br />
z$obesity <- cut(z$bmi,breaks=c(min(z$bmi),24,28,max(z$bmi)),include.lowest = TRUE, right = FALSE)<br />
z$gender <- factor(z$gender, labels = c("Male", "Female"))<br />
sort(z$bmi, decreasing = TRUE)<br />
z[order(z$gender, z$bmi),]<br />