我是R初学者,看完了《R in action》,现在在看《机器学习:实用案例解析》第三章的时候碰到一个代码问题,这是关于垃圾邮件识别和分类的,代码如下:
#1、设置垃圾邮件路径变量
spam.path <- "data/spam/"
#2、垃圾邮箱文件名字符串向量
spam.docs <- dir(spam.path)
#3、打开垃圾邮件文件夹中的文件,返回文本
get.msg <- function(path)
{
con <- file(path, open = "rt", encoding = "latin1")
text <- readLines(con)
msg <- text[seq(which(text == "")[1] + 1, length(text), 1)]
close(con)
return(paste(msg, collapse = "\n"))
}
#4、获取垃圾邮件的文本向量
all.spam <- sapply(spam.docs,
function(p)get.msg(paste(spam.path,"/",p,sep="")))
在执行最后一步的时候,报出bug:
错误于seq.default(which(text == "")[1] + 1, length(text), 1) :
seq(.)里的(to - from)/by 有错
此外: Warning messages:
1: In readLines(con) :
输入链结'data/spam//00006.5ab5620d3d7c6c0db76234556a16f6c1'内的输入不对
2: In readLines(con) :
输入链结'data/spam//00009.027bf6e0b0c4ab34db3ce0ea4bf2edab'内的输入不对
求各位R专家大神帮帮我啊,万分感谢,我一个人自学的,身边无人可请教,