RT。用下面的程序试了一下发现只要有
标签的都抓不到,但是看网页的时候发现代码也在<p>中,想请教下这个是为什么啊?怎么才能抓完整的回复呢?多谢啦~~<br />
[code]<br />
library(XML)<br />
web = 'http://cos.name/cn/topic/108454#post-238863'<br />
text = htmlParse(web, encoding = 'utf-8')<br />
webNode = getNodeSet(text, "//p")<br />
webData = sapply(webNode, xmlValue)<br />
dataTrim = webData[-c(1:4, 29:31)]<br />
result = matrix(dataTrim, nc = 3, byrow = T)<br />
</p>