回复 第2楼 的 doctorjxd:
doctorjxd老师,我想请教下,如果先撇开正则表达式这个难题,
就是抓取网页数据通常用RCurl和XML这两个包,简单的情况可以直接
用R自带的download.file命令。有些时候可能只要一个简单的函数就可以
搞定,比如直接用download.file。而有的时候则需要RCurl和XML两个包
里面函数的组合,比如
require(RCurl)
require(XML)
url = 'http://www.chinamoney.com.cn/fe-c/interestRateSwapCurve3MHistoryAction.do?bigthType=FR007'
doc = getURL(url)
txt = htmlParse(doc, asText = TRUE)
tab = readHTMLTable(txt, which = 6, header = TRUE)
或者下面的帖子
http://cos.name/cn/topic/107477
这个有无简单的规则可以区分?
如果知道了下载某个数据需要用到哪些命令,我们再看命令的帮助,就简单些。
ps:上述问题可能太泛了,或者太难回答,我只是很想了解部分,谢谢了。