鱼蛋 有这么一个想法是之前参加全国*统计建模大赛的时候找数据费了好大的功夫,后来,发现有很多学统计的学生都在愁数据的问题。我们需要数据来实证方法,不见得一定是用来做大project才可以。数据越真实,我们对知识和方法的了解才越深入才是。 分享几个链接,但是要把那里的数据下下来可能需要费点功夫,希望大家在不影响自己的前提下,都可以分享一些真实有用的数据吧!分享的时候,可以把背景知识、试验设计、抽样方法和变量解释都附上,供大家学习参考用。 因为对R很有感情,所以就发在这板块上了,斑竹不要恼我……谢谢……R里面有很多经典的数据,大家把Rcommander打开直接就可以查看了。最直接的方法是把你已经attach的包的帮助打开,所有的data一目了然。 人地系统主题数据库 http://www.data.ac.cn/index.asp 国家统计局 http://www.stats.gov.cn/ Research and Innovative Technology Administration (RITA) • U.S. Department of Transportation (US DOT)(我很喜欢的一个数据库) http://www.bts.gov/ World Bank:Datahttp://web.worldbank.org/WBSITE/EXTERNAL/DATASTATISTICS/0,,menuPK:232599~pagePK:64133170~piPK:64133498~theSitePK:239419,00.html
lyxmoo 我开放提取股票交易市场的日线数据,真实有效。不过数据仅供学习者使用。 响应提供准确数据源的号召,提供一个股票市场的数据源程序代码。 针对通信达交易软件,下载所有历史数据,交易软件的数据下载到安装目录\vipdoc\sh\lday(上海) 和 vipdoc\sz\lday(深圳) 中,把这些文件导到linux主机里。 软件代码是linux下的(我是VC盲,不会提供M$Win的程序),在CPU arch 是小尾端的平台上测试过没有问题(Mac PPC 上有问题,但我不想解决它了)。 系统要求: linux - x86 或者 linux - mipsel 环境,gnu gcc/g++ 和 gfortran 开发环境。 安装方法: 先安装R, 2.8.2 以上的都可以使用。 先安装 zoo 和 xts 包(这是原TTR包需要的)。 再安装 R CMD INSTALL ./TTR_0.20-1_moore.tar.gz (这是我添加了 get_ttrc 版本的) 使用方法: get_ttrc(c("file name from vipdoc/sh/lday/file_name.day"), Integer_last_days_of_req,1) 这样就得来数据了。
lyxmoo 由于COS 论坛限制URL, 我放在这里了,看看能不能贴出来,内容一定要多. http://blogimg.chinaunix.net/blog/upfile2/091220214736.gz
lyxmoo [quote]引用第13楼鱼蛋于2009-12-23 22:17发表的 回 12楼(lyxmoo) 的帖子 : 您对怎样建立一个方便的平台有建议吗?? [/quote] 不知道你说的是什么样的平台。如果是指cos社区使用的web apps , 没有建议。
yihui 可以开一个版块用来处理数据需求,但我倾向于把数据本身单独放在一个子站中,而不要发在论坛上。可以做成像StatLib那样的一个网站。 你去http://download.cos.name看一下就知道,其实我们是早有想法的,只不过没人牵头做。