大家好!
统计之都是一个高手云集的地方,而我则是刚刚步入统计学殿堂的菜鸟。
我想在这里发起一个统计学和R语言的团队学习,如果有人也跟我一样刚刚起步,欢迎加入到一块来吧 :-)
这个团队学习的目的是打下统计学和R语言的基础,并且能自主开展更深入的数据分析。
总体计划如下:
1. 统计学基础。8月 ~ 10月
2. R语言基础。 8月~ 10月
3. 完成以上两项后做一两个小项目。初步的设想是招聘趋势分析,从招聘网站抓取招聘信息,用R语言对职位要求进行自然语义分析。有更好的想法请大家提议。
团队学习的方法:
1. 关于教材。每个人视自己的喜好选择教材,不拘一格。中文英文的都可以,毕竟主题和原理都是相通的。
2 . 每个人自行学习主要概念、原理,自行挑选习题练习。不懂的地方帖上来共同讨论。
3. 学习进度: 每周1~2个章节,用3个月的时间完成。每个人可以自行掌握进度。
加入方法:
1. 从现在起,感兴趣的朋友即可跟帖报表加入。
2. 8月1日团队学习正式开始后,也欢迎随时加入。
以上是我的一些设想,欢迎大家拍砖 ^_^
教材:我选用的教材是《统计学——基本概念和方法》(吴喜之翻译), 《Data Mining with R - Learning by Case Studies》
《统计学——基本概念和方法》有14个章节:
1. 统计学:随机性和规律性
2. 数据的收集
3. 数据的描述:图和表
4. 数据的描述:计算汇总统计量
5. 概率
6. 作出结论:估计
7. 作出结论:假设检验
8. 变量间的关系
9. 两个分类变量的X2分析
10. 两个数值型变量的回归分析和相关分析
11. ANOVA:一个分类变量和一个数量变量的方差分析
12. 两个顺序变量的秩方法
13. 多元分析
14. 日常生活中的统计
《Data Mining with R - Learning by Case Studies》有5个章节:
1. A Short Introduction to R
2. Predicting Algae Blooms
3. Predicting Stock Market Returns
4. Detecting Fraudulent Transactions
5. Classifying Microarray Samples