• R语言
  • 新人求教数据分析方向的发展

各位斑竹们好,我想从事数据分析工作,但是目前水平不够,尚在学习阶段,感觉这个方向很大、很深,有做过数据分析方面的能给我这个小白介绍一下情况吗?平时需要读些什么书籍?感激不尽!(俺普通本科毕业,只学过贾俊平的统计学一书及少许R语言) @谢老大 @cloud_wei

求求了,知道下吧?感激不尽。。。。。。[s:14][s:14]

第一次来论坛,给点鼓励啊?知道的说说白,男人又不会怀孕。。。[s:11]

前两天我在微博上发了句牢骚,可以参考一下:

[data]

要会技术(统计、机器学习、可视化、最优化),要懂市场(营销,产品,客户行为,渠道),要懂沟通(同事协同,上级汇报,对外呈现),工具要熟练(SQL、Excel、SAS、ppt),公司战略还要懂点,没准还要带团队,要懂管理……。OMG,我在说什么,不是MBA,是数据挖掘专家

[/data]

那个SAS是我违心地放上去的~~

回复 第7楼 的 刘思喆:看过你这个微博,这是个高度概括啊,清晰地目标是,该读哪些书籍?呵呵,谢谢指导。。

我觉得得从需求入手,楼主你收集50个数据分析岗位要求,

基本思路就清晰了.我个人感觉中国统计R语言这一方面,

高手都在这里了,另问可视化技术是哪种语言实现?

回复 第8楼 的 sxw:omg 同是新手,不过人家刘老大话都说到这个份上了,还能是几本书就能解决问题的吗? 上面的东西只能是 日常不断积累,统计学 R语言编程 机器算法 人工智能 数据挖掘 数据可视化 任何一个领域都有牛逼的不得了的经典书籍, 你光是把 论坛上推荐的一些 关于R的书看完就够你好好消化的了,里面有各种我上面提到的知识,做数据分析师,学习就是一辈子的事情。

回复 第9楼 的 linjuemin1911:学习一下ggplot2!

是啊,大量的学科,知识,技术,交叉,想弄明白很难啊,

再加上本科根本就没有数据分析这个专业,缺乏系统性

对,上面各位说的都非常正确。要看好自己以后的发展方向,比如数据分析师和算法工程师都是和数据打交道,但职位的要求就差异非常大。看看自己喜欢的JD挺好的。

当然不管做什么,持续性的学习是一定的,尤其是在数据领域。近几年,数据相关职位呈指数级增长态势,需求量越来越大。这主要原因就是因为企业积攒的数据量越来越多(数量,类型等),如果没有持续的学习是无法适应数据需求的剧烈变化的。

单单针对于数据分析的话,可以参看CRAN上的Task Views。上面有详细的分类,比如针对于社会学、计量经济、实验设计、空间统计、心理学、最优化、机器学习、生存分析等多,那把针对自己领域的所有包都看过一遍,懂得如何使用,那肯定就没问题了。当然我也知道,开始的时候会比较痛苦,毕竟太多的东西要看,而且可能只有英文的资料。但还好有统计之都这个学习的环境,比如在主站可以看到大家在研究些什么前沿的东西;在论坛可以讨论一些具体的技术细节;人大DMC还有数据挖掘小组定期会活动(对外开放,昨天我刚刚去讲过“客户流失挖掘预警R语言实战”);每年还会有R语言会议,各行各业的同行会齐聚一堂,探讨学术和行业应用。太多的学习机会了。

还有数据分析也不一定完全的局限于R语言这儿,其实SAS、SPSS还是有很多不错的案例(当然也都可以在R中实现),只是我个人觉得他们那边已经相对冷清很多。

还有上面提到的绘图,我也推荐ggplot2,它是根据 Grammar of Graphics这本书开发的包,此书是统计绘图的九阴真经,拜这个山头肯定是没错的[s:11]

回复 第13楼 的 刘思喆:刘老大,能否将你的那个“客户流失挖掘预警R语言实战”讲座课件发给我一份,

或者给个提纲之类的我拜读下,对这块比较有兴趣.我在南京,去参加讲座有点远啊

回复 第13楼 的 刘思喆:太到位了,受教了[s:11]

英文资料看着真心慢,决定先打印着看了。多谢了,这里氛围真好,哈哈

回复 第14楼 的 linjuemin1911:

我也想要“客户流失挖掘预警R语言实战”讲座课件... [s:11]

不好意思了,这次讲座我没准备资料,直接讲的代码[s:11]