数据科学家是“现代五项全能选手”,不仅擅长编程、抓数据,还懂统计,会建模,能结合行业问题,展示炫目的可视化结果。
这种活一般人干不了,不是说使用的方法多么高级,其实方法大家都会,但是关键是先验数据平常人是接触不到的,通常各个竞选团队都有自己的内调,而我们看市面上的民调都是有倾向性的,这样有些关键数据就有被噪音污染的可能,而自己的内调通常就比较客观。
台湾的选举就是比较现实的案例。
我觉得统计学家!=数据科学家
你链了三个文本挖掘的...为啥还链我的吐槽文...
[未知用户] 吐槽有理啊,我很欣赏。你的文章太多了,我翻了半天,放弃了……还是思喆的文章最好翻,放眼望去轻松挑两篇。

你要是不介意,我可以链上你的白菜菌菇羊肉汤,除了楼上肖凯兄说的五项全能,我觉得数据科学家也得像你一样会生活,而不是死板的码农家或公式家:)
文理兼修。既能看问题,也能解决问题。
统计(数据挖掘)能解决实际问题,这才是它吸引我的地方。各种分布,统计显著性检测,就留下给老学究自己玩吧。神奇的贝叶斯,统计学习才是当今数据科学家的神器!
[未知用户] 写的多也是错....不过确实我现在翻我自己的文章都得用google reader的搜索了...
[未知用户] 当然不是错,只是挑起文章太费事了,所以没继续挑下去。隐约记得我在某篇日志下回复说你有小轩哥的风格了,好不容易才找到是R会议总结那篇。
在我心目中,Amazon西雅图总部的TuKang应该是数据科学家,益辉应该见过他。
[未知用户] 嗯,还是当事人会找,我当时想的正是这篇。我记得跟R会议有关,扒了好半天,还是扒错了。
[未知用户] 嘿,你们俩怎么认识的……我今年暑假才见他,不过我后来发现他很早以前就在我博客中留过言。世界真小。
[未知用户] 也是搜到我blog认识的,曾经帮我内推过。
10月的HBR也有一篇专题是讲数据科学家的,里面提到了一点让我印象深刻:“如果候选人不会编程,别浪费时间了,赶紧面试下一个吧”
[未知用户] 这个你直接在落园的搜索栏搜呀...“文本聚类”一搜就出来了
"半夜三点把你叫醒你都能三秒内背出贝叶斯定理,但让你把贝叶斯统计用到总统竞选上,可能就没多少人做得了这事情了。"
这你的去考古一下这里:http://blog.cos.name/taoshi/?p=1733
老祖师1962年就在NBC上做过了。当年哪有这么多民调数据来用啊。
50年后大家居然还在追捧Nate。
"数据科学家应该是像精算师一样的综合人才,他并不应该只是一门技术的好手" 精算师这专了又专的专业人才何时成了综合人才了?益辉你来解释一下。

[未知用户] 我觉得往后很难真的有“专了又专”的专业人才了,所有专业都在向专业和综合方向并进。即使就是计算风险这一件事,随着时间推移也在不断纳入新的知识和工具。数学、统计、概率、经济金融、计算机等等……