fairy
前段时间参加了一个有关Clementine11.0的培训,2天时间,哗啦啦就讲完了
回来上头说要整理相关的东西给大家做培训于是开始做有关设置并作分析,发现老师做的基本上都是默认选项,实际中很多个性的设置,只能借助于英文帮助……
于是乎看了一周的英文帮助,呵呵,头晕脑胀~~
不知道有没有使用过这个产品的朋友,大家一起交流交流好不好?
我的msn:liuxiaohui307@163.com,或者也可以发我网易的这个邮箱?
yihui
对于数据挖掘来说,万万不要把重点放在软件上,一开始就从软件帮助学起必然是错误的方式,数据挖掘的理论和算法是挖掘的根基。不懂理论,也就无法把软件的参数、选项对应到理论方法中去,胡乱设置一番,做出来自己也不知道是什么。
2天时间能学到的东西可想而知——仅仅是SPSS公司在诓人挣钱而已。
你要跟头儿讲清楚,首先要提炼实际问题,切莫泛泛而学,没有用的,而且现在理论方法如此繁杂,你们作为应用的单位,恐怕更难跟上。数据挖掘最常做的事情就是预测和分析关联关系,在方法研究上尤其以前者为重。回去召集相关人员大家讨论讨论,做实务的时候究竟需要统计学的那些帮助以及现在拥有什么样的数据,而不要拍脑子动不动花上百万千万去买软件。
jstm_mm
[quote]引用第1楼谢益辉于2007-10-19 21:55发表的“”:
对于数据挖掘来说,万万不要把重点放在软件上,一开始就从软件帮助学起必然是错误的方式,数据挖掘的理论和算法是挖掘的根基。不懂理论,也就无法把软件的参数、选项对应到理论方法中去,胡乱设置一番,做出来自己也不知道是什么。
2天时间能学到的东西可想而知——仅仅是SPSS公司在诓人挣钱而已。.................[/quote]
::一开始就从软件帮助学起必然是错误的方式::
我不赞同这个观点。工欲善其事,必先利其器。如果你不懂软件,如何谈利用软件来做出自己想要的东西。根基 和思想可以在摸熟软件之后慢慢增加,而且还可以利用对软件的熟悉练习练习。
个人意见~
yihui
很好,“工欲善其事,必先利其器”,问题就在于,统计方法理论模型与软件孰先孰后:当然理论要先于软件。否则只能是胡乱摸索,"Garbage in, garbage out."
fairy
[quote]引用第1楼谢益辉于2007-10-19 21:55发表的“”:
对于数据挖掘来说,万万不要把重点放在软件上,一开始就从软件帮助学起必然是错误的方式,数据挖掘的理论和算法是挖掘的根基。不懂理论,也就无法把软件的参数、选项对应到理论方法中去,胡乱设置一番,做出来自己也不知道是什么。
2天时间能学到的东西可想而知——仅仅是SPSS公司在诓人挣钱而已。
你要跟头儿讲清楚,首先要提炼实际问题,切莫泛泛而学,没有用的,而且现在理论方法如此繁杂,你们作为应用的单位,恐怕更难跟上。数据挖掘最常做的事情就是预测和分析关联关系,在方法研究上尤其以前者为重。回去召集相关人员大家讨论讨论,做实务的时候究竟需要统计学的那些帮助以及现在拥有什么样的数据,而不要拍脑子动不动花上百万千万去买软件。[/quote]
呵呵,我是觉得原理很重要,因为以前已经看过有关关联规则和神经网络的东西了,加上统计学的一些基础,原理上其实不难想明白。至于算法方面,我倒是觉得作为一个应用这没有必要弄得特别清楚。现实中,常常不是模型选择的问题,而是选择一个模型之后如何修正如何优化的问题;而且知道原理,不知道对模型的有关修正等操作不能对应于软件的相应选项的话,不仅不能设置合适的参数,也不能理解分析的结果,更不用说使用模型去预测了。
知道算法,是可以通过编程等方法灵活的设置参数来建立合适的模型,但是处理海量的实施有更新的数据,一个个编程的话,效率是很低的。有现成的软件为什么不使用呢?而对于客户公司,因为种种原因,对软件的要求也各不一样。在咨询公司,掌握的工具越多市场也就越能够打开,选择性也越大。另一方面,假如能够选择大众化的专业软件,又为何弃之不用呢?
fairy
而且实际工作中数据理解和数据整合在整个分析过程中是最重要的~~