colinisstudent
[quote]引用第5楼ypchen于2006-05-31 13:10发表的“”:
他的意思可能是说 “现在处理大量数据已经不是什么难事了,为什么还要抽样” 看了前面几个回贴就知道了 并不仅仅因为数据量大才要用抽样来减少数据量[/quote]
楼主的帖子说的是另一些情况,随着计算机的普及,很多数据的收集和分析不需要再用单纯的手工记录和计算了,就像大型商店里面,每一笔业务都有计算机来存储和分析,不需要像以前那样,由于数据全部留在巨厚无比的帐本中,领导只能通过抽查几天的帐目然后凭经验来分析业务的状况
amzon007
呵呵,抽样的方法是不可能消失的,最简单的例子,对于破坏性的试验/实验,必须用抽样的方法,例如一种新车上市前,总要做碰撞试验,总不能把每辆新车都在墙上撞一次吧?再如乳制品质量检查,能把超市里的所有袋装奶都打开吗?
micro@
Statistics itself is the science of analyzing incomplete data. The data will always be incomplete in real world, i.e., we can never know everything about he universe.
colinisstudent
[quote]引用第9楼micro@于2006-06-24 01:31发表的“”:
Statistics itself is the science of analyzing incomplete data. The data will always be incomplete in real world, i.e., we can never know everything about he universe.[/quote]
所以说我觉得学统计的最大收益就在于心平气和的接受每一件发生的事,无论多么难以置信。因为信息是不足的,我们所了解的是有限的:)
徐启元
Right!!
abel
[quote]引用第0楼徐启元于2006-05-29 22:48发表的“未来抽样还会是一种需要么?”:
现在的数据库技术越来越发达,数据的收集终端也越来越成熟,收集的数据也越来越多。以前是因为没有电子技术,数据收集传送很困难,所以需要用抽样技术尽可能的节省人力物力,而现在或者以后大可以不需要进行抽样了,直接所有的数据都导入电脑,成本那么低,什么都可以交给程序去做。。。。那么抽样会朝什么方向发展的呢?会在什么领域找到新的应用呢?[/quote]
抽样还是应该广泛存在的,当数据收集终端可以收集到所有数据的时候,这些数据也都是正确无误的时候,还是需要抽样。
如果你拿到一个以G为单位的数据的时候,我想你单纯依赖计算机硬件或者软件本身提高效率的时候,尤其当你还要做的是一个相对复杂的模型的时候,这个时候你应该使用抽样,这是明智的做法。
在data ming中,抽样也是必不可少的前期工具之一,永远不要认为硬件或者软件本身可以彻底提高效率,从原理、结构、算法上寻求突破,永远是需要的工作,有时候是最关键最重要的工作。
hcq930
楼上的剖析的很深刻啊
yihui
工作的经验之谈
知秋一叶
个人认为其实抽样并不是为了节省成本,而是从大量的样本中找出符合自己研究所需的数据进行处理,就像作市场调查,并不是要所有的数据信息 而是符合研究方案所要求的信息
colinisstudent
[quote]引用第15楼知秋一叶于2006-08-01 11:39发表的“”:
个人认为其实抽样并不是为了节省成本,而是从大量的样本中找出符合自己研究所需的数据进行处理,就像作市场调查,并不是要所有的数据信息 而是符合研究方案所要求的信息[/quote]
但是完全了解整体总是一种很大的诱惑阿
20051910213
经典之谈