标题说的网站是Kaggle.com 。
最近我才发现这个网站,上面有非常多的数据,以及非常多的高手,他们的预测能力几乎能够达到一个数据的最好成绩。
我自己大概能到board的前30%~50%的水平,可能是因为自己只是使用单个模型而不是综合使用,不太理解其他参赛选手在论坛所说的"blend data"的具体含义……另外我对数据的预处理等各方面都没有经验也是原因之一。
不知道有没有同好愿意时不时对一些数据进行交流心得?Kaggle上面的论坛是英文的,而且不是很活跃,所以感觉交流起来还是有困难的:)
参与比赛的目的基本不是为了拿奖金,而是为了积累处理真实数据的经验,私以为这个方面的一些知识一定是需要靠经验积累而不是模型推导来获得的。