lei_zhang
现在我有某省的某个农贸市场的卖家进货数据,该农贸市场一共有200多个商家(主要是卖新鲜蔬菜或者肉类的),数据记录了从2013年到现在该农贸市场所有的卖家每天的进货信息。数据相关变量为:卖家名称,进货商品,进货数量,进货时间。我现在想要做的就是寻找不同农副产品销量之间的关联性,比如黄瓜的销售量是否和大蒜的销售量有关联性。前提是我们假设商家不存在囤货现象,商家进货的多少反映了其销量的多少。
这似乎是关联分析,但是应该如何度量两个农副产品销量之间的关联性,比如黄瓜进货增加时,大蒜的进货业增加,其趋势是相同的(用时间序列度量),同时在度量了两者的关联性之后,应该用哪种关联分析算法来解决该问题?
或者也可以不用关联分析,其他的方法也行。
sunshine998
用关联分析,Apriori算法 你可以看看
lei_zhang
[未知用户]
可以具体一下吗?数据还有一个特点就是卖家几乎每天都会对其所卖的所有商品进货(因为主要是卖新鲜蔬菜的),如果仅仅是考虑商家每天进了什么货,是没有多大用处的,所以是要考虑进了什么货以及进了多少量,这样的话,应该用哪种算法,普通的Apriori算法是解决不了的。谢谢了
gogozhang
我也和楼主有相同问题。楼主所述问题直觉上看是一个关联问题,但现有关联算法都是得出一些定性的关联关系,不能解决这类问题中一个重要目标,就是定量的关联关系。难道要人为划分一些销量的区间,把定量换为定性吗?这么做似乎又有些太简单,而且这个区间怎么划分又是个问题。求教大神解答!