aegea
McDonald's wants to know what affects the flow of customers to their fast food restaurants . Its staff wants to sample their restaurants, considering certain factors that they regard as possibly important. These factors include: size of city (small, medium, large); location of city (eastern, western); and the size of the restaurant (samll, large). For each cell, you sample a certain number of restaurants and record the numbers of customrers during a particular month. How would you analyze the data that you collect in order to advise McDonald's.
大意如下:
麦当劳想知道什么影响了快餐店客流量,所以就调查了以下他们认为重要的因素。 城市大小(大,中,小);城市位置 (东部,西部);餐馆大小 (大,小)。每一个组合都收集一些样本并且记录顾客的数量。为了给麦当劳建议如何分析数据
这道题目比较困惑,请好心人给个思路。而且关键不知道分析的时候如何作假设检验和如何推断
非常非常感谢
我不确定就是三因素方差分析
hexm26
用Generalized Liner Models来做,Link function选Poisson,在SAS里面,程序大致如下:
proc genmod data=McDonald;
class size_city loc_city size_rest;
model flow = size_city loc_city size_rest / dist = poisson link = log;
run;
aegea
非常感谢,用generalized linear models 我考虑过,那么X就是qualitative variable.
但是方差分析里面说如果反应变量Y不是正态分布,可以作transformation变化成正态分布,然后用方差分析
如果是Poisson,那么其实每个X的组合,例如东部大城市大餐馆里面可以sample的n个餐馆都是同分布么
hexm26
这个模型里面的应变量Y是餐馆的客流量,属于典型的Poisson分布,既然你是对同一类型的餐馆,即麦当劳,进行分析,所以你尽可以放心的做同分布假定。不用理会自变量X的问题。用PROC GENMOD通俗的说就是先将非正态分布的Y转换成正态分布,然后进行方差分析(这个解释不太严格,但你可以这么理解)。
oliyiyi
假定反应变量为泊松分布的,使用GLM中的对数线性模型,加入城市大小,城市位置(前两个变量需要采用dummy var加入模型),餐馆大小。 各个因素的影响直接从回归系数可以得到。
glm的目的在于把正态分布推广到指数族分布(possion属于指数族),这样可以处理很多分类变量的情形而且可以统一的迭代估计参数,如果再回到正态分布,以及什么方差分析就抹杀了glm的意义了。
另外在回归里可以很容易考虑方差分析啊,经典线性回归里,本身就是方差分析。
另外楼上的“genmod通俗的说。。。。。。。转换成正态分布”,实在令我疑惑,呵呵。
robustreg
所谓方差分析和回归分析的称谓,是历史原因造成的,主要是根据自变量离散还是连续区分的,放在一般线性模型中结论一样的,对于楼主的问题,取决于你对Y的分布假设,对这个具体问题来说,通常是假定为Poisson分布的,所以用广义线性模型来做,所谓模型是来源于一些假定的,不同假定用不同模型。单位时间内事件发生数假定满足poisson分布的那3条性质,就用Poisson回归了(或者叫基于Poisson分布的方差分析)
hexm26
[quote]引用第5楼robustreg于2007-07-25 02:51发表的“”:
所谓方差分析和回归分析的称谓,是历史原因造成的,主要是根据自变量离散还是连续区分的,放在一般线性模型中结论一样的,对于楼主的问题,取决于你对Y的分布假设,对这个具体问题来说,通常是假定为Poisson分布的,所以用广义线性模型来做,所谓模型是来源于一些假定的,不同假定用不同模型。单位时间内事件发生数假定满足poisson分布的那3条性质,就用Poisson回归了(或者叫基于Poisson分布的方差分析)[/quote]
呵呵,我们的理解是一致的。不过我犹豫了半天,这个“基于Poisson分布的方差分析”我一直没有说出口,毕竟没有见过这样正式的提法。