guanglunw
请教各位:
在做逻辑回归时是否需要对数据进行标准化,如果进行了标准化对模型的影响如何呢!
是否有这方面的资料呢
fairy
建议你看看王济川老师和郭志刚老师编《Logistic回归》的书吧,讲得很详细很透的
losttemple
This book is worth reading.
Jichuan W's new book introducing 'multilevel model using SAS' will be published recently.
yihui
对非统计专业的人来说也许是本好书,但对统计专业的人来讲,第16页关于如何最大化似然函数的一句话非常不负责任:“我们用不着关心具体的迭代方法,因为计算机可以为我们处理好各种计算细节”,我平时看书最不愿意看到的就是这种话,仿佛计算机可以包办一切,什么难题都推给计算机去做,我们甚至连它是怎么做的都不用关心。计算是统计的关键,连计算都不关心,统计结果还有什么意义呢?(算出来是对是错也不知道)
莫名
是啊
fairy
呵呵,抓主要矛盾~
没必要对什么都全部精通啊,呵呵,也没那个精力。我觉得这本书的确很不错,在Logistic回归方面是非常全面细致的一本书了。
yihui
不是说要什么都精通,我只是说现在我们对统计计算忽视得太严重了,就连一些大名鼎鼎的统计教授都没意识到这个问题(我有真实经历),无意间就犯了统计计算的严重错误自己还不知道,原因就是不了解计算的过程。计算的问题确实不是主要矛盾,但是它是决定一切统计输出的关键。Logistic回归的计算相对来说还算简单,一般不会出太大的问题(就看迭代能否收敛了),要是到结构方程模型之类的庞杂模型中,那种计算的复杂度简直就没法想象,因此滥用的人也是铺天盖地。