15521267858 关于齐夫定律的解释是这样的:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数个这些词编上的等级序号,即频次最高的词等级为1,频次次之的等级为2等等,若用 F 表示频次, R表示序号,则有 FR=C (C为常数),对数化后 log(F)=log(C)-log(R)。 所以假设我有一些词频的排序,那么作对数并线性回归后,截距项就是log(C),C的值就是以10的截距项次方了。那C应该是一个很大的数,可网上看怎么说C约等于1呢?有大神解释一下吗?谢谢~
oreado 齐夫定律是一个实验定律,研究发现F约等于1/R,log(F)约等于-log(R)。 换而言之主楼所说的截距项是一个非常接近0的数,为了直观和简单假设是0.01(这个假设肯定不对,但是是可以简化这个问题),log(C) = 0.01,C = 10的0.01次方: C = 10^0.01 print(C) [1] 1.023293 0.01不够小,但C已经很接近1了 我经历的脑短路: log(C) = 10-300 ,C=-300,楼主说得对啊! (…………………………不对C=10E-300 )