对主题模型刚进行研究,还不怎么理解,了解的人可以帮我看看么?
我的语料库是9个主题的900多篇文档,trainM0是文档-词条的频数矩阵,下面是我的一段代码:请问参数alpha设定0.1适合么?
ldaG<-LDA(trainM0,control = list(alpha = 0.1),k=9,method="Gibbs")<br />
#save(ldaG,file='ldaG.rda')
> terms(ldaG)
Topic 1 Topic 2 Topic 3 Topic 4 Topic 5 Topic 6 Topic 7 Topic 8 Topic 9
"旅游" "专业" "中国" "发展" "公司" "没有" "比赛" "中国" "命题"
设定的预测主题是k=9类,结果这九类主题预测的不太准确啊,是不是参数设定问题?
</p>