caret包或者单独的机器学习方法包如何对新数据进行预测?新数据是不知道标签的。
另外,为什么caret包在分割训练测试集时,测试集不会删掉标签列?是因为标识了label列所以,即便标签和数据一起输入predict也不会被模型弄混是吗?谢谢大家的帮助!
Susannalsy
- 2022年6月21日
- 注册于 2019年9月19日
- 于 多标签分类怎么做
Susannalsy 我悟了!!!!以默认阈值为0.5为例,对每一个标签而言给出一个概率,如果大于0.5,就是TRUE,小于0.5就是FALSE,所以他们加起来当然不会等于1
tctcab 前金融行业的大趋势是人的分析预测能
hhh确实,买基金根本不用求个模型,全靠经验
- 于 多标签分类怎么做
CMCai0104 你说的这个我现在理解了,这的确是算法呈现出来的意思,但关键是如何让这几个标签的概率加起来等于1?他们加起来不等于1
- 于 多标签分类怎么做
Susannalsy 另外,这个概率是针对每一个标签是01的概率,并不是三个标签加起来是01的概率,用啥能求这样的概率结果呢??
- 于 多标签分类怎么做
- 已编辑
Susannalsy 我懂了,这个概率的意思就是单纯的算法认为这个东西是什么的概率,不论预测对了还是错了,刚在看mlr3包的书,书中举了这个例子,茅塞顿开。
row_id truth response prob.M prob.R
1: 9 R R 0.04651 0.9535
2: 11 R R 0.04651 0.9535
3: 15 R R 0.15385 0.8462
4: 19 R R 0.15385 0.8462
5: 21 R M 0.89474 0.1053
6: 27 R R 0.04651 0.9535
比如,第一行,算法预测对了,就是R类型,它认为是R的概率是0.95,很高的概率确信它是R,而不是M,这个很好理解;看第5行,算法预测错了,算法预测是M,但其实是R,这里给出觉得是M的概率是0.89,很高,所以答案是M。
因此,就是简单解释算法为什么给出这个结果的概率大小。所以,多标签想必道理是类似的,它的概率虽然很低,但是它结果是对的,只是说有较小的概率认为它是这个,能理解吗,意会一下 - 于 多标签分类怎么做
- 已编辑
tctcab 这个真没有,他只说这个是什么,可以怎么获得,mlr官方文档也没有提它的意义是什么
- 于 多标签分类怎么做
- 已编辑
nan.xiao 请问做出来的每个标签的概率是什么意思?我看到它单个标签其实分对了,为什么概率也是0.3左右,而且也不一定,这个单个标签的概率怎么理解他的意思?
比如:
truth.r truth.t truth.w prob.r prob.t prob.w response.r response.t response.w
FALSE FALSE TRUE 0.15 0.524 0.494 FALSE TRUE FALSE
FALSE FALSE TRUE 0.334 0.41 0.672 FALSE FALSE TRUE
TRUE TRUE FALSE 0.714 0.186 0.284 TRUE FALSE FALSE
nan.xiao - 于 多标签分类怎么做
nan.xiao 照着敲了一遍才来写买家秀,真不错!的确是R的多标签分类,但不晓得这个mlr机器学习包和caret有什么区别,感觉也很强大,谢谢您!!!
- 于 多标签分类怎么做
tctcab 哈哈确实,我再想想,的确想要返回一个标签列表才是真实目的
- 于 多标签分类怎么做
tctcab 哦!那岂不是特征tr分到t和r都算对,就相当于把这个特征删了,就分其他两个t和r就好了
- 于 多标签分类怎么做
tctcab 您这个代码意思是:把tr转换为预测数据相对应的标签,消掉了tr这个类别,把它融为只有t和r,然后计算新的t、r混淆矩阵,是吧?(看了半天,狗头保命)
但我感觉这么一折腾,干脆把tr按照第三种类别来分,就是最后计算混淆矩阵的时候,做个转换就行,这真的感觉像虚假的多分类,我再看看楼下给的链接 nan.xiao 谢谢!我细看看
- 于 多标签分类怎么做
- 已编辑
现在有t、r、tr三种类型的样本,其中tr是兼具t和r这两种特征的类型,在分类时,把tr分成t或者分成r都算分对,所以分类正确率需要变一下。结果想返回一个标签列表,比如:t就返回只有t特征,r就只有r,但tr这个类别就返回两个分类标签有t和r,请问R里有处理这样问题的方法吗?分类方法考虑用支持向量机、偏最小二乘法。
我是一个调包用户,不太擅长自己写算法,常用caret机器学习包 Liechi 谢谢谢谢!不常用ggplot,因为我的x轴和y轴不在一个数据里,画图要声明data,只能写一个data来源,所以我就老失败,一直用的plot(),但png()不带有dpi参数,所以出图分辨率比较低,有时就用origin画图了,学会了,谢谢大神!
Liechi 谢谢懂了!昨天我已经逐个分类画了
LTkongjianyang 请问png怎么设置分辨率啊?比如dpi是300
请问基础画图函数plot(),如何针对类别设置颜色?如果不想用ggplot的话
xiaoqianxixi 顶一下这个贴,SVM的参数取值范围怎么定?
lolo 请问SVM核函数参数取值范围该定为多少合适呢?