问题描述:我参考了类别不平衡的问题,对于图像数据集的其他属性进行了不平衡分析,如图像尺寸,图像中的目标尺度,目标角度等。我原先的想法是对这些属性进行一一的验证,如原数据集中,目标尺度分为大中小,比例为1:2:3,将其采样后,均衡为1:1:1,进行训练测试,来验证对该属性进行均衡,对提升准确率是有效的。
但是我在实际操作中发现,这些属性是存在关联的,如一张图片中,包含不同的尺度目标,不同的目标角度,我通过采样来使得一种属性均衡后,会影响另一种属性的比例分布。
我还想过按一种属性划分之后,再按另一种属性进行均衡,然后再划分,在有限的属性上,虽然工作繁杂,但是是可以实现的,但是这样,每次划分进行均衡后,数据集的规模也增长了,数据集的数量也是一种影响因素。
所以我想寻求一些建议,我的目的是验证不同属性均衡之后,可以对准确率有影响,如何设计我的验证实验,才能避免这种变量之间的关联,谢谢~