最近遇到了数据展示方面的难题,向各位大佬请教一下,x为字符型变量,x过多比如大于50,如何更好的展示x与y之间的关系;

  • 当x小于10时,可以使用CDFplot,展示变量之间的差异;
  • 当x小于50大于10时,可以使用boxplot进行可视化展示;
  • 当x大于50时,仍然使用boxplot,但x轴因变量名称相互挤压已经看不清,改进的方案是使用ZoomIn进行放大,但存在响应速度过慢的情况;

所以,请教一下给位大佬,当x大于50时,使用什么样的图形更合适?

    根据你的描述无法知道数据代表的意义,是如何生成,也不知道想探索数据的哪些内在联系,实在难下手,要不你看看https://r-graph-gallery.com/ 找找灵感吧……

      感谢两位的回复。
      tctcab
      可能没有上传图片,所以没有将问题表达清楚。我的意思是x是字符型,例如是设备1,设备2,设备3,,,等等,y是数值型,比如是生产产品的长度,每个设备生产产品数量是多个,要看x与y的关系。
      nan.xiao ridgeline plots是很好的展示方式。这里x的数量过多,有的超过了1000多个,所以,没有办法完全展示出来。最终通过对x抽样,缩减展示的数量才能看到相对清晰的图。

        zizhou 分组做,或者分开做。我的常用做法是做成shiny。让用户选择感兴趣的设备,不行就轮着选。

        zizhou
        x很多的话可以考虑给x加data zoom来展示,不过这种应该会对y的展示方式有限制,boxplot应该还可以

        zizhou 响应速度过慢

        我捏了个例子试了下,感觉速度还可以啊

        library(echarts4r)
        
        mu <- runif(1000, 0, 10)
        sigma <- runif(1000, 1, 5)
        
        df <- data.frame(
          x = do.call(c, lapply(1:1000, function(i) {rnorm(100, mu[i], sigma[i])})),
          grp = rep(1:1000, each = 100)
        )
        
        df |> 
          group_by(grp) |> 
          e_charts() |> 
          e_boxplot(x) |>
          e_datazoom()
          1 个月 后

          meeeeeeeeo 谢谢您的案例。在数据量较少的情况下确实很好。当数据超过5000k时,就显得有些吃力了。另外,echarts没有打印出所有散点,只是标识出异常出来。当散点都打印出来时,也会比较慢。

          8 天 后