最近遇到了数据展示方面的难题,向各位大佬请教一下,x为字符型变量,x过多比如大于50,如何更好的展示x与y之间的关系;
- 当x小于10时,可以使用CDFplot,展示变量之间的差异;
- 当x小于50大于10时,可以使用boxplot进行可视化展示;
- 当x大于50时,仍然使用boxplot,但x轴因变量名称相互挤压已经看不清,改进的方案是使用ZoomIn进行放大,但存在响应速度过慢的情况;
所以,请教一下给位大佬,当x大于50时,使用什么样的图形更合适?
最近遇到了数据展示方面的难题,向各位大佬请教一下,x为字符型变量,x过多比如大于50,如何更好的展示x与y之间的关系;
所以,请教一下给位大佬,当x大于50时,使用什么样的图形更合适?
根据你的描述无法知道数据代表的意义,是如何生成,也不知道想探索数据的哪些内在联系,实在难下手,要不你看看https://r-graph-gallery.com/ 找找灵感吧……
翻转 x 轴和 y 轴,使用 ridgeline plots 展示: https://clauswilke.com/dataviz/boxplots-violins.html
zizhou
x很多的话可以考虑给x加data zoom来展示,不过这种应该会对y的展示方式有限制,boxplot应该还可以
zizhou 响应速度过慢
我捏了个例子试了下,感觉速度还可以啊
library(echarts4r)
mu <- runif(1000, 0, 10)
sigma <- runif(1000, 1, 5)
df <- data.frame(
x = do.call(c, lapply(1:1000, function(i) {rnorm(100, mu[i], sigma[i])})),
grp = rep(1:1000, each = 100)
)
df |>
group_by(grp) |>
e_charts() |>
e_boxplot(x) |>
e_datazoom()
meeeeeeeeo 谢谢您的案例。在数据量较少的情况下确实很好。当数据超过5000k时,就显得有些吃力了。另外,echarts没有打印出所有散点,只是标识出异常出来。当散点都打印出来时,也会比较慢。
交换 X 和 Y 变量,绘制为水平方向的条形图,就像 IT 硬件的性能天梯图:https://topic.expreview.com/GPU/。 如果你做成静态的图形,就使用渐变颜色为条形上色,甚至加上代表条形长度的数据标签:https://www.zhihu.com/tardis/zm/art/573195215