lovebluesky 关于tidy,base以及data.table的讨论确实过长,我觉得都可以再开一个短篇了。其实您想表达的观点无非是不需要拘泥于工具,另外要考虑生产环境的重复性和稳定性的问题。但能看出来您对净土拥趸批评 base的不满与不解,但这与主题无关,也是可以几句话带过的,而且这么写容易引起论战或者部分人心里不舒服,从而导致对整个文章的观感下降。换句话说您的部分措辞带有强烈的感情倾向,我觉得这应该是一篇指南性质的文章应该避免的。
我当初写这一部分的时候仔细推敲过,为了避免不必要的论战,只是陈述事实,并以 reshape()
变形操作为例详加介绍,若你也能以事实反驳,非常欢迎,建立在就事论事基础上的讨论都欢迎。
lovebluesky 感觉博主有喜欢把自己了解的东西一股脑的灌输给大家的倾向,求全的倾向主导了这篇文章,如果这篇文章的主旨在于专题地图,那么大可不必展开介绍数据或者作图后体现的结果,或者是数据处理的展开,这是相关专业人士可能感兴趣的内容。作为紧扣主题的内容,讲清楚几个专题怎么作图就行了。喜欢数据解析的可以自己深挖。
事实上,这不是一篇给新手的实操文章,对新手的价值可能仅仅在于整个空间数据可视化工作流的概览,且以专题地图为例,没有弄简单数据,而是尽力去找真实的数据,尽量贴近真实场景的需求。绘图技术方面,其实本文谈了很多关键的比较难的细节,比较了几个主流的 R 绘图工具,但是画完图还没完,图是帮助传递数据中的信息的,关于图的说明、数据的解读其实做的不太好,不了解美国的一些情况,拿中国的数据解读起来一来可能敏感,二来数据收集不好弄,解读的逻辑链条很难 solid。绘图之前整个探索分析最基础的技术是数据操作,空间数据尤其重在此,数据变形操作和坐标投影只是比较典型而基础的,因此拿来讲。
lovebluesky 作为紧扣主题的内容,讲清楚几个专题怎么作图就行了。
术语「专题地图」的含义在开头做了介绍,中文确实很难翻译 Choropleth map,为什么很难呢?据我了解,似乎候选的中文名词太多了,也有可能是我没有搞清楚它们的细微差异,而在文中全部以「专题地图」冠之了,在不少地方,也看到叫「统计地图」的。
本文就讲了两个例子,一个是癌症死亡率,显然人口相关,如果把它看作衍生指标,按照统计年鉴的指标体系,它显然是属于人口专题的,当然,年鉴里不一定有这么细的指标。「专题地图/统计地图/地区分布图」可以看作是一种特定的图形,所以,你看,我本意不是要多介绍几个年鉴里人口、土地、消费、生产等专题,而是就某一个为例,详加介绍,总结经验,以便读者迁移到其他专题或需要的场景,反复介绍多个专题反而累赘。