tctcab 本土化的数据不太好弄,我想过弄年鉴,但没有找到什么接口,一个一个录数据又没功夫。你有什么容易获得的数据源吗?

    tctcab 有独特的数据才是讲好故事的关键,发挥大家的智慧,一起找!其实,我一直有一个大致的方向,就是参照 Gapminder 的思路,跨长周期观察国家经济和居民生活相关的数据。改革开放 40 年的人均 GDP、Gini 系数、人均可支配收入,GDP 增速和失业率,人口结构变化,人口增速变化,物价指数变化,通货膨胀系数变化等等,国家间和国内分地域的情况。

      Cloud2016

      跨长周期观察的想法很好,确实也要有能稳定更新的数据源才能做得起来。印象中那些大的指标在中经网统计数据库里有,wind 里面有金融经济方面的,不过这些数据都不是免费的。国家间的经济、贸易类数据,大概在各国的国家银行官网有,但一般更新进度不会很快,至少滞后一年。

      吐槽我自己:

      大的指标

      连“宏观”这个词都忘了。

      其实我还想研究更远一点的历史,比如人均猪肉摄入量从古至今的变化,人身高的地域差异变化,或者各大姓氏在版图上的历史变迁什么的

        tctcab
        我有一个很瞎的想法。
        现代科学非常依赖数据,总是要有数据才能归纳总结。但是从古至今的人均猪肉摄入量上哪去找数据呢。但这个东西也不可能像数学那样演绎推理。
        不如很瞎地跳过这些,如果研究人均猪肉摄入量从古至今的变化本身就是为了研究背后的“变化”,可以反推。很多年前有个叫黄仁宇的人写了一些书,提出了一种大历史的观点,大致记得他反推过明朝的经济状况。如果猪肉摄入量本身影响的是人们的健康状况,那有些历史书里面的痕迹大概会记录那些年代一些普遍现象,比如某某年人们某某病很普遍。只不过这么干,虽然跳过了数据,但也不能跳过事实,“事实的依据”还是得去翻很多书(ps.我不是说要手动翻,而是找历史古籍资料做文本挖掘,提取些关键词之类的)。

          yuanfan

          我想的还是用定量的那一套玩法研究历史啊哈哈。所以历史书里的记载天然带有主观的成分,而数据的话虽然不一定准确,但数量级大致不会错。

          比如猪肉摄入量这个问题,其实我更想问的问题是 “当时的人生活水平怎么样”,但这太抽象,所以就借助类似麦当劳巨无霸汉堡指数这样类似的大致可比的指标来间接衡量生活水平。所以,
          如果摄入量数据难以直接查到, 但是可能可以按猪肉价格和当时的平均收入来大致推算获得难度高不高之类的其他指标来衡量

            8 天 后

            写着写着内容走神了,有点求大求全,但是又搂不住,距离投稿的要求感觉还比较远,我先放出来,看看大家有什么想法?有没有想合作一起给统计之都投稿的?
            https://xiangyun.rbind.io/2022/02/maps-in-r/

            有几个合作方向:

            1. 就一种类型的空间数据,一个可视化 R 包,各种空间可视化展现形式,详加介绍,聚焦可视化技术和R语言实现,类似《echarts4r: 从入门到应用》
            2. 在当前的基础上修改,如果担心历史包袱太重也可以重新写,目标是一篇空间数据可视化的综述型文章。
            3. 找一个数据集,交代足够的背景,深入地探索、分析、可视化,以数据为中心,以事实为依据好好讲一个故事。
            4. 空间数据的基础知识和基本操作,更加通俗地介绍各类空间数据及其操作。

              求助,帮忙找找百度的瓦片地图的 Tile 模版,准备用于 leaflet 包绘制交互地图,或者类似 R 包 baidumap ,封装高德地图 API 的 R 接口。

              15 天 后

              yuanfan 挺好的呀,欢迎继续投稿 😄 ,如果需要,我可以提供协助。

              9 天 后
              3 个月 后
              5 天 后

              tctcab 人口普查的方向,捞宏观数据的想法,首先在美国人口调查局这里实现了,具体见文章地区分布图及其应用,空间数据主要有三大类,这篇文章分析的是区域数据 areal data / lattice data。

              图 25: 关注城市化进程中正在收缩的城市:蓝色表示人口收缩,红色表示人口扩张

              这个图漂亮