Cloud2016
俺明白。湘云呐,我发现跟你交流几回合以后,有点开始跑偏了,我原来想吐槽的是分析工具和惯用视角可能会扭曲数据,进而扭曲数据分析这个行为本身。这里贴一下,我在写的博客的一段,阐明本意。
既然确立了简单的分析方向,那下一步自然就是开始收集数据,在这个过程中,我不断想起另一个疑惑了近一年的问题:只有两个点,到底能不能分析趋势?
第八条 人口普查每10年进行一次,尾数逢0的年份为普查年度,标准时点为普查年度的11月1日零时。
第十二条 人口普查主要调查人口和住户的基本情况,内容包括姓名、性别、年龄、民族、国籍、受教育程度、行业、职业、迁移流动、社会保障、婚姻、生育、死亡、住房情况等。
第八条 农业普查每 10 年进行一次,尾数逢 6 的年份为普查年度,标准时点为普查年度的 12 月 31 日 24 时。
第十二条 农业普查内容包括:农业生产条件、农业生产经营活动、农业土地利用、农村劳动力及就业、农村基础设施、农村社会服务、农民生活,以及乡镇、村民委员会和社区环境等情况。
第七条 经济普查每5年进行一次,标准时点为普查年份的12月31日。
第十三条 经济普查的主要内容包括:单位基本属性、从业人员、财务状况、生产经营情况、生产能力、原材料和能源消耗、科技活动情况等。
全国性质的普查往往需要耗费大量人力物力,人口普查、农业普查是每10年一次、经济普查是每5年一次,那么能够与之匹配的翔实数据自然也只有普查年份才有。现如今获取数据的方法非常多样,人们要分析数据时所面临的大多不会是数据缺失,而是数据泛滥。而一旦将想要分析的范围放大到一个国家,那么数据往往是珍贵的,且可能有缺失的。所以,我很理解宏观数据的缺失。许多时候,我们分析数据的目的并不是分析数据,而是想要洞察数据背后隐藏的真相。其实我的日常工作中基本接触不到宏观数据,因此很少思考数据分析、分析数据、数据、分析这些词语的差异。当我开始着手搜集梳理宏观数据以后,我开始反思过往,数据分析这件事其实很侧重分析工具,而分析数据这件事则更侧重分析视角,重点都放在了分析,数据既重要又相对不那么重要了。看那些宏观数据的时候,我的心态常常都是略微有点沉重的,同时也开始谨慎地使用分析工具,避免使用魔法而扭曲数据,更多地偏重于展示数据。那个令我疑惑的问题,并没有得到一个确切的答案,只是时时想起,提醒我要警惕对分析工具的倚重、对分析视角的惯性依赖。