• 综合已解决
  • 探索数据时发现某个指标的变动趋势超出常理,后续应如何继续分析?

首先还是要鼓励楼主这么关注数据现象和探究差异的态度。下面扯一点闲篇。

《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》第三章 主要目标 第一节 2035年远景目标 有这么一段话:

人均国内生产总值达到中等发达国家水平,中等收入群体显著扩大,基本公共服务实现均等化,城乡区域发展差距和居民生活水平差距显著缩小。平安中国建设达到更高水平,基本实现国防和军队现代化。人民生活更加美好,人的全面发展、全体人民共同富裕取得更为明显的实质性进展。

里面就有十分丰富的内容值得用数据去解读,比如什么叫人均国内生产总值,什么叫达到中等发达国家水平?中国的人均国内生产总值的计算方式是否和国际一样,如果不一样,差距是否足够小,以至于中国和其它国家可对比。什么叫中等发达国家水平?假设现在 2022 年,国际上这个水平是 5W 美金,到2035年,这个水平还是 5W 美金吗?那可不一定,大家都在变化发展,所以「中等发达国家水平」的概念肯定不是一个数字,至少是一个世界各国按照某个指标的排序,那么问题来,现在中国处于什么位置,距离「中等发达国家水平」的位置有多远?

类似的,什么叫中等收入群体显著扩大?在中国,什么叫中等收入?什么叫中等收入群体?当前什么状态?「显著扩大」又是什么意思?假设当前这个群体站 30%,2035 年达到 35% 能叫「显著扩大」吗?还是说提升两个点,即 32% 就已经是很显著了呢?

诸如此类,等等。

我只是打酱油路过说一句,我觉得楼主用两幅图提了一个相当好的问题啊,不管谁看了图都会起疑心吧,这正响应了 Tukey 祖师爷的那句话

The greatest value of a picture is when it forces us to notice what we never expected to see.

然后楼上应该是解开了这个谜团了吧:

fenguoerbian 中国的原始数据实际上只有2002和2013两个点

我觉得这是一次完美的小探案。

至于情绪啥的,我觉得也是可以理解的。不管论坛总体性别比例如何,本帖下的性别比例还是相当失调的,我都有点犹豫要不要回帖(又增加了一位糙汉)。

    yihui 我赞同Tukey大人的观点,但我不赞同通过图形传递歪曲、错误的信息,用川普的话说 fake news! 楼主引用的就是 fake news!

    从我个人角度看,“一个人对某件事产生了愤怒的情绪”和“一个人沉浸在愤怒的情绪中封闭自己,拒绝与外界沟通,进而疯狂怒怼别人”是两件事。不可否认的是我在看到一楼的图时,确实愤怒了几秒钟,但以上发帖和回帖中我写下的文字都是在心境平和的状态下写的。

    另,我最初看到三水大人写说到底份额只是从不到40%降到30%多的时候,也产生了愤怒的情绪,当时在心中腹诽“这是什么钢铁直男才说得出口的冷漠混账话啊”。不过好歹也看三水大人的博客看了两年了,也还是能够明白三水大人真得只是在理智客观地分析数据而已。好像也正是因为有过情绪波动,后面看到三水大人写到比例会升回来、不用担心之类的,我内心颇为感动,昨天晚上临睡前看到的时候很感动,现在再来看也还是很感动。

    Cloud2016
    在我看来,那不是很有意思的现象,而我也没有下结论。我这不是感觉数据表现超出我的认知,所以来论坛里发帖问了么。难道你是觉得我产生了愤怒情绪,便等同于我下了结论么。

    从我的角度看,我把世界财富与收入不平等数据库的数据画成图拿到论坛里发了个帖子并不是传播你认为的“fake news”,我都不觉得这些数据是新闻之类的。

      yuanfan 我觉得这个例子非常好地说明了,在发表任何数据观点和数据图形前,特别是涉及国家政治、经济的,需要先了解一下数据背景,特别是数据质量。竟然有拿两个数据点做内插、外推几十点的情况,此人刷新了我的认识。

      回到楼主的问题,遇到不合常理、不符合直觉、不符合经验的时候,首先需要检查数据问题,比如数据处理过程、数据收集过程、数据质量情况,而不是再找一些无法验证数据质量和分析链路的观点,要找事实而不是找观点。

        fenguoerbian
        漂亮的溯源和分析。

        这篇文章的数据分析起点是 1990 年,但作者没有提到设定这个起点的原因。一个显然的巧合是,1990 是苏东剧变的时间,大量前社会主义国家市场化和资本化。另一个显然的巧合是,虽然中国没有经历类似政体剧变,但在同时间实际经济政策也转向了市场和资本。作者反复强调前东方集团和中国在这个时间段女性收入占比下降,而西方主要国家稳步上升,但却似乎刻意避免提及以上明显的“巧合”,令人困惑。(虽然中国的数据点只有两个,但就看这两个的话,下降趋势和前东方集团国家一致)

        那市场化,资本化会导致女性收入占比下降吗?该作者另有一篇文章分析了德国两百年来的女性薪水跟男性的对比。德国是典型的资本主义国家,数据显示,二十世纪后,女性收入占比基本呈上升趋势。所以看来资本主义不必然影响妇女收入占比。(这里没有找到作者如何处理东德的信息)

        如果我们认为社会生产力是在不断进步的,那么结合这两篇文章的数据,可以合理推测以女性收入占比为指标的男女平等是随着社会生产力的提高而提升的;同等生产力水平下,社会主义国家的男女平等水平更高。前东方集团国家和中国在 1990 年前该指标的高水平是由国家的意识形态和经济政策维持的;在 1990 年,政体或政策转向后,市场化和资本化反而降低了女性的收入占比。其实这也好理解,社会主义更注重公平而不是效率,而市场化资本化是以效率为王的,一些不利于女性的考量,比如生育,对家庭的付出等,开始负面影响女性的收入。

        这篇文章的作者引用了教员妇女能顶半边天的话,然后分析说虽然口号这么讲,但现在我国妇女的收入占比没有真正体现平等。这个结论灵巧地避开了关于生产力水平和近三十年经济政策转型的讨论,只是一味表示西方国家同时期男女平等稳步上升,而不提实际上社会主义国家这方面的优点。这么柔软的身段,令人印象颇深。甚至有点像汤师爷,是个装糊涂的高手。

        真正值得关注的是中东王爷们和日韩的数据。这些国家在收入如此之高的情况下,男女平等依然如此堪忧。其中原因更值得探讨。

        生产力决定生产关系。如果这类研究不触及要害,只是拿几个指标讲故事,那除了挑动情绪或者成为一些人打拳的依据,没什么价值。

          Cloud2016
          我同意,不过我觉得找事实和看看别人的观点也不冲突。就比如,我在探索这个数据库的数据时,没有选择自己一口气死磕到底(宏观经济指标方面的知识真得知之甚少),而是偷懒把发现的问题丢到论坛里来问问大家的意见好像也是可以的。

            yuanfan

            唉,话说统计之都的坛友是不是九成都是男性啊。竟然没有一个人跟我一样,最开始看到这个下降趋势的时候第一反应是愤怒几秒钟么?虽然说生气也没撒用,可是我觉得好像已经很久没在(国内)主流视野里见过有人讨论性别不平等的问题了。

            另,我最初看到三水大人写说到底份额只是从不到40%降到30%多的时候,也产生了愤怒的情绪,当时在心中腹诽“这是什么钢铁直男才说得出口的冷漠混账话啊”

            那么你到底想要分析数据,溯源知果

            还是只是想找人来迎合“中国女性收入下降那么多男女多么的不平等我不开心”的情绪?

            还是说你只想打拳?

              tctcab 好啦好啦,我们不要把这个帖子朝这个方向引啦。维基百科有一条指南我觉得挺好,即不要随便推测别人的意图,尤其是不要假定恶意:https://en.wikipedia.org/wiki/Wikipedia:Assume_good_faith 如果不清楚别人的意图,那么不妨不要问、直接假定善意。楼主只是看到一个奇怪的现象,拿来问问大家更专业的意见,而上面基本上也解释了疑惑。接下来如果钢铁直男直女们还有什么想讨论的,不妨讨论一下那篇“万恶之源”的论文,是它坑了这里的所有人。

              既然这个楼都歪成这样了,那么继续歪下去也无妨。

              tctcab
              我可以回答你的问题,不过你先告诉我“打拳”是什么意思?你如何界定这个词语所涵盖的范围?

              Liechi
              列弛,你也提到了“打拳”这个词,我也想知道你对这个词语的定义是什么?

                yuanfan

                写了一大堆想了想还是删了吧,放弃了。

                我蛮夷也。我就是说冷漠混帐话的钢铁直男

                  好吧,我本来想着这个讨论可以成为一个“无意擦枪走火、但仍然可以和平收尾”的范例,现在看来收尾仍须努力。我表个态吧,我个人非常反对使用“打拳”这个词,它听起来非常难听。以我的经验,在辩论中一旦使用抽象的标签,这辩论就不容易有实质进展,因为标签实在是太能调动人的情绪了,一般人都扛不住被贴上带贬义的标签。我自己深受其害,被贴标签是很痛苦的事情,但即便这样,我还是无意制造出一个“净土宗”的标签,要不是 @flujoo 一语点醒梦中人,我也不会意识到它流露出的恶意。

                  tctcab 女权啊,想想为什么会有不止一个人在说打拳

                  关于“不止一个人”,我觉得没必要提。在敏感话题下,不妨直接谈自己的观点,不用说“看,不止我一个人这样认为”。有理不在声高,也不在人数。何况这里参与讨论的所有人里,只有楼主一位女性;如果人数有用,那么我想只要再请几位女性来,那么是不是可以反转过来说“你们糙汉们想想为什么不止一个人说我根本没有打拳”。所以单论有某个想法的人数是没有意义的。

                  其次,恕我直言,我觉得怀疑楼主打拳的人还真的只有一个人。一共三个人提到拳:yufree 提了,但不是针对楼主,只是想说这个话题很容易走火;再就是 Liechi 提了,但同样不是针对楼主。

                  第三,我想请男同胞们设身处地体会一下楼主一人应对一群男性的压力,而且很巧合地全都是头上带闪电和扳手的……我本人算是温和地支持女权(“温和”的意思是我通常只会暗中支持,不会参与明面上的斗争),因为我们男性确实是享受了不公平的性别优越待遇,在性别问题上应该多给女性一些体谅。她们是长期的受害者,就算说出一些听起来不那么悦耳的话,我觉得都是正常的情绪发泄,是可以接受的。何况楼主也并没有说什么难听的话,唯一说的可能会引起男性不适的只是“第一反应是愤怒几秒钟”,可是我们完全没必要揪住这句话不放啊,因为人都有权有第一反应,也有权愤怒几秒钟,只是“第一反应”和“几秒钟”而已(后面楼主也说了都是平和心态在看待和讨论),如果这都能被归结为“打拳”,我觉得男同胞们有点太不大度和敏感了,或是关于性别战的水帖看太多了,形成了“性别问题的讨论或辩论都是垃圾”的刻板印象。

                  tctcab 【将复杂多因素问题,主要为社会问题简单非理性归因到“性别”这一单一因素】的行为。

                  我素来强烈反对将多因素问题归因于单因素,但楼主最初提问的时候并没有这样归因。楼主只是看到一个奇怪的现象,来问问大伙儿的意见,是一道开放题,并没有下什么结论,我们可能反应过度了。

                  本帖参与讨论的所有糙汉们以及楼主都是我非常信任的人,所以我不希望你们发生误解,我也相信这个帖子的结局绝对不会像普通的性别战那样收场,一定可以结出和解之印。

                  tctcab 写了一大堆想了想还是删了吧,放弃了。

                  你不用放弃的,我觉得还是应该把话说清楚。我相信楼主讨论的诚意。

                  tctcab 我蛮夷也。我就是说冷漠混帐话的钢铁直男

                  我很理解你为什么会这样说(我有时候也会这样说自己),但我以人格担保楼主绝对不会这样看你。也请你不要给自己贴标签。

                  好了,我暂时说完我想说的了,接下来大约十五小时内我不会上网,在我不在的时间里,衷心希望这事能好好收场,争取把这个帖子做成性别问题讨论里的积极案例(确实是消极的太多了,可能已经让大家失去了信心)。

                    tctcab

                    那么如果我本来发言的这句话:

                    唉,话说统计之都的坛友是不是九成都是男性啊。竟然没有一个人跟我一样,最开始看到这个下降趋势的时候第一反应是愤怒几秒钟么?虽然说生气也没撒用,可是我觉得好像已经很久没在(国内)主流视野里见过有人讨论性别不平等的问题了。

                    换成别的指标,比如猪肉涨价,如下:

                    唉,话说统计之都的坛友是不是九成都是男性啊。竟然没有一个人跟我一样,最开始看到猪肉涨价的时候第一反应是愤怒几秒钟么?虽然说生气也没撒用,可是我觉得好像已经很久没在(国内)主流视野里见过有人讨论猪肉涨价的问题了。

                    你也还是会质疑我是在“打拳”嘛?

                    或者如果我说,我以为在论坛里是我这个人类和其他人类在讨论问题,只是大家性别不一样,刚好我是女性,并且我曾经为这个内容愤怒过几秒钟,我很好奇是否因为我是女性而更加容易对这个内容感到愤怒,而男性便更加不容易对这个内容感到愤怒呢,因此我作出以上发言,你也还是会质疑我是在“打拳”嘛?

                    或者我没有那样描述,而是换成这样描述:

                    喂,小伙伴们,我发现我为这个事情愤怒了几秒钟诶,我很好奇男同胞们是不是不会像我这样容易对这件事情而情绪化。俺当然知道生气也没撒用啦,不过我好像很久没有在主流视野里见大家讨论这个问题了诶。

                    你也还是会质疑我是在“打拳”嘛?这里我说很久没见主流视野里讨论这个问题,也并不是想大家在论坛上讨论这个问题,只是我写着写着顺道写出了这样的感慨。

                    想想为什么会有不止一个人在说打拳

                    这里你的意思是否等同于不止一个人在说我是“打拳”?即便我已经解释过我确实曾经愤怒过,但我以上发帖回帖均是在心境平和的状态下写的,你也依然认为只要为这件事“愤怒过”的女性就等于是在“打拳”?也依然认为我有过愤怒的情绪,便等同于我所有行为都是非理性的、都是在“打拳”?

                    这几年我倒确确实实看过不少女性意识觉醒的文章,不过我自己从未对“女权”或者“女拳”有过定义,因此在这个帖子下我也从未认为自己是在“打拳”,因为我脑子并没有产生过这样的念头。

                    其实最初我都没想过要靠论坛上的人的帮助来对这份数据溯源因果什么的,我只是发现了一份不合乎我的认知的数据,先丢到论坛上看看再说,说不定能帮我拓宽思路。

                    而且我对统计之都论坛是有些情感的,在此之前我一直都觉得这里氛围很好,我对tc君的印象也很好,我总觉得大家都很善良所以不会恶意揣度我的,我在描述我的想法时也没有任何防备心理,有过愤怒就是有过愤怒,有过感动就是有过感动,自然也没想到别人看到会有别的想法之类的。这次歪楼了以后我也跟着大家的思路走了,一直在试图解释。直到tc君质疑我是在“打拳”,我终于后知后觉地发现原来大家都在质疑我是在“打拳”了。我的答案说完了。

                    也许之后我会开始思考“女权”、“女拳”、“打拳”等等更加本质的东西,哪天真得心怀恶意跑到哪里去打拳也说不定。

                    tctcab
                    tc君,我也希望你能把你思考的东西写出来。而且你刚才回复的内容我也都看到了,憋回去不会觉得难受么。讲真,我昨晚看到你的质疑,直接气哭了好嘛。哈哈哈,但我现在依然是在心境平和的状态下回帖的。我凌晨三点还爬起来写了一篇博客都说我没有这样想啦……记录和吐槽这件事……

                    我后来又想了想关于善与恶、动机、行为之类的东西,但也没想出来撒……但我意识到,也许我们应该先跳开这些,先讨论一下“打拳”的定义和本质,所以我问你和列弛对“打拳”的定义是什么。

                    yuanfan
                    这词是我先提的,TC 大概只是顺着我的话沿用了一下。

                    这是个网络词,意思是很负面的。我用它是意在指出这类研究可能会被错误运用的场景。不过这并不针对这里任何人的发言,没有诛心的意思。原因也简单:首先,我不认为这里的言论涉及“打拳”;其次,就论坛这点流量,真正的“拳师”根本就不会来。

                    yihui 我表个态吧,我个人非常反对使用“打拳”这个词,它听起来非常难听。以我的经验,在辩论中一旦使用抽象的标签,这辩论就不容易有实质进展,因为标签实在是太能调动人的情绪了,一般人都扛不住被贴上带贬义的标签(我自己深受其害)。

                    完全正确,这是个非常难听的词。我国的女性权益还有很大的提升空间,光我知道的就有很多优秀的女性在求职的时候被问到是否结婚了,如果结婚了,近期是否有生育的计划等问题。因为担心被刷下来,她们中有的不得不表态一切以工作为先。我认为应该有更多的人关注这些出于性别的歧视,也很敬佩那些为了女性权益而奋斗的人。但也有一些人借性别议题挑动对立,这种人对女性权益贡献很小,但对生成舆论的负面情绪贡献极大,所以谓之“打拳“。用这个词就是为了将这类人与那些真正在为性别平等奋斗的人区分开。

                    tctcab 哈哈哈,别小看了自己,你这个直男程度的起码是金刚钻水平的。不过,一两百斤的金刚钻,走到哪里都是人间瑰宝。挺好的:)

                    tctcab 其实不说了好点。这个问题继续讨论下去没有什么意义,不会有建设性结果,且大概率只会积累负面情绪。刚才的帖子是我删的,不好意思。

                    “为了防止世界被破坏 为了保护世界和平 贯彻爱与真实的邪恶.......”

                    说正事,我记得以前有个版主标签,是供小闪电交流的,但不知道为什么找不到了。

                    yihui 楼主原来是女性……我以为整个帖子里所有人全是男性……所以我都不好意思回复你前面说这个帖子里“相当失调”明明是全男生……