倒数的诚信与消失的变量

COSeditor

https://cosx.org/2019/06/civic-honesty-and-ignored-variable/

Liechi

作者声称 “Both non-experts and professional economists were unable to predict this result.” 但是我觉得他们的主要结论可以从 Mazar et al., 2008 的工作中引申出来。Cohn 等人引用了 Marzar 的结果（文献 7），但只是轻轻带过。唉，这样做不好。

这论文的实验规模浩大，但是感觉比之于 Dan Ariely 教授设计的一系列行为心理学实验，则显得颇为粗笨。而且，如你文中指出的，个别结果是灰石大瑕。

yufree

这篇文章在补充材料里提到了家庭联系度与归还率负相关，但家庭联系度只是个引子，跟文化关系很大。举个例子，如果前台拿到钱包，在东方文化或有集体主义传统的国家里转上级或送警察局是理所当然的，根本就不会打开看，也就没有后面邮箱联系那些事，因为这属于领导或专家拿主意的，而转交后可能到今天领导专家都没工夫管，钱包被遗弃在角落里至今都是薛定谔的猫态；西方文化更注重个人主义，打开看一下，自己能办就办了，研究设计者应该考虑这种滞后性与习惯差异，这也是跨文化研究必须考虑的。

关于加入变量系数反转，可以看成辛普森悖论的回归分析版本，印象中丁鹏老师因果分析那一系列文章里讨论过，今年 R 语言会议吴喜之老师的大会报告也有部分涉及。这个情况在公卫研究里特别常见，公卫那边是另一个极端，蜜汁相信线性模型并会直接不分青红皂白先控制一大堆变量例如抽烟、年龄、BMI 啥的，但有些其实跟响应变量没有任何关系，无关变量加入后提高了模型整体的方差或噪音，反而把信号给掩盖或扭转了方向。模型选择上必要的探索性分析或描述性分析是必要的，例如这篇论文诚信度用邮件回复率来表示就得控制那些可能直接影响回复率的东西排除干扰，不过性别年龄这些可以考虑用 BIC 来看下影响究竟大不大，有时候逻辑上有联系的东西实际可能没联系或者没找对合适的控制变量反而增加了模型的复杂度。这篇论文的实验设计就很难回答其提出的问题，相当于仅用考研笔试成绩来预测录取结果，虽然有关系，但面试那块的不确定性如果非常大，很有可能得出较低的笔试成绩能获得录取的结论。

Jiena

嗯，我也觉得把是否收到邮件和诚信度联系起来是最大的bug。既然是社会科学的实验，那么撇开数据统计等后期不谈，先从实验设计是否反映现实的角度分析。从丢失者的角度，当第一时间发现钱包不见了，常识判断要不就是被偷了要不就是掉了，然后原路返回，如果没找着紧接着就去附近的失物认领问问，所以原地不动更有利于归还。而从捡到钱包者的角度来说，除了文中提到的7点潜在因素外，还有几点可以考虑：

名片的普及度：一般来说钱包里的名片都是参加社交或会议上别人给的名片或联系方式，不太常见把自己的名片放在钱包里。或者这种只留邮件不留手机号码也不常见，一般都是通讯方式是手机。所以捡到钱包者（失物认领处工作人员）极有可能误会名片不是丢失者本人的。
投掷（丢）钱包的时间：如果是上班时间的话路上行人可能大多不是中青年上班族，那么捡到钱包者本身有手机而且手机连邮箱的可能性非常低，所以一个人名义联系失者的基本不现实。
手机连接邮箱的普及率：首先邮箱并不是主流联系方式文中已有讨论，其次即使在美国，一般来说有工作（学校）邮箱和私人邮箱之分，手机基本上连的工作邮箱。用工作邮箱处理这类杂事并不是很多人情愿的，而用私人邮箱的话要登录，而且用随身电脑的话还要考虑有没有WI-FI。
失物认领地点：可能不是每个人想到这些失物认领的场所，比如银行。在大城市这些机构和前台说句话都要排半个小时对，也不是每个人有这个时间。于是更现实的是交给安保，那么安保配电脑以及会使用邮箱的概率就要考虑进去了。
仔细想想这些细节的话用邮件联系失者的成本非常高，而且每个国家国情都不一样，所以这个实验首先不一定反应现实，其次从是否收到邮件和诚信度挂钩有点过。如果从收到的钱包中看看💰钱有没有少（少了多少）可能会是一个好玩的角度。:）

ape

今天又重新看了下讨论，发展至今的4篇论文，最开始那篇这几年引用超过300，随后的文章引用不超过10，感觉很马太效应：

后续争议要点如下：

City-Level vs. Province-Level Collectivism:
Tannenbaum说YAC 使用的是城市一级的collectivism，因此与city fixed effects产生了完美的multicollinearity，而使集体主义预测钱包安全的结论失效。YAC反驳说province-level ，不是city-level，因为一省内的多个城市共享相同的省一级的collectivism score

是否能从调查数据中解读社会规范？

Tannenbaum说YAC既赞成发送电邮又赞成保管电子邮件的受访者（58%）比只赞成保管的受访者（27%）要多，因此表明发送电邮也是一种规范。YAC反驳则说与电邮（61.52%）相比，更多的人赞同一般性的安全保管（84.59%），因此安全保管是一种更突出的规范。
国内"保管 "是更基本或更有力的规范，并且与集体主义文化可能优先考虑的更为被动且避免伤害的方法（保管）。而非主动且个人主义的方法（发送电子邮件）的观点相吻合。

模拟缺失项目：
Tannenbaum说YAC对 "有钱 "和 "没钱 "两种情况下丢失物品的比较存在缺陷，因为有钱的钱包可能会丢钱，而没钱的钱包则不可能，这种设计本身就会使结果产生偏差。YAC回复说他们承认此问题，但也说 Tannenbaum 的模拟包括理论上不可能发生的情况：没有钱的钱包里的钱不见了。

现在核心问题在于发science的那篇文章对强行联系“发邮件”跟“诚信”的联系是否有根本缺陷。并且其他研究人员如果不仔细搜索，也不知道后续还发了3篇（虽然我仔细搜了，但也不知道是不是仅仅这几篇）。如果大家都用第一篇最初的，只会加大马太效应。science是否有义务把其他3篇讨论也放上来？研究人员在引用的时候是否只需要引第一篇，而忽略其他3篇？

文章：

Civic honesty around the globe (2019 )
https://doi.org/10.1126/science.aau8712
Unraveling controversies over civic honesty measurement: An extended field replication in China (2023)
https://doi.org/10.1073/pnas.2213824120
A closer look at civic honesty in collectivist cultures (2023)
https://doi.org/10.1073/pnas.2313586120
Reply to Tannenbaum et al.: Constructive dialogue advancing research on civic honesty (2023)
https://doi.org/10.1073/pnas.2316228120

https://www.science.org/doi/10.1126/science.adk1877 Collective passive protection