倒数的诚信与消失的变量
- 已编辑
作者声称 “Both non-experts and professional economists were unable to predict this result.” 但是我觉得他们的主要结论可以从 Mazar et al., 2008 的工作中引申出来。Cohn 等人引用了 Marzar 的结果(文献 7),但只是轻轻带过。唉,这样做不好。
这论文的实验规模浩大,但是感觉比之于 Dan Ariely 教授设计的一系列行为心理学实验,则显得颇为粗笨。而且,如你文中指出的,个别结果是灰石大瑕。
这篇文章在补充材料里提到了家庭联系度与归还率负相关,但家庭联系度只是个引子,跟文化关系很大。举个例子,如果前台拿到钱包,在东方文化或有集体主义传统的国家里转上级或送警察局是理所当然的,根本就不会打开看,也就没有后面邮箱联系那些事,因为这属于领导或专家拿主意的,而转交后可能到今天领导专家都没工夫管,钱包被遗弃在角落里至今都是薛定谔的猫态;西方文化更注重个人主义,打开看一下,自己能办就办了,研究设计者应该考虑这种滞后性与习惯差异,这也是跨文化研究必须考虑的。
关于加入变量系数反转,可以看成辛普森悖论的回归分析版本,印象中丁鹏老师因果分析那一系列文章里讨论过,今年 R 语言会议吴喜之老师的大会报告也有部分涉及。这个情况在公卫研究里特别常见,公卫那边是另一个极端,蜜汁相信线性模型并会直接不分青红皂白先控制一大堆变量例如抽烟、年龄、BMI 啥的,但有些其实跟响应变量没有任何关系,无关变量加入后提高了模型整体的方差或噪音,反而把信号给掩盖或扭转了方向。模型选择上必要的探索性分析或描述性分析是必要的,例如这篇论文诚信度用邮件回复率来表示就得控制那些可能直接影响回复率的东西排除干扰,不过性别年龄这些可以考虑用 BIC 来看下影响究竟大不大,有时候逻辑上有联系的东西实际可能没联系或者没找对合适的控制变量反而增加了模型的复杂度。这篇论文的实验设计就很难回答其提出的问题,相当于仅用考研笔试成绩来预测录取结果,虽然有关系,但面试那块的不确定性如果非常大,很有可能得出较低的笔试成绩能获得录取的结论。
嗯,我也觉得把是否收到邮件和诚信度联系起来是最大的bug。 既然是社会科学的实验,那么撇开数据统计等后期不谈,先从实验设计是否反映现实的角度分析。 从丢失者的角度,当第一时间发现钱包不见了,常识判断要不就是被偷了要不就是掉了,然后原路返回,如果没找着紧接着就去附近的失物认领问问,所以原地不动更有利于归还。而从捡到钱包者的角度来说,除了文中提到的7点潜在因素外,还有几点可以考虑:
- 名片的普及度:一般来说钱包里的名片都是参加社交或会议上别人给的名片或联系方式,不太常见把自己的名片放在钱包里。或者这种只留邮件不留手机号码也不常见,一般都是通讯方式是手机。所以捡到钱包者(失物认领处工作人员)极有可能误会名片不是丢失者本人的。
- 投掷(丢)钱包的时间: 如果是上班时间的话路上行人可能大多不是中青年上班族,那么捡到钱包者本身有手机而且手机连邮箱的可能性非常低,所以一个人名义联系失者的基本不现实。
- 手机连接邮箱的普及率:首先邮箱并不是主流联系方式文中已有讨论,其次即使在美国,一般来说有工作(学校)邮箱和私人邮箱之分,手机基本上连的工作邮箱。用工作邮箱处理这类杂事并不是很多人情愿的,而用私人邮箱的话要登录,而且用随身电脑的话还要考虑有没有WI-FI。
- 失物认领地点:可能不是每个人想到这些失物认领的场所,比如银行。在大城市这些机构和前台说句话都要排半个小时对,也不是每个人有这个时间。于是更现实的是交给安保,那么安保配电脑以及会使用邮箱的概率就要考虑进去了。
仔细想想这些细节的话用邮件联系失者的成本非常高,而且每个国家国情都不一样,所以这个实验首先不一定反应现实,其次从是否收到邮件和诚信度挂钩有点过。如果从收到的钱包中看看钱有没有少(少了多少)可能会是一个好玩的角度。:)