yihui 是这个理,我们也乐于看深度访谈?
访谈芝加哥大学博士生秦旭
谢谢师兄!读《资本论》等经典著作的核心章节,对我的影响主要是思维方式上的。《资本论》从辩证唯物主义的角度揭示了资本的运行规律,其论证的严整、内容的宏富,令人叹为观止。
我的论文委员会老师对我的影响不仅是学术层面的,他们的为人以及对待生活的态度都为我树立了很好的榜样。尽管他们在各自的研究领域都已拥有相当的影响力,但和他们相处,他们的谦逊、平和、真诚、善良,令我肃然起敬。这是做人的一种境界。除了潜心学术,Prof. Raudenbush和Prof. Hedeker还爱好音乐,其中Prof. Hedeker和包括Prof. Michael Jordan、Prof. Jennifer Hill在内的其他一些统计学家组建了名为The Imposteriors的乐队,每年都会在诸如JSM的统计会议上表演。我觉得有这样的爱好,使生活变得更加丰富多彩的同时,人的思维也会更加灵活。
我对教学的热爱,主要源于父母的影响。我的父母都是很优秀的教师。我上高中的时候,爸爸教过我一年,让我充分感受到了爸爸上课的魅力,在家里更能天天感受到他以教学为乐的状态。我期望也能像爸爸妈妈那样传道受业解惑,每天工作着并快乐着——这,就是我理想的人生。
XuQin 哈哈,我听说过那个乐队,原来你的论文委员会老师中还有那个乐队的成员,厉害啊。
所以你的教学热情很早就已经播下种子了;有热情的人真的是非常有感染力。
2016年你因为“Analyzing heterogeneous causal mediation effects in multi-site trials with application to the National Job Corps Study”这篇论文获得了美国统计学会的学生论文奖,可否谈谈你的获奖经历、心得以及你的论文主要解决的问题?
很抱歉因为搬家和其他一些事情,没能及时回复。
这篇论文主要解决的问题是在多地试验(Multi-site Trials)中,从因果干预机制(Causal Mediation Mechanism)的角度探究因果效应在各地之间存在差异的原因。 这是我毕业论文的雏形。研究对象是一个名为Job Corps的美国教育培训项目,该项目面向弱势青少年群体,旨在通过为期一年左右的职业和教育方面的综合培训提升受训者的就业竞争力。Job Corps在全美有100多个培训中心,研究者将各个中心的申请者随机分入实验组(进入该项目学习)和对照组(不得进入该项目学习,但可以参加其他同类项目),进而探究该项目的因果效应。初步研究发现,从平均水平来看,被分入该项目的青少年四年后的年均收入显著高于对照组,然而,这一效应在各个培训中心之间存在显著的差异,也就是说,有的培训中心和对照组在提升收入方面并无显著差异,有的培训中心甚至还不如对照组。为了进一步探究其中的原因,在我的导师和毕业论文委员会其他老师们的指导下,我从因果效应背后的形成机制入手,尝试开发新的统计方法。Job Corps旨在通过提升受训者的教育素养和职业技能,最终使其在就业市场上占有一席之地。换言之,教育素养和职业技能的提升是Job Corps(因)在对受训者收入(果)产生影响的过程中的重要中介变量(Mediator),我们将“因”通过Mediator对“果”产生的效应定义为间接效应(Indirect Effect)。与此同时,Job Corps还提供了其他服务,例如医疗保障、心理咨询、社交技能培训等,以提升受训者的软实力,我们将“因”通过除Mediator以外的其他中介要素对“果”产生的效应定义为直接效应(Direct Effect)。由此,总因果效应被分解为间接效应和直接效应。为了探究之前所提到的总因果效应在各个培训中心之间存在显著差异的原因,我们想要进一步剖析这一差异主要是存在于间接效应中还是直接效应中,进而找到改进项目的突破口。然而,目前尚没有方法可以从因果推断的角度严格解决此类问题,研究者往往忽略了“因”和Mediator之间潜在的交互作用(Interaction),以及Mediator和“果”之间潜在的混杂因素(Confounders)。 为了填补这一空白,我完成了这篇论文,最终发现,通过提升受训者的教育素养和职业技能,所有的Job Corps培训中心都能够以类似的幅度显著提升其收入水平,然而,各个培训中心通过其他服务对受训者收入产生的影响却存在着显著的差异。因此,项目管理者欲实现各个培训中心的齐头并进,需缩短各中心在为提升受训者软实力所提供的服务上的差距。当然,我们还可以更深入地剖析因果效应背后的形成机制,这是我今后的研究方向。
在完成这篇论文后,由于知道身边有的老师曾获得过美国统计学会的学生论文奖,我也想尝试一下,就报了名。
能够获得这个奖,对我来说是一种鼓励,后来在老师们的指导下进一步完善论文,最终将其发表在Journal of Educational and Behavioral Statistics上( http://journals.sagepub.com/doi/full/10.3102/1076998617694879) 。
通过这篇论文,我对科研有了较深入的认识,其过程远大于结果。其间,一次又一次和导师及其他老师讨论,每次投稿后得到Reviewers的反馈,再做进一步修改,这是非常宝贵的。
- 已编辑
师兄提的这两种情况我都经历过。
探索创新的过程就如同走一条前人没有走过的路,有的时候的确会遇到阻碍,无法继续前进,由于不知道这条路是否走得通,会经历一段迷茫的时期。比如刚开始的时候,我按照常规的最大似然法(MLE)估计直接效应和间接效应,通过模拟发现在很多情况下其标准误(Standard Error)的估计值都是有偏的,但是找不出问题的根源,我曾犹豫是否应该按原路继续走下去。有的时候良好的直觉可以帮助研究者在困难时期做出正确的判断和选择,而直觉是建立在经验的基础上的,对于刚刚开始从事研究工作的我而言,并不具备这样的素质,和具备良好直觉的人多交流就变得至关重要。在向经验丰富的老师们请教的过程中,我发现,问题出在两步估计上。在我的研究中,直接效应和间接效应的估计是基于另一个估计量的,因此,在估计前者的标准误时,必须要考虑后者的不确定性。通常的解决办法是利用Bootstrap估计标准误。可是由于多水平模型的拟合比较耗时,如果将Bootstrap的次数设置为1000,得到最终结果将需要5个小时,尽管平行计算可以大大节省时间,但绝大多数社会科学学者并不具备这样的资源,如果能够推导出标准误的估计量,效率将大大提高。通过进一步交流,我了解到Newey(1984)将两步估计中每一步的moment function叠加在一起,由此将两步估计转换为一步估计的问题,根据Hansen (1982)提出的Generalized Method of Moments (GMM)(Lars Peter Hansen因此获诺贝尔经济学奖)最终推导出各步估计量的标准误。然而,在多水平模型领域,这一方法从未被开发过,于是,我明确了下一步的研究方向。由此,老师们的指点帮助我找到了障碍的源头、坚定了前行的信念,在一篇经典论文的启发下,呈现在我眼前的路变得更宽、更清晰了。在明确了方向之后,我通过大量阅读加深对多水平模型和Newey(1984)的理解,从而找到了在多水平模型领域拓展Newey(1984)的突破口。
我越来越深刻地体会到,做研究是一个不断学习积累的过程,经验和视野是创新突破的重要因素。
- 已编辑
我觉得科研与生活的平衡是保持头脑灵活、研究高效的重要保障。我周边的绝大多数人每天或者每周至少要抽出一段时间做研究之外的自己感兴趣的事情,比如,我的导师每周工作日都坚持每隔一天游泳半个小时。我在读博士期间也是比较注重科研与生活的平衡的,否则思想会变得僵化,身体也会吃不消。每天适量的运动必不可少。时间比较充裕的时候,我喜欢在密歇根湖边骑自行车、去体育馆打羽毛球、游泳或是跳健身操,高中和大学的时候练过跆拳道,到了美国条件不允许,就没有再继续练了。忙的时候,为了保证运动量,我每天都坚持花20分钟快步走路去学校,再花20分钟快步走路回家。除此之外,平时一日三餐,基本都是自己做的,周末如果有时间的话会做一些中式面点。手艺一般,完全就是当作一种休息,忙了一天回到家,很累了,也没有精力再思考问题了,这个时候花半个小时做点儿想吃的东西,还是很有成就感的。上学回家的路上或是做饭的时候我喜欢听美国国家公共电台(NPR)的广播,包括新闻和例如Hidden Brain、TED Radio Hour的栏目,其中HB是通过讲故事的方式讲述社会科学领域的一些话题、探索人类大脑的秘密,TRH是大家熟知的TED的广播版,将演讲和台下对主讲人的采访融合起来,更加生动、深入。我还喜欢听国内一个叫做“得到”的罗辑思维出品的APP,它的理念是碎片化学习,旨在扩展认知、拓宽视野,其中吴军(前腾讯副总裁,现为Google中日韩文搜索算法主要设计者)的《硅谷来信》知识性和思想性很强,让我受益匪浅。周末闲暇的时候,我也喜欢看看电影或是类似于《中国新歌声》(原《中国好声音》)的节目。随着生活节奏越来越快,科研与生活的平衡变得越来越不容易掌握,但却变得越来越重要,健康的身体、愉悦的心情和宽广的视野是从事科研的重要保障。
XuQin 这简直是模范博士生的节奏!估计多数博士生看到这里如此健康又有思想的生活都要得思过崖反省了:我是谁,我在哪里,我这几年都干了些什么……
完全同意下厨是休息的看法,我也有这一点小爱好,虽然也是能力一般水平有限。尤其是面食对我来说有些魔法性质,很有意思,比如花卷、油条、蛋糕、发糕等。
你说的 Hidden Brain 我几周前刚从我们公司另一个人口中听说,我不太听广播,所以以前也不知道这个节目。不过听了一期 You 2.0: The Value Of 'Deep Work' In An Age Of Distraction,觉得还挺好的。那说到碎片化时间,你对时间的碎片化感到困扰吗?我个人一直在尝试避免接触太多让我的时间碎片化的东西,但这个尝试在多数时间里都是失败的,所以我还是很困扰的。用在交通和做饭上的时间碎片是被动碎片,不太能避免,所以有利用价值;我的困扰是我有好多主动碎片,不知道是不是被众多号称“利用碎片化时间”的工具给坑了,我感觉越是去利用碎片时间,时间就越碎,而对我而言,要完成一件大事,必须得保证每天有足够长的连续时间段。你的科研过程中(比如写论文时),是否存在你需要特意保证或克制自己不受干扰的情况?换句话说,你是一个本身就意志力比较强的人,还是有通过什么手段来集中精力?
师姐果然是模范博士生…
先自我介绍一下,我叫蔡锐,也是人大统院的本科毕业生,16年毕业,现在在宾州州立读统计学PhD。师姐聊到做饭的问题,一日三餐竟然都是自己做的!佩服,佩服。想问师姐是中午带饭到学校吃吗?还是回家做?如果晚饭也回家做的话,岂不是要下午五六点就要回家了?如果五六点就回家做饭不再想科研问题了,该如何保证科研时间?
我也很好奇师姐对于碎片化时间的掌握…
现在应该已经是秦教授了吧!
yihui 不敢当。
其实师兄提到的那一期Hidden Brain讲的就是如何掌控时间。在现在这个对互联网高度依赖的时代,我们几乎每天都不可避免地要面对来自手机、电脑的各种讯息,时间碎片化已经成为一种普遍现象。然而,无论做任何工作,想要取得一定创新性的突破,都需要有整块的时间进行深度学习和思考,正如师兄所说,“要完成一件大事,必须得保证每天有足够长的连续时间段”。
在父母的培养下,我从上小学开始就有制作时间表的习惯,它成为我管理时间的重要方法,这让我受益匪浅。每个学期初我都会规划这个学期需要完成的研究任务,明确了目标,做研究的时候就从容了许多。我每天早晨起来都会在Excel表格中列出当天要完成的任务,并按照重要程度和难度排序,把一天当中头脑最清醒的时间留给最重要和最难的事。我会估算一下完成每项任务需要的时间,列出一个具体的时间表。我会安排休息的时间,除此以外的时间,我不会浏览网页或是看手机,偶尔有克制不住的情况,我会把网断开。在完成每项任务的时候,除非有重要的邮件需要及时回复,我一般不会被干扰。保证时间的完整性是我集中注意力、进行深度思考的重要保障。但是人的注意力会随着连续工作时间的增长而递减,为了提高效率,间歇性的适当休息非常有必要,否则,可能会因脑力下降而停滞不前或犯错,得不偿失。这时就到了“帮助‘利用碎片化时间’的工具”发挥作用的时候,如何能让其作用最大化,就要靠自己的意志力了,我会克制自己不超过十分钟。有的时候,由于任务的难度超出了我的预估或是出现了新的问题导致了超时,影响了后面的计划,我会对时间表进行适当调整,把当天急需完成的任务往前排,其他任务如果完不成也没关系,我会把它们挪到第二天的时间表上。一天中可以安排的任务其实是有限的,大多时候,我每天只钻研一个研究项目,循序渐进,偶尔会将两项相关的研究项目交替或依次进行。这样安排下来,每天都会有所进展,尽管很难如愿完成所有的任务,但是如果能在每天精力最充沛的时候把最核心的事情高效地做完,就能够保证按部就班地完成学期初的规划了。
- 已编辑
XuQin 你说的这个时间管理的方式我已经在无数篇讲时间管理的文章中看过,但今天是我头一次见到在我认识的人里面有人真的按这种方式去实践,所以归根结底,我(以及大多数有时间管理问题的人)的问题就是,“道理我都懂,就是不去做”。好,从今天起我也开始学习使用时间表,每天晚上计划一下第二天的事情。立个军令状在此,看能坚持多久。
我的访谈问题比较随意,想到哪儿我就问到哪儿,你也随意回答就好。
这两天适值我们的母校中国人民大学 80 周年校庆,那我再回到人大的话题上。在人大学习期间,除了赵老师之外,你可否再谈谈其他对你影响比较大的老师?可以是专业上的影响,也可以是非专业的(一位或两位就好)。对我自己而言,有好一些老师都深刻影响了我,比如王星老师的连珠炮提问(会不断激活惰性思维)、杜子芳老师的习惯性辩论、黄向阳老师的不轻信权威的精神(吴喜之老师也一样)以及研究问题的别样角度、李静萍老师的细致以及社会责任感、薛薇老师对学生润物细无声的关怀,等等。
- 已编辑
yihui 其实师兄提到的每位老师的授课对我走上科研的道路都起到了重要的铺垫作用。除了赵老师以外,我因为参加研究项目接触得比较多的是蒋妍老师、李静萍老师和吕晓玲老师。蒋妍老师是我在大二和同学组队参加创新杯时的指导老师。除此以外,她的抽样理论课别具一格。蒋妍老师采用国外的授课方式,将她在国外访学时学习过的经典教材作为课堂教材,在第一堂课前给我们发整学期的授课计划,临近期末的时候还设计了一个很有新意的小组合作项目,能够设计出估计精度最高的抽样方案的小组每位成员会被奖励一张电影票,提升了大家学习的兴致和合作的积极性。李静萍老师是我在大三和同学组队参加国家创新性实验计划时的指导老师,正如师兄所说,李老师很细致,脸上总是带着亲切的笑容,让学生感到很温暖。毕业以后,加了李老师的微信,了解了她生活中的一面,我很喜欢读她时常在朋友圈发的随笔,有一些甚至是我们生活中都注意不到的小细节都会在李老师的笔下化作一番意味深远的感慨,字里行间透露出的细腻、朴实、幽默让我感受到了她的魅力。吕晓玲老师是我在第一则回帖中提到的“中美大学生创造力比较项目”中除赵老师、王老师以外的另一位主要负责老师。我们这一届是吕老师带的第一批学生,她在我们身上倾注了很多,她给我们上的第一门课是数理统计,下了很大的功夫,给我们打下了良好的基础。因为吕老师年龄和我们比较接近,她给我们的感觉就像大姐姐,课堂上的她是传道受业解惑的师长,课堂外的她是我们的朋友,我很感激她在我准备出国的时候给我提供了真诚的指导和建议。另外,我们这一届非常有幸赶上了吴喜之老师开课,吴老师的统计软件应用课为我们开启了R的大门,帮助我们奠定了扎实的R应用基础,我想这门课对继续从事和统计相关的同学来说,影响都是深远的。吴老师还教授了很多数据挖掘的方法,让我们大开眼界。为了加深我们的理解,做到活学活用,吴老师提供了一些数据供我们选择,每个人根据数据特点和研究问题选择适用的方法分析,并上台讲解,很多同学都有精彩的表现。这项课程作业很好地培养了我们的研究素养,为了找到最优的方法,大家在课下查阅各种资料,有的甚至做模拟进行方法比较,拓宽了视野的同时,也提升了对统计和科研的兴趣。生活中给我留下深刻印象的老师还有高敏雪老师。研究生一年级的时候,赵老师提供给我和其他几位同学去爱尔兰参加国际统计大会的宝贵机会,高敏雪老师同行,因此有幸和高老师一起吃饭散步。她和我妈妈的年龄相仿,她慈祥真诚的笑容总让我觉得很亲切很温暖,在风趣地聊天的同时,她会语重心长地给我和同学们讲一些做人做学问的道理,令我肃然起敬。还有很多教过我的老师我没有提到,每位老师都有自己独特的授课风格和人格魅力,都对我的成长产生了影响,在我的生命中留下了抹不去的印记。我很庆幸自己选择了人大统计,结识了这么多优秀的老师和同窗,我为自己是人大统计人感到骄傲。
XuQin 首先感谢你前面分享的时间表经历。虽然我还远达不到你的水准,但你是第一个激发我做计划的人。过去这一个月,我每天晚上最后一件事都是花几分钟想一下第二天做什么并写下来,第二天尽量对照执行(虽然也经常被人带歪)。碰巧我前段时间也刚看完《最重要的事情,只有一件》(The One Thing)这本书,里面对我最有启发的是“从 E 到 P”(用苦力模式办事和有目标性地办事),跟你的规划时间表是一个道理。
你对这些老师的描述很是令人动容,也触发了我的很多回忆。我没上过蒋老师和高老师的课,不过我在人大时跟蒋老师做过很长时间的项目(算是我的三脚猫 R 功夫头一回得到了实践考验),而且她在美国访学正是在我的母校,当时我们住得很近,所以也算熟;她确实思维比较开阔。至于高老师,我只是多次从别的同学口中听说她酷爱读书;虽然不是铁律,但我感觉凡是爱读书的老师,都会自带气质光环。看了你对李老师的描述,我都想加微信看看她的朋友圈(虽然我已经戒掉微信朋友圈一年多了)。吴老师就不必说了,要是没他,我的人生轨迹可能会完全不一样,也不会有这个统计之都论坛以及中国 R 会议。今年夏天学院召集校友写院庆文章时,我是很想写一篇的,但时间有限就作罢了;借这个机会倒是可以说一下我的核心想法:我觉得人大统计学院的老师给我的总体感觉是亦师亦友,即使是跟有行政职务的老师打交道,也不会感受到他们的行政头衔。这大概是学校里最积极纯真的师生关系了。
前面已经谈了你的研究生和本科阶段,那不妨再谈谈更早的时期。如果不介意的话,可否给我们聊聊你的高中生活?我之所以想了解,是因为两点:一是你为什么选择了统计系;二是你作为一个理科生,似乎对一些思想性的东西也很有兴趣。
想不到访谈还可以横跨三个月…