今天我们很高兴邀请到秦旭 @XuQin 来 COS 论坛作客。秦旭在中国人民大学统计学院念完硕士之后,出国到了芝加哥大学念博士(Department of Comparative Human Development)。我们在人大的时候是同一个导师(赵老师),不过因为年级相差略大,过去也没有太多的交流,但我感觉秦旭走的这条学术道路跟多数统计毕业生都不太一样,所以今天特意请她过来跟大家聊聊她的求学的经历以及找工作的经验之类的话题。她的个人主页在:http://home.uchicago.edu/~xuqin/

那请秦旭先跟大家简单介绍一下自己吧。话说你们这个系名“比较人类发展学”是几个意思?也帮我们稍微科普一下吧。

顺便我来吼一下你当年的同班同学们来捧场:@Ihavenothing @潘岚锋 @kimboo @fangy @jah_et 还有谁来着。

来了来了~
搬个板凳围观,主角怎么还没上场?

大家好!不好意思来晚了。谢谢谢益辉师兄的邀请,很高兴和大家交流。我的本科和硕士都是在中国人民大学统计学院读的。由于人大人文社会科学的氛围浓厚,从大一起我就参与了学院组织的诸如宿舍满意度调查、北京市居民房屋质量调查的社会调查活动。进入大二大三,我开始和同学组队参与创新杯、国家创新性实验计划等科研竞赛,以一个社会问题为出发点,例如大学生就业期望及其影响因素,亲身体验了从问卷设计、抽样调查到数据分析的全过程。就这样,在学习统计理论知识的同时,我对统计应用的兴趣越来越浓厚。随着研究经历的丰富,我越发深刻地体会到,统计方法开发的源动力是为了更高效深入地研究实际问题,当统计方法和实际问题结合起来的时候,它的价值和魅力才得以彰显。从本科学年论文、毕业论文到硕士毕业论文,我都有幸得到赵彦云老师的悉心指点。在这个过程中,赵老师还提供给我和其他同学很多宝贵的研究机会。是赵老师的鼓励和引导,坚定了我走上科研道路的决心。对我影响最大的是一个中美大学生创造力比较的项目,这个项目是和圣母大学的王丽娟老师合作的,从阅读大量关于创造力研究的文献开始,我们选取修改量表、设计调查方案、组织培训学生收集数据、尝试用不同统计方法多角度分析数据,我有幸参与了每个环节。这个宝贵的过程培养了我对科研的严谨态度,也使我对未来的发展方向越发清晰。就这样,我在博士申请的时候,选择了教育统计方向,希望能够在开发统计方法的同时,更加深入地研究教育问题。教育数据结构往往是多水平的,比如学生嵌套在班级中、班级嵌套在学校中,同时在社会科学研究中,人们往往不满足于相关关系,而是更关注因果效应,因此我希望从事多水平模型和因果推断方法开发的研究。我了解到芝加哥大学社会科学学部比较人类发展系的洪光磊老师的研究方法和我的兴趣高度匹配,很幸运,洪老师给了我跟她学习的机会,就这样,我开始了我的博士学习生涯。

我在芝加哥大学接受的教育非常注重学科交叉。社会科学学部由人类学系、经济学系、历史系、政治科学系、心理系和社会学系等构成,我们系就像是各个分支的融合,大家各自有专属的领域,与此同时向其他各领域借鉴。每一个学生需要在入学时修一门涵盖各个领域内容的综合课程,在这门课上,一位博学的老教授带领我们赏析生物学、心理学、经济学、社会学、人类学重要著作的核心章节,我因此有机会接触了《进化论》、《梦的解析》、《国富论》、《资本论》等经典。接下来的两到三年中,我们需要在五个核心领域各修一门课程,例如进化心理学、青少年发展等。一直在统计领域研习的我从未想过自己会修读这样的课程,回过头来看,这些教育经历对打开我的视野很有帮助。洪老师对我的悉心指导让我更加深刻地认识到,想要更好地开发统计方法、帮助应用学者用其解决实际问题,不仅要掌握扎实的统计基础,同时要对应用背景有较深入地了解,后者对研究问题的选择、统计分析结果的解读起着至关重要的作用。不仅如此,对实际问题的透彻理解甚至潜移默化地影响着我的论文写作。在洪老师的影响下,我渐渐学会通过实例介绍方法原理,使文章更加深入浅出。我认为,如果一篇统计方法论文也能服务于应用学者,那么它的价值将能实现最大化。

芝加哥大学的学科交叉不仅体现在社会科学学部内部,还存在于各大学部之间。芝加哥大学其他院系的教育资源也让我受益匪浅。我在统计系修读了一些知名教授讲授的核心统计理论课程,例如Prof. Peter Mccullagh的Generalized Linear Modeling。我还有幸请到在其他领域颇有造诣的统计学家加入我的博士论文委员会,包括社会学系的Prof. Stephen Raudenbush和生物统计项目的Prof. Donald Hedeker。他们虽然身处不同的系,但同是多水平模型领域的专家,在向他们请教、听他们讲授统计课程的过程中,我学会了从不同角度全面认识同一个统计问题。不同院系的统计学家联合开办了一个每两周一次的workshop,主题是Quantitative Research Methods in Education, Health, and Social Sciences (QMEHSS),请来做讲座的学者和大家深入探讨统计理论问题,但总离不开一个实际应用领域,使我更加全面地体会到统计的魅力。除此之外,学部要求每一个博士生必须做五门课程的助教,热爱教学的我有机会协助老师向社会学、心理学、商学、公共政策、社会服务等不同领域的学生教授诸如初级统计学、多水平模型、因果推断的统计课程,每周一个半小时的助教课大大提升了我的教学能力和兴趣,同时,和不同领域的学生接触、回答各个领域的统计问题,让我越发深刻地体会到了统计方法和实际问题相结合的价值。

这就是我的学习研究经历。

    XuQin 嚯,写得好详细!辛苦了。

    我觉得你走上学术研究的道路不光是因为有良师指引,而是同时也是因为自己能一直积极抓住机会。某种程度上我们有一些相似之处,我们的导师都是赵老师,他对我一般不作具体技术上的指导,但他会给我介绍很多机会,而且从不给我设置任何限制,也非常尊重我的选择。我也是在各种机会的尝试中逐渐明确了自己的兴趣所在,并坚定了我想走的路。

    看了你在芝大上过的课程,我倒是有些羡慕,我感觉这些综合阅读挺好的,不过我估计我受不起这个虐,这么多大部头的英文书,我想想就胆颤。我个人一直对马克思颇有兴趣,不知何时能有空真正读一读他的著作,比如《资本论》,你要是还有印象,可以帮我事先科普一下。你讲的“用实例介绍方法原理”、“统计方法在服务应用学者过程中才能实现价值最大化”,我觉得都是非常好的经验总结。

    看你的博士论文委员会阵容,我非常佩服你的勇气。很惭愧我就是那种投机取巧类型的,我的论文委员会我都是尽量挑好说话的老师……你要是有什么关于这些教授的小八卦趣闻或是他们给了你怎样的深刻启发,欢迎与我们分享一下。

    去年 3 月底我去芝大的时候承蒙你和彪哥关照,请吃请喝陪遛包接送,闲聊时我注意到你对两件事情流露出了内心的小火苗:似乎你非常喜欢小朋友以及当老师。我知道很多人都喜欢小孩、喜欢给人讲解知识,但你给我的感觉跟我见过的其他人都非常不一样,你的这种喜欢似乎发自内心的一种稳定而强烈的能量(我感觉很多人强烈,但很少人稳定),你谈起这两件事会有种忘我的愉悦。你对教学的热爱,除了本硕博期间的科研,还有其它的影响因素吗?比如是否有从小来自家庭的影响、或是求学期间受某一位老师的影响?

      来给彪嫂捧个场,目测马上彪哥也要上线了。?

      tangyan_ruc 要是挖得不深的话,那要采访有何用,还不如把受访人的简历往这儿一贴了事,大家各自吹着风扇吃着西瓜躺着自个儿看去 ?

        谢谢师兄!读《资本论》等经典著作的核心章节,对我的影响主要是思维方式上的。《资本论》从辩证唯物主义的角度揭示了资本的运行规律,其论证的严整、内容的宏富,令人叹为观止。

        我的论文委员会老师对我的影响不仅是学术层面的,他们的为人以及对待生活的态度都为我树立了很好的榜样。尽管他们在各自的研究领域都已拥有相当的影响力,但和他们相处,他们的谦逊、平和、真诚、善良,令我肃然起敬。这是做人的一种境界。除了潜心学术,Prof. Raudenbush和Prof. Hedeker还爱好音乐,其中Prof. Hedeker和包括Prof. Michael Jordan、Prof. Jennifer Hill在内的其他一些统计学家组建了名为The Imposteriors的乐队,每年都会在诸如JSM的统计会议上表演。我觉得有这样的爱好,使生活变得更加丰富多彩的同时,人的思维也会更加灵活。

        我对教学的热爱,主要源于父母的影响。我的父母都是很优秀的教师。我上高中的时候,爸爸教过我一年,让我充分感受到了爸爸上课的魅力,在家里更能天天感受到他以教学为乐的状态。我期望也能像爸爸妈妈那样传道受业解惑,每天工作着并快乐着——这,就是我理想的人生。

          XuQin 哈哈,我听说过那个乐队,原来你的论文委员会老师中还有那个乐队的成员,厉害啊。

          所以你的教学热情很早就已经播下种子了;有热情的人真的是非常有感染力。

          2016年你因为“Analyzing heterogeneous causal mediation effects in multi-site trials with application to the National Job Corps Study”这篇论文获得了美国统计学会的学生论文奖,可否谈谈你的获奖经历、心得以及你的论文主要解决的问题?

          18 天 后

          很抱歉因为搬家和其他一些事情,没能及时回复。

          这篇论文主要解决的问题是在多地试验(Multi-site Trials)中,从因果干预机制(Causal Mediation Mechanism)的角度探究因果效应在各地之间存在差异的原因。 这是我毕业论文的雏形。研究对象是一个名为Job Corps的美国教育培训项目,该项目面向弱势青少年群体,旨在通过为期一年左右的职业和教育方面的综合培训提升受训者的就业竞争力。Job Corps在全美有100多个培训中心,研究者将各个中心的申请者随机分入实验组(进入该项目学习)和对照组(不得进入该项目学习,但可以参加其他同类项目),进而探究该项目的因果效应。初步研究发现,从平均水平来看,被分入该项目的青少年四年后的年均收入显著高于对照组,然而,这一效应在各个培训中心之间存在显著的差异,也就是说,有的培训中心和对照组在提升收入方面并无显著差异,有的培训中心甚至还不如对照组。为了进一步探究其中的原因,在我的导师和毕业论文委员会其他老师们的指导下,我从因果效应背后的形成机制入手,尝试开发新的统计方法。Job Corps旨在通过提升受训者的教育素养和职业技能,最终使其在就业市场上占有一席之地。换言之,教育素养和职业技能的提升是Job Corps(因)在对受训者收入(果)产生影响的过程中的重要中介变量(Mediator),我们将“因”通过Mediator对“果”产生的效应定义为间接效应(Indirect Effect)。与此同时,Job Corps还提供了其他服务,例如医疗保障、心理咨询、社交技能培训等,以提升受训者的软实力,我们将“因”通过除Mediator以外的其他中介要素对“果”产生的效应定义为直接效应(Direct Effect)。由此,总因果效应被分解为间接效应和直接效应。为了探究之前所提到的总因果效应在各个培训中心之间存在显著差异的原因,我们想要进一步剖析这一差异主要是存在于间接效应中还是直接效应中,进而找到改进项目的突破口。然而,目前尚没有方法可以从因果推断的角度严格解决此类问题,研究者往往忽略了“因”和Mediator之间潜在的交互作用(Interaction),以及Mediator和“果”之间潜在的混杂因素(Confounders)。 为了填补这一空白,我完成了这篇论文,最终发现,通过提升受训者的教育素养和职业技能,所有的Job Corps培训中心都能够以类似的幅度显著提升其收入水平,然而,各个培训中心通过其他服务对受训者收入产生的影响却存在着显著的差异。因此,项目管理者欲实现各个培训中心的齐头并进,需缩短各中心在为提升受训者软实力所提供的服务上的差距。当然,我们还可以更深入地剖析因果效应背后的形成机制,这是我今后的研究方向。

          在完成这篇论文后,由于知道身边有的老师曾获得过美国统计学会的学生论文奖,我也想尝试一下,就报了名。

          能够获得这个奖,对我来说是一种鼓励,后来在老师们的指导下进一步完善论文,最终将其发表在Journal of Educational and Behavioral Statistics上( http://journals.sagepub.com/doi/full/10.3102/1076998617694879) 。

          通过这篇论文,我对科研有了较深入的认识,其过程远大于结果。其间,一次又一次和导师及其他老师讨论,每次投稿后得到Reviewers的反馈,再做进一步修改,这是非常宝贵的。

            XuQin 不愧是热爱教学的人,解释问题非常有条理。你写这篇论文的过程中,有没有特别受挫的时期(比如很久都无法继续前进)以及灵感爆发的时刻(比如自己突然冒出来一个想法或者从别人的文章里得到启发)?

            9 天 后

            师兄提的这两种情况我都经历过。

            探索创新的过程就如同走一条前人没有走过的路,有的时候的确会遇到阻碍,无法继续前进,由于不知道这条路是否走得通,会经历一段迷茫的时期。比如刚开始的时候,我按照常规的最大似然法(MLE)估计直接效应和间接效应,通过模拟发现在很多情况下其标准误(Standard Error)的估计值都是有偏的,但是找不出问题的根源,我曾犹豫是否应该按原路继续走下去。有的时候良好的直觉可以帮助研究者在困难时期做出正确的判断和选择,而直觉是建立在经验的基础上的,对于刚刚开始从事研究工作的我而言,并不具备这样的素质,和具备良好直觉的人多交流就变得至关重要。在向经验丰富的老师们请教的过程中,我发现,问题出在两步估计上。在我的研究中,直接效应和间接效应的估计是基于另一个估计量的,因此,在估计前者的标准误时,必须要考虑后者的不确定性。通常的解决办法是利用Bootstrap估计标准误。可是由于多水平模型的拟合比较耗时,如果将Bootstrap的次数设置为1000,得到最终结果将需要5个小时,尽管平行计算可以大大节省时间,但绝大多数社会科学学者并不具备这样的资源,如果能够推导出标准误的估计量,效率将大大提高。通过进一步交流,我了解到Newey(1984)将两步估计中每一步的moment function叠加在一起,由此将两步估计转换为一步估计的问题,根据Hansen (1982)提出的Generalized Method of Moments (GMM)(Lars Peter Hansen因此获诺贝尔经济学奖)最终推导出各步估计量的标准误。然而,在多水平模型领域,这一方法从未被开发过,于是,我明确了下一步的研究方向。由此,老师们的指点帮助我找到了障碍的源头、坚定了前行的信念,在一篇经典论文的启发下,呈现在我眼前的路变得更宽、更清晰了。在明确了方向之后,我通过大量阅读加深对多水平模型和Newey(1984)的理解,从而找到了在多水平模型领域拓展Newey(1984)的突破口。

            我越来越深刻地体会到,做研究是一个不断学习积累的过程,经验和视野是创新突破的重要因素。

              XuQin 谢谢分享这段经历,非常写实,相信可以给有志于投身学术界的同学们一些启发。我最乐意看到的就是别人分享读书或读论文时找到解决办法时的喜悦,虽然我现在跟学术基本上已经绝缘,但我觉得这种从书山里偶尔扒出一个武功秘笈的经历是做学术工作的最大魅力之一。

              谈了好几轮学术方面的东西了,不妨暂时换个轻松一点的话题。总体而言,你觉得在读博士期间,科研与生活的平衡容易掌握吗?在科研之余有没有什么其它兴趣爱好?

              12 天 后

              我觉得科研与生活的平衡是保持头脑灵活、研究高效的重要保障。我周边的绝大多数人每天或者每周至少要抽出一段时间做研究之外的自己感兴趣的事情,比如,我的导师每周工作日都坚持每隔一天游泳半个小时。我在读博士期间也是比较注重科研与生活的平衡的,否则思想会变得僵化,身体也会吃不消。每天适量的运动必不可少。时间比较充裕的时候,我喜欢在密歇根湖边骑自行车、去体育馆打羽毛球、游泳或是跳健身操,高中和大学的时候练过跆拳道,到了美国条件不允许,就没有再继续练了。忙的时候,为了保证运动量,我每天都坚持花20分钟快步走路去学校,再花20分钟快步走路回家。除此之外,平时一日三餐,基本都是自己做的,周末如果有时间的话会做一些中式面点。手艺一般,完全就是当作一种休息,忙了一天回到家,很累了,也没有精力再思考问题了,这个时候花半个小时做点儿想吃的东西,还是很有成就感的。上学回家的路上或是做饭的时候我喜欢听美国国家公共电台(NPR)的广播,包括新闻和例如Hidden Brain、TED Radio Hour的栏目,其中HB是通过讲故事的方式讲述社会科学领域的一些话题、探索人类大脑的秘密,TRH是大家熟知的TED的广播版,将演讲和台下对主讲人的采访融合起来,更加生动、深入。我还喜欢听国内一个叫做“得到”的罗辑思维出品的APP,它的理念是碎片化学习,旨在扩展认知、拓宽视野,其中吴军(前腾讯副总裁,现为Google中日韩文搜索算法主要设计者)的《硅谷来信》知识性和思想性很强,让我受益匪浅。周末闲暇的时候,我也喜欢看看电影或是类似于《中国新歌声》(原《中国好声音》)的节目。随着生活节奏越来越快,科研与生活的平衡变得越来越不容易掌握,但却变得越来越重要,健康的身体、愉悦的心情和宽广的视野是从事科研的重要保障。

                XuQin 这简直是模范博士生的节奏!估计多数博士生看到这里如此健康又有思想的生活都要得思过崖反省了:我是谁,我在哪里,我这几年都干了些什么……

                完全同意下厨是休息的看法,我也有这一点小爱好,虽然也是能力一般水平有限。尤其是面食对我来说有些魔法性质,很有意思,比如花卷、油条、蛋糕、发糕等。

                你说的 Hidden Brain 我几周前刚从我们公司另一个人口中听说,我不太听广播,所以以前也不知道这个节目。不过听了一期 You 2.0: The Value Of 'Deep Work' In An Age Of Distraction,觉得还挺好的。那说到碎片化时间,你对时间的碎片化感到困扰吗?我个人一直在尝试避免接触太多让我的时间碎片化的东西,但这个尝试在多数时间里都是失败的,所以我还是很困扰的。用在交通和做饭上的时间碎片是被动碎片,不太能避免,所以有利用价值;我的困扰是我有好多主动碎片,不知道是不是被众多号称“利用碎片化时间”的工具给坑了,我感觉越是去利用碎片时间,时间就越碎,而对我而言,要完成一件大事,必须得保证每天有足够长的连续时间段。你的科研过程中(比如写论文时),是否存在你需要特意保证或克制自己不受干扰的情况?换句话说,你是一个本身就意志力比较强的人,还是有通过什么手段来集中精力?

                  师姐果然是模范博士生…

                  先自我介绍一下,我叫蔡锐,也是人大统院的本科毕业生,16年毕业,现在在宾州州立读统计学PhD。师姐聊到做饭的问题,一日三餐竟然都是自己做的!佩服,佩服。想问师姐是中午带饭到学校吃吗?还是回家做?如果晚饭也回家做的话,岂不是要下午五六点就要回家了?如果五六点就回家做饭不再想科研问题了,该如何保证科研时间?

                  我也很好奇师姐对于碎片化时间的掌握…

                    现在应该已经是秦教授了吧!

                    10 天 后

                    yihui 不敢当。

                    其实师兄提到的那一期Hidden Brain讲的就是如何掌控时间。在现在这个对互联网高度依赖的时代,我们几乎每天都不可避免地要面对来自手机、电脑的各种讯息,时间碎片化已经成为一种普遍现象。然而,无论做任何工作,想要取得一定创新性的突破,都需要有整块的时间进行深度学习和思考,正如师兄所说,“要完成一件大事,必须得保证每天有足够长的连续时间段”。

                    在父母的培养下,我从上小学开始就有制作时间表的习惯,它成为我管理时间的重要方法,这让我受益匪浅。每个学期初我都会规划这个学期需要完成的研究任务,明确了目标,做研究的时候就从容了许多。我每天早晨起来都会在Excel表格中列出当天要完成的任务,并按照重要程度和难度排序,把一天当中头脑最清醒的时间留给最重要和最难的事。我会估算一下完成每项任务需要的时间,列出一个具体的时间表。我会安排休息的时间,除此以外的时间,我不会浏览网页或是看手机,偶尔有克制不住的情况,我会把网断开。在完成每项任务的时候,除非有重要的邮件需要及时回复,我一般不会被干扰。保证时间的完整性是我集中注意力、进行深度思考的重要保障。但是人的注意力会随着连续工作时间的增长而递减,为了提高效率,间歇性的适当休息非常有必要,否则,可能会因脑力下降而停滞不前或犯错,得不偿失。这时就到了“帮助‘利用碎片化时间’的工具”发挥作用的时候,如何能让其作用最大化,就要靠自己的意志力了,我会克制自己不超过十分钟。有的时候,由于任务的难度超出了我的预估或是出现了新的问题导致了超时,影响了后面的计划,我会对时间表进行适当调整,把当天急需完成的任务往前排,其他任务如果完不成也没关系,我会把它们挪到第二天的时间表上。一天中可以安排的任务其实是有限的,大多时候,我每天只钻研一个研究项目,循序渐进,偶尔会将两项相关的研究项目交替或依次进行。这样安排下来,每天都会有所进展,尽管很难如愿完成所有的任务,但是如果能在每天精力最充沛的时候把最核心的事情高效地做完,就能够保证按部就班地完成学期初的规划了。