访谈芝加哥大学博士、一起作业数据科学家冯俊晨
- 已编辑
junchen 作为一个闯入教育行业未满一年又跑路的同学,内心深感惭愧,毕竟也曾激动有睡不着觉的时候,也曾对教育领域充满激情。不过后续确实感觉VC模式下的Ed tech公司做的很多事情都感觉是在教育领域盲人摸象,摸到教育一个好做的点就赶紧搞,并想法设法挣钱,比如做题库、做某类应试测评,实际应用技术也都很粗糙,英语流利说我记得还说用过RNN,估摸可能是Deep Knowledge Tracing,真用的效果如何也不知道。国内教育数据环境交流少,估约是起步晚,dirty work太多,数据质量好的少,业务、技术和数据成体系的少导致吧?,交流氛围还没法活跃起来。p.s. 另外感觉学霸君技术也挺好。
问junchen一个问题,为何留在17作业呢?17作业也在做题库,做辅导啊?? 感觉上述你对教育的想法的也许在某个创新学校可能更有可能实现,只是在学校不好规模化,操作会比较复杂,但教育路径会更完整
junchen 学习是个承认自己傻逼并且克服自己傻逼状态的过程。不论是承认还是克服,都很痛苦。
我看你经常收集心灵蛋花汤,看来很有效果,现在随便一出手,蛋花汤就是一盆一盆的。
junchen 游戏化可能的贡献在于把学习从一个个体行为变成一个群体行为,依靠人际关系来维护长期激励。
嗯,这一点我倒是没有考虑到,是个非常有意思的思路。
junchen 所以到了研二的时候,学成了一个toolbox,大有屠龙之技已成的慷慨之志。
谢谢分享你的经历,这正是我想挖的东西:我想听的不是一个人好像一夜之间就成就了一套思想,而是否定之否定的过程。我觉得你这慷慨之志是学术界最可爱的状态。
junchen 有些坑,我们已经付过了智商税,别人就不用再付一遍了。有些轮子,别人造出来了,我们就不用再造了。多交流,多沟通,有自信大家交换思想后自己迭代地还是比对手快,这才是一个良性的产业集聚外溢。
拍案!我只能学查理芒格对巴菲特提问了:“你还能讲得比这更好吗?”(巴菲特:“当然。请给这位先生来点花生糖。”)
gaotao 如果游戏真的如你所说,能让人感受美和目标,而不是寻求心理刺激,那我双手赞成这种模式。将来人类会不会进入楚门的世界(或无限月读),我觉得很难讲哎。
gaotao 这两个礼拜忙上线,没有及时来灌水。我来展开说说教育领域里数据分析的两种做法。
第一种做法是技术驱动。
学习数据狭义的说是学习结果的数据(例如题做对没有,视频看完没有),广义的说,是学习行为的数据(例如看视频时的click stream)。
这个方向里,涉及学习结果的数据分析源远流长,毕竟我们收集考试结果数据已经很久了。这个方向所用的模型(item response model和bayesian knowledge tracing)高度专业化和成熟,但是模型的应用场景仅限于终结性测评(现在一些所谓的黑科技其实是对于这些模型的误用)。测评业务对于大部分教育公司的价值是有限的。
涉及学习行为的数据是最近才发展为显学。一方面是行为数据的数量和复杂度在爆炸性增长,另一方面是因为在其他领域有成熟应用的技术可以直接套用(例如涉及转化率的一系列打点和追踪技术)。这个领域目前还属于蛮荒西部,野蛮生长的阶段。我觉得一般社招的“数据科学家”最适合做这个方向的工作。提高留存和黏性,对于大部分公司来说是真金白银;对于大部分用户而言,在学习app上多花时间,至少不会变笨(Duolingo CEO语)
基于这两个基础数据,再往上做一些推荐也可以,但是目前我觉得这个方向贡献不会很大。
第二种做法是打好辅助位,为教研(和产品)赋能。教育说到底是内容和教学创新的竞争。但是遗憾的是,长久以来,教研创新的检验标准并不是真实的学习效果,而是比谁资历深,比谁故事圆。通过设计良好的AB Test,可以帮助教研更好地开发内容,如果教研牛逼,还能帮他们开发教学理论。设想Google Analytics的教育版,老师都可以通过一个平台来提交新的内容更新,平台分发流量进行实验,然后告诉老师你的内容是否真的提高了某些教学指标(例如短期记忆留存,学生完成率etc)。这样去伪存真,日积月累,应该可以获得一个质量非常高的教学内容库,这是战略级的竞争优势。虽然在教育领域里做线上实验比广告click转化要复杂很多(最大的问题是非即时实验下的样本选择性流失),但是可为的空间很大。
虽然我本人非常看好第二种模式,但是这种模式的执行需要比较多的“人和”。
第一,数据科学家不能立足于“我来改造教育,拯救你们这群傻逼”。很多人进入教育行业,大谈颠覆,事儿还没做先把关系搞僵了,不智。
第二,教研也不能抱残守缺,总把自己积累的个人经验当做颠扑不破的真理。try often and fail quickly,快速迭代需要有实证主义的谦卑,这和老师的“权威”地位与冲突。我遇到太多的情况,教研打心底里觉得做数据(以及做产品)的懂啥教学,跟我吵个啥。我以前曾经和我们公司的总教研说,你对于教学的理解可能40%是错误,我对于教学的理解可能70%的错的,但是要命的是,我们不知道自己哪部分是错的。所以就某个具体问题,不能听你的,也不能听我的,得听数据的。
当然,教育公司里还有很多BI分析的业务,我就不一而足了。
总结一下,数据分析在教育领域里面想象空间不小,但是真正落地开花的很少(在我看来还没有)。作为这个领域的先行者,趟出一个切实可行的,兼具教学价值和商业价值的数据分析应用场景,是最重要的事情。但年Google带火了ad optimization,amazon带火了collaborative filtering,这才是我辈应该搞的大新闻。为了搞这个大新闻,得多交流,这不是一个零和博弈,而是一个正和博弈。
gaotao 首先,我同意你的判断。做真正有意义的游戏化教学(其实是自动化的交互式教学),是一件横跨几个领域的大工程,需要有懂教学的,懂story telling的,懂交互的,懂实现的。但是这件事儿做出来了,对于现在的教学内容和形式而言就是碾压式的优势。我跟好多个教育公司的高层谈过这个问题,他们也知道这是颠覆式创新,他们也知道这是战略级护城河;但是他们都有同一个反应:“这事儿太慢,太重。俊晨,快给我想想有哪些下半年我就能给整个公司用上的”。你只能摊手。
第二,我不觉得戏如人生有啥问题(特别是作为一个二次元死宅)。应试教育本身并没有什么错误。考啥练啥天经地义。主要问题是考的东西和现实需要的东西脱节了。如果我们能做一个戏如人生的学习系统,让孩子在里面针对自己想要的人生做反复应试训练,我觉得太棒了。
应对这个话题,我推荐大家去读一本科幻小说:Diamond Age, Or A Young Lady's illustrated premier。作者在里面设想了一种教学软件,可以自动探查学习者的周边环境和动向,据此生成教学内容,培养孩子的生存技能。有这样的应试系统,我双手双脚赞成。 (遗憾的是这本书因为政治原因没有简体中文版...)