gaotao 这两个礼拜忙上线,没有及时来灌水。我来展开说说教育领域里数据分析的两种做法。
第一种做法是技术驱动。
学习数据狭义的说是学习结果的数据(例如题做对没有,视频看完没有),广义的说,是学习行为的数据(例如看视频时的click stream)。
这个方向里,涉及学习结果的数据分析源远流长,毕竟我们收集考试结果数据已经很久了。这个方向所用的模型(item response model和bayesian knowledge tracing)高度专业化和成熟,但是模型的应用场景仅限于终结性测评(现在一些所谓的黑科技其实是对于这些模型的误用)。测评业务对于大部分教育公司的价值是有限的。
涉及学习行为的数据是最近才发展为显学。一方面是行为数据的数量和复杂度在爆炸性增长,另一方面是因为在其他领域有成熟应用的技术可以直接套用(例如涉及转化率的一系列打点和追踪技术)。这个领域目前还属于蛮荒西部,野蛮生长的阶段。我觉得一般社招的“数据科学家”最适合做这个方向的工作。提高留存和黏性,对于大部分公司来说是真金白银;对于大部分用户而言,在学习app上多花时间,至少不会变笨(Duolingo CEO语)
基于这两个基础数据,再往上做一些推荐也可以,但是目前我觉得这个方向贡献不会很大。
第二种做法是打好辅助位,为教研(和产品)赋能。教育说到底是内容和教学创新的竞争。但是遗憾的是,长久以来,教研创新的检验标准并不是真实的学习效果,而是比谁资历深,比谁故事圆。通过设计良好的AB Test,可以帮助教研更好地开发内容,如果教研牛逼,还能帮他们开发教学理论。设想Google Analytics的教育版,老师都可以通过一个平台来提交新的内容更新,平台分发流量进行实验,然后告诉老师你的内容是否真的提高了某些教学指标(例如短期记忆留存,学生完成率etc)。这样去伪存真,日积月累,应该可以获得一个质量非常高的教学内容库,这是战略级的竞争优势。虽然在教育领域里做线上实验比广告click转化要复杂很多(最大的问题是非即时实验下的样本选择性流失),但是可为的空间很大。
虽然我本人非常看好第二种模式,但是这种模式的执行需要比较多的“人和”。
第一,数据科学家不能立足于“我来改造教育,拯救你们这群傻逼”。很多人进入教育行业,大谈颠覆,事儿还没做先把关系搞僵了,不智。
第二,教研也不能抱残守缺,总把自己积累的个人经验当做颠扑不破的真理。try often and fail quickly,快速迭代需要有实证主义的谦卑,这和老师的“权威”地位与冲突。我遇到太多的情况,教研打心底里觉得做数据(以及做产品)的懂啥教学,跟我吵个啥。我以前曾经和我们公司的总教研说,你对于教学的理解可能40%是错误,我对于教学的理解可能70%的错的,但是要命的是,我们不知道自己哪部分是错的。所以就某个具体问题,不能听你的,也不能听我的,得听数据的。
当然,教育公司里还有很多BI分析的业务,我就不一而足了。
总结一下,数据分析在教育领域里面想象空间不小,但是真正落地开花的很少(在我看来还没有)。作为这个领域的先行者,趟出一个切实可行的,兼具教学价值和商业价值的数据分析应用场景,是最重要的事情。但年Google带火了ad optimization,amazon带火了collaborative filtering,这才是我辈应该搞的大新闻。为了搞这个大新闻,得多交流,这不是一个零和博弈,而是一个正和博弈。