中云网消息 8月29日-30日,以“数据重构未来”为主题的D-Future七牛数据时代峰会在上海举行。七牛携百名创业明星,技术大咖汇聚国际时尚中心,共话数据发展,探讨行业未来!
沪江网架构师汤晓雷在30日上午的活动上带来《互联网+教育:数据驱动个性化学习发展》主题演讲,以下是文字实录:
汤晓雷:大家好我带子互联网汤晓雷,负责整体大数据的这一块的工作,刚刚上午讲了很多,电商或者是广告方面的一些数据的应用,坦白讲我在教育里面我做了将近两年多快三年的时间,教育大数据如何变现一直考虑的问题,现在面临的问题很大。我今天一抛砖引玉把这两年的心得和体会分享给大家,我不知道在座现在有多少人曾经注册过互联网的会员,可以举一下手我看一下,人非常给力。我们可以做一个小调查,我们大家能猜到我们整体的在线学习发展状况,互联网现在有多少学员大家有知道的吗?这是是我做PPT一个简单的截图,截至到20号14点我们有8700万在线学习人数,我们现在在线教育发展非常快,互联网平台还有其他发展平台速度非常快,速度以万亿速度增长,我们高在7、8万增长,增速非常快,我们从8千多万用户发现什么问题,我们到底能够提供如何好的教育,我们教育到底能不能解决一直困扰的教育公平,如何教育引导我们下一代所有孩子、儿童,能快速超越而且能领先到国级教育,这是我们一直思考的问题。
整体趋势里面分三个主题,人群结构的变化,生命周期的变化,另外就是学习行为的变化。从2012年有爆炸数据增长,移动端上来之后,变化有哪些趋势我们可以看一下,12点半准时结束我们快一点。上面人数在增长,大家非常清楚,刚才也讲了,每天有7、8万的增长量,非常快速,我们看到年龄结构的变化,值得我们去思考,这个区间越来越平稳,低龄化越来越严重,还有我们整个高龄的人,职业化的人数增速非常快,而且这里我可以告诉大家一个数字,注册低龄化越来越喜欢微信、QQ手机注册,带来很大帮助。以前大家用有线,刚才我们上面讲,一些用户方式,如果用户不可阻挠,它注册了,那我认为是减了一个线,以后用户没有任何储藏方式的话,这种机会可能越来越少了。这里面我提炼了几个关键词,交叉性越来越强,扁平、低龄我感觉值得我们思考,这里面我们是否有一些创业的伙伴去考虑,现在K12教育可能是整体做教育创业很大的市场,现在市场反馈这样的情况,另外职业教育以后发展空间越来越大,从人群来看,包括我们现在国内的政策,也要鼓励二胎,所以非常快的。但是有一个现实问题,对于我们所有做数据人来说,有一个很大的挑战你不能用成人的思维来理解孩子。教育老师都是根据经验教训,我们所有老人,我们都受传统教育长大,都是根据经验教学,现在没有太多数据去指导。我们一般按成人思维去理解,我们如何去理解孩子,通过数据去做,我们K12是一个很大的市场,我们做数据人员来说,是否能通过数据来发现孩子的学习兴趣,这是一个很大的创新点,孩子很复杂的时候,孩子学习的时候,如果说是K12小学,报名又不是他报的,他在上课,他还会受到学校老师的指导,它有三点结构,这里的挖掘很大,有很大的难度。如果有创业的思路话,可以来和我们一起聊,我们一直在想这块的事情。
下一个整个生命周期变化,这是一个真实的数据,我们语言的项目,一些职业项目,发现48%的用户是之前学过演员的。我们可以提炼出一些关键词,他们的交互量越来越强。职业的传递性越来越强,如果学4级和学6级的有一个前提,你一定要教得好,不是说你做推荐非常有意义,做教育就怕上面做推荐,客户不采购,我刚进公司做推荐,我以前从阿里做过,从电信公司也做过推荐,我想去做推荐,我的项目就搁置了。
另外一个,隔代传递这是非常做教育,我们现在十几年,有很多家长,现在已经30几了有小孩,5、6岁很多,现在正好国家的政策在讲国学,以前在学习韩语、日语,我们的很多教育是他们孩子来学习。还有一个晋级传递,刚才职业传递他以前学语言的,后来学其他一些,还有根据属性,教育根据属性,它和所有电商和广告不太一样的是什么,天生的产品是有一个强吸收性,不能说每位,后期有三个月或半年或更长时间有生命周期的学习。挖掘用户这种真正知识点不懂的地方,能给他一个帮助,这是一个数据做的事情。但是你不能直接推荐课程,推荐课程你还要给他推荐各种。
另外一个学习行为路径的变化,这里面我从三个点讲一下,选课、付费、还有学习,选课大家知道,互联网行业发展经历过这样一个过程,刚开始对这个事情随便选就可以了,后来做课件系统,刚才有一个同学做课件,包括一些踩点,很多创业机会,如何把知识点,播放、采集,还有一个是直播,一对一,一对多,用户基本上根据这个走的。另外一个付费,付费我们现在自己来看的话,大家不用怀疑互联网教育付费的趋势,我们现在整体付费告诉大家一个数字,已经过了2.0几,而且每年都在提升。另外一个学习,我们从这几个关键词来体现,课程形式,大家越喜欢短而美的东西,秒懂,圆周率的东西,它把一个直径拉长,一个圆滚过去直接到三分之一停掉,秒懂,而且印象非常深刻。这种知识是散的,一点,学生非常喜欢一个课5分钟可以解决掉,他很快解决,不能让我半年才能看懂我要知道和我同类的人,他们处于什么阶段。非常清楚自己这次能不能过级,或者达到一个很好的成绩,还有一个碎片化的多终端,这个不用讲都知道。还有一个核心是碎片化采集,但是教育领域非常难,大家知道,这里面有很多的数据,我们采用一些现有的基础,我如何联合起来去采集这个数据,如果大家有兴趣可以做这方面的创业,有很好技术的的突破,也可以一起来交流,一起来组织。
下面我讲一些数据应用方面,这块我简单说一下,教师、数据和教练,这个我有一个自己的理解,我刚才讲了我们所有传统教育,包括我们的老师,根据经验,一个教授一辈子带那么多学生,但是影响力确实很大,有经验。还有数据我们大家都知道,还有一个教练。为什么这样讲,大家可以看这个。这个目标非常清楚,他的目标投篮的人,他背后有什么,他是教练团队他不是教师团队,我感觉更要区分教练和教师的区别,教练是通过数据来指导这个运动员去做,不论足球、篮球还是其他的,他要看对方是什么情况,他的训练,他的体能、他的速度,他的跳跃能力,全是通过这些东西指导的,如果我们的老师,能结合数据去帮助学生做这些东西,我认为对学生来说不是灌输知识的过程,是培养他学习能力的过程。
也就是说,我们的学习目标是否是明确的,我们都是通过传统教育长大的。我现在目标考一个4、6级目标很明确,如果过级了你的词汇量多少也就是4千,比如说A类、B类如何去背的,没有人知道,老师只能在班级里帮你做一些指导。其实我们的学习目标是既明确又不明确的。在这个过程中,我们可以通过教师的能力,来判断一下教师能帮我们做什么事情,老师有三个能力,我们简单概括一下,因材施教、知识体系、个人魅力,我认为个人魅力是非常影响学生的,有可能踏踏实实的体系有很大的关系。但是因材施教,老师可以根据你这个人的情况,去做因材施教,说白了,就是帮你细化你的目标。
计算机能做什么?计算机有知识图谱,这个和教师比起来,有浩大的量,无可比拟。能力模型可能就是在座要做的事情,数据挖掘,如何把知识图谱做掉,如何把专家领域做到,如何把用户的学习行为做掉,把这两个结合在一起,这是我们要去做的事情。另外一个未知魔力,我认为计算机的魅力特别是对下一代的影响不亚于对老师,我们曾经做过一个调研,在线的老师,或者学校的老师,我对他喜不喜欢,没法判断没法做,对老师的选择。有的学生队伍提出,我是否可以对老师进行星座的判断,我可以研究星座,我跟他冲不冲突我去选这个老师。
K12里面学生的思维真的是不能常人去理解。
在这里我们数据教练过程,能否判断,现在在做的,通过分析被词比例,他的投入时间是什么样,有一个机制同桌机制,组队机制,这也是一些概念,没有完全形成一个系统,告诉你别人如何去做的,正确率多少你的正确率多少,你们的差距在哪里,信息量,所有这些细化都是跟学习有关,指导学生,同时把这个告诉我们的班主任。
现在有一个实际的项目,提醒学员你的背词速度落后于多少人,有学习工具、学习社区、学习咨询,还有CC网校通过这个把学生串起来,所以这里面不单单位是报一个过程,如何挖掘一个信息点是我们最关心的问题。我们在这里面做一些个性化的平台,没有做推荐。有项目我们可以给大家看一下,现在我们正在做的,前些天改版的,学习咨询、学习社区,我们现在在做的。而且现在压力非常大。怎么去结合,我欢迎大家跟我交流。
我可以告诉大家一个数字,我们通过这一年多的调整,完成率达到43%,完整率是一个非常核心的指标,你完成率多高,你想谈其他的都是扯淡,我第一个没有学成你还给我推荐第二个课程,我花了五百你还想让我花一千不可能。如何提高完成率,帮助学生如何更好学习,找到知识点,其实现在网上包括我刚才介绍,学习工具是非常多的。但是学生不知道怎么去用,有的人相信,不知道别人怎么用,也不知道自己处于什么水平特别是差距,告诉别人怎么去做,这不是重点我们在继续努力。
还有一个互联网学习不是报一门课那么简单。构建知识结构,人工智能这方面,构建知识结构,还有一个培养能力越发重要。如果老师将计算机加教师就是智能如果我们某一天,一般的学校只是在线教育,老师在课堂,只是负责做一个教练的角色,根据学生的数据怎么去做,个性化做一些指导,互联网教育的结合,我们期待那一天,谢谢大家!