还记得那个关于大数据挖掘的经典案例吗?掌握海量信息的商店甚至会比一个母亲更先知道她的女儿已经怀孕。而备考题库产品猿题库的产品愿景也类似:在考试方面,它要做到比你自己更了解你,从而帮助你更有效率地练习。你哪道题不会,什么地方有遗漏,它都会告诉你;如果你练习得够勤快,它还可以告诉你,在尚未举行的考试中,你能拿到多少分。
这也正是猿题库的CEO李勇强调自己做的其实是大数据业务的原因。他说,猿题库做的就是通过人工智能算法对考点、考频和难度进行分析,基于大数据挖掘准确评估出用户当前的能力水平,做到一对一的针对性出题。
昨日上线的猿题库司考-国家司法考试,是猿题库推出的第二个备考题库类产品。此前的猿题库-公务员考试系列已经在两个多月内吸引了20万的注册用户,并预计在今年会达到150万。在先尝试过社区平台类产品粉笔网之后,李勇团队选择从资格考试备考这个小角度,再次切入到在线教育中。
“和很多教育类网站不同,猿题库并不是简单地想把线下的内容搬到线上,而要是把运算和云服务带到传统教育中去。所以我们实际上是一个云计算公司。这件事没有人干,但是很有价值。”
李勇说:“事实表明,用户对互联网背靠产品的接受意愿,是比我们想的要乐观很多,云计算和数据挖掘能发挥很大的作用,考生的行为也能参与到产品完善中来,再加上移动互联网,这个产品发展的比预想的好很多。”
职业考试备考是强需求,用户们都是主动在各大网站和论坛上找信息,所以产品并不难接触到用户,但用户对产品质量高度敏感,所以李勇团队的做法就是,和传统机构合作保证内容专业性,再利用数据挖掘技术和用户体验来构建自己的核心价值。
李勇说,在传统教育方式中,无论是题库准备还是能力测试,建立模型时赋值的方法都很粗暴,主要是凭借老师的经验来进行,并且很难根据考生的表现来优化。但是对于猿题库来说,则会分成两步走:在产品刚推出来、还没积累起有效数据时,他们会先采取经验赋值,但是随着用户数据的积累,他们基于项目反应理论、遗传基因算法、和艾宾浩斯记忆曲线建立起来的算法模型就会发挥价值,让每一个用户做的试卷都不一样。
而且,传统教育的数据处理是样本式的,而猿题库只要有用户进行练习后,就能开始收集数据,全部用户行为都是数据来源,一旦不再需要样本,数据值的标签就特别大,可以把偏差减到最小。而从他们的公务员行测产品来看,推出两个多月,用户累计有效答题量已经超过了2235万。
这些算法和数据,从产品层面来说,体现在了猿题库的两个主要模块上:智能练习和能力评估。
在智能练习这一块,猿题库会从两个角度考虑:1.谁在做题。结合用户之前做题的历史数据,实时评估个人能力;2.题是哪些,根据全部有效用户的海量做题数据,实时统计题目的相关信息,包括每道题的答题时间、正确率、难度、易错项、难度值等,结合考点和难度值的要求,选择题目。
就拿模拟试卷来说,猿题库的做法并非是把题库里的题随机抽取组合,而是结合遗传基因算法,有一个复杂的计算过程:系统先在题库里生成一百套题目,然后两两组合,新生成两百套题目,再以考点与原来用户练习的情况为标准,对题目进行打分,把打分低的去除,保留一百套。这样做一百次之后,最后才会生成一套试卷提供给用户。
从能力评估上来说,他们会根据用户的历史练习数据,计算出用户对各个考点的掌握能力,然后通过与以往考试重点的匹配,映射到实际考试中,对用户在实际可能取得的分数进行预测。运营总监帅科称,在今年公务员省考成绩出来后,部分用户反馈说,猿题库的预测和他们实际取得的分数差异,在5分以内。
由于用户对教育产品的付费意愿很强,而且出于团队的意愿,猿题库选择的是按月订阅的收费方式,司考题库和行测题库的定价都为每月25元,所有新用户拥有3天全功能的免费体验期。李勇称,公务员题库推出两个月,付费用户约为5%,这已经不低。
“增值服务的方式老让我想起SP,说是免费,但其实这也收费那也收费,这种方式太low。所以我们宁愿选择付费订阅的方式。”