大数据迷潮下的教育研究及其想象力

三、基于大数据教育研究的局限与超越

正如传统的小数据时代一样,大数据将会有很广阔的应用前景。它将在很大程度上弥补传统科研方式的种种弊端。但是,大数据也和小数据一样,仅仅是我们探究真理的工具而已,却不是“真理”本身。进入了大数据时代,我们显然对“信息”情有独钟,“它已经对身处其中的人们形成了压力,我们有必要积极主动地重获平衡,保住想象力的领地。我们能从数据也能从生活中获得意义,但要指出的是,这一能力高低,全赖于我们的想象力能否抵挡来自集体思维的压力,我们的想象力又是否足够强大,强大到可以超越那些显而易见的路径,做出变革性的发现,帮助我们最大化地发挥我们的潜力”。[10]所以,在教育研究领域,我们需要重新审视想象力这个问题,以超越大数据时代即将带来的挑战。

(一)基于大数据教育研究的局限

除了上述普遍意义上的挑战之外,大数据时代的教育研究面临着两个很切实的矛盾问题:价值密度与技术难度的矛盾;数据广度与信息安全度的矛盾。这些矛盾是大数据本身的固有矛盾,就像计算机系统本身的误差一样不可避免,我们只能利用技术无限缩小而不能彻底消除误差。事实上,这恰恰是一切教育研究想象力的空间所在。

1.“价值密度”与“技术难度”的矛盾

虽然大数据在教育研究中拥有很大的应用前景,但是我们更应该看到其局限性。首先便是大数据的价值密度与技术难度问题。“高价值”是大数据时代的四大特征之一,这里的“高价值”意指经过多番提纯后的关键数据,而不是所有采集到的数据,所以大量数据事实上具有极低的价值密度。一般来讲,初始数据体量越大,越全面,其经过数据分析后所得结论才会越准确,价值越大,但是相应的数据的价值密度也会越低,而技术难度却越大。我们往往会乐观预计其前景效益,但忽略其潜在的难题:数据采集的终端选取及标准化问题,数据存储所需的基础设施投入问题,数据分析所需的技术人才储备与培养问题,大数据应用阶段的普及化问题,等等。另外,延伸到教育领域之内,我国教育资源在区域、城乡、校际之间存在严重的分配失衡现象,大数据的引入是否会造成新的“数据鸿沟”,加剧新的教育不公平现象?在这些问题没有很好的评估之前,跟盲目的跟风欢呼没有任何实际意义。以大数据模式下的课堂教学研究为例,“根据美国著名的课堂观察应用软件开发商Classroom Observer的研究,在一节40分钟的普通中学课堂中一个学生所产生的全息数据约有5GB~6GB,而其中可归类、标签、并进行分析的量化数据约有50MB~60MB,这相当于他在传统数据领域中积累5000年的数据总和”。[1]这么大的数据体量,如果没有经过提纯,那么教育研究的价值几乎无法得到展现。但也恰恰是大数据时代,教育者及教育研究者所面临的困境与挑战。这对于研究者的数据分析技术有很高的要求,那么也就意味着很多传统的教育者和教育研究者要实现转型,积极跟上大数据的时代潮流。但是缺乏数据统计与分析人才是我国目前面对的普遍短板,不是短时间内可以解决的。这肯定会影响大数据在教育研究中的应用。

2.“数据广度”与“信息安全度”的矛盾

教育研究的伦理问题也是大数据教育研究所不能回避的。笼统来说,在教育活动中进行教育数据采集的时候,我们会直接面临三个问题:哪些信息可以采集?通过什么样的方式采集?采集所得数据的应用范围?这都涉及教育研究的伦理问题。首先,大数据依赖的是海量的信息搜集,比如全景式或关键区域的视频监控,学生、尤其涉及中小学生的非结构化信息都可能涉及隐私问题,而矛盾在于数据采集的范围越广,程度越深,其所涉及的信息的安全度就越低,数据泄露所带来的危害风险也越大。但是,大量数据的搜集总会或多或少地侵犯到对象的隐私。因此,在教育领域内,制定具有针对性的信息采集规范是十分必要的。第二个问题是“通过什么样的方式采集信息?”大数据采集信息的方式、方法无疑是合乎互联网精神的,即开放、分享、平等、合作。但是信息的主动开放与无意开放,主动分享与被动分享完全是两个概念。教育系统内,学生大多是未成年人,其个人数据信息具有特殊性,他们对自身的数据以及开放范围是否具有决定权,依据年龄不同,其决定权的程度是什么?都是需要加以考虑的。例如,谷歌公司所研发的可穿戴设备“谷歌眼镜”(Google Glass)是未来很好的收集大数据的工具,但是这种设备也意味着我们的隐私几乎处于无限的开放状态。第三个问题所涉及的是“应用范围”,学生的海量数据被用来改进教学策略,提高教学质量,进行特定问题预测等等。以预测为例,我们能不能利用某个学生的海量信息推测其暴力倾向与辍学可能等敏感问题?我们应不应该相信预测结果?大数据在我们的教育决策当中到底应该占多大比重?这些都是大数据之于教育研究的伦理问题。毕竟,教育是培养人的活动,教育研究也是研究如何培养人的活动,在用数据衡量和预测人性行为在多大程度上是合理和可以接受的,大数据如何在保持自身科学性和有效性的前提下,估计到教育本应有的人文关怀,让冰冷的数字闪耀人性的光辉?本质上,数字与技术都是工具和双刃剑,关键在于我们如何照顾到其应用伦理,并以此为指导,发挥大数据在教育研究领域的最大效益。