大数据迷潮下的教育研究及其想象力

曾几何时,条件限制下的“随机采样取得了巨大的成功,成为现代社会、现代测量领域的主心骨,但这只是一条捷径,是在不可收集和分析全部数据的情况下的选择,它本身存在许多固有的缺陷。”[9]34人们依然认为,之所以出现困境,是因为记录、储存和分析数据的工具不够好,而在少量数据下得出的结论自然漏洞百出,随着人类拥有了能够收集和处理更大规模数据的能力以及大数据时代的到来,自然会逐渐抛弃小数据时代随机采样和抽样调查等老古董,转而寻求大数据带来的种种神奇。但是经过后现代、后结构以及后实证主义的抨击,即使是大数据也逐渐放弃了其赖以生存的“精确性”,无奈地承认:“大数据不仅让我们不再期待精确性,也让我们无法实现精确性……这是一个亟须我们去处理的现实问题,并且有可能长期存在。”[9]56但是,明明知道大数据所具有的模糊性与混杂性,却依然奉为圭臬,甚至顶礼膜拜,这就和自古以来的占卜和巫术几无差别了。原因无非是人们希望有一种超出自身的神奇力量,以便让自己掌控自身的卑微命运,哪怕这一切都是幻觉也行。当然,不能否认无论是小数据,还是大数据都确实给人的生产、生活带来了极大便利,所以人类愿意逐渐让渡出自己思考的权利,让“数据说话”。可以回溯历史,为了自身的确定性寻求,为了安全感的满足,我们曾经让“神说话”,让“君主说话”,让“专家说话”,但是现在大数据时代自负地宣称了“神”“君主”“专家的消亡”,数据才是新的“神”,新的“君主”,新的“专家”,能带领我们进入“秩序、正义和美的王国”。

(二)“大数据迷潮”的实质

虽然“自20世纪80年代以来,在后结构主义和后实证主义思潮的荡涤下,即使再严格和规范的社会科学实证研究,估计都不再敢于自信满满地视数据分析为洞穿事物本质、反映世界规律以及获得确定性客观知识的利器。”[8]但是,人类对于确定性寻求的欲望绝对不会磨灭,因此可以说,这场“大数据迷潮”的实质是实证主义的极端化,是现代主义对于后现代主义的绝地反击。但是,实证主义的这场反击是带有妥协性的。在小数据时代,由于技术限制,实证主义只能用最少的数据得到最多的信息,所以分类、分层等抽样检测尽可能要做到准确。因为本来就是挂一漏万的方法,自然小心翼翼,小的错误会因为抽样的原因而造成巨大的误差。但是随着测量技术、算法的不断演进,实证主义似乎终于实现了“一切皆数”的终极梦想,骄傲地宣称自己拥有了全数据模式,即“样本=总体”。[9]37随之而来的则是大量低效或无效的数据,真相被深深掩盖,所谓的“预测”只能建立在“相关关系”上,更无法保证预测的精确性。所以,实证主义无奈地劝告人们,应该改变自己的思维方式,要允许不精确,要学会拥抱混乱,这显然和实证主义的初衷是违背的,但是为了保住自己的地位,为新技术的出现争取时间,它也只能无奈地如此。我们可以大胆预测,如果测量技术进一步发展,实证主义一定会抛弃“混杂性思维”,重新展露出“精确测量与预测万事万物”的雄心壮志。

除此之外,工具主义、技术主义也是“大数据迷潮”的重要助力。大数据拥趸们认为,人类的判断力会逐渐被计算机系统所改变甚至取代。事实上,实证主义以前所认为的“所见、所闻、所感”要胜于“所想”的思维方式,就隐含着对于“工具”(身体)和“技术”(怎么看、怎么听、怎么感受)的崇拜。只不过随着测量工具,尤其是现代计算机技术的突飞猛进,实证主义者已经抛弃了之前的落后工具(身体感官)与技术(感官的运用),转而寻求更加客观、更加外化、更加先进的工具与技术。所以,实证主义的历史充满了对人的怀疑,认为从人的观念到人的感官,都是不靠谱的。对于工具与技术的崇拜是其一以贯之的信念,精确性与确定性也是其本质的追求。“语言”作为人类最为本质的工具,逻辑实证主义者曾妄图将其转化为最精确的符号,以杜绝任何语意模糊,并认为哲学就是一种人类的语言疾病。所以,大数据迷们所提倡的“混杂性思维”事实上只是权宜之计。大数据的本质是实证主义的极端化,随着数据处理工具与技术的不断改进,真相会进一步显现。只要人类对于确定性寻求的欲望不衰减,那么实证主义就会不断改换名目、卷土重来,当然它的每一次回归都是以技术与工具的巨幅升级为前提。但是我们应该清醒地认识到,人类除了对于确定性的欲望之外,也有无限的好奇心与冒险精神,所以对于未知的渴望也是难以磨灭的。相应的,人类对于因果关系,对于未知世界,对于不可控之力量也会永远保持兴趣。正是在这个意义上,我们认为,大数据只不过是人类欲望之一的外在投射,人类思潮的汇聚支流之一罢了,既不能奢望杜绝它,更不能狂妄地让其改变甚至取代人类的思维。