大数据哲学研究的背景、现状与路径

在小数据时代,数据被哲学家忽视,而在大数据时代,数据迅速成为哲学的新热点,主要是因为大数据时代的数据与小数据时代的数据有着本质的差别。从采集手段来说,小数据是人工有意测量、采集的数据;而大数据基本上都是智能芯片自动采集或人们无意留下的数据,因为当时没有什么特别用途而被称为“数据垃圾”。从存储介质和方式来说,小数据存储于纸质或硬盘等当地媒质中,而大数据往往因数量过大而存放于云端中。从处理方式来说,小数据只需要单机就基本可处理,而大数据则往往需要云计算平台。从数据性质来说,小数据因有意采集而成为主观数据,而大数据则因没有事先渗透主观意图而具有客观性,因此属于客观数据。小数据只是研究对象局部现象的主观反映,而大数据则全面、完整、客观地刻画了研究对象。传统科学的研究对象基本上都是简单、线性、无生命的自然系统,所以小数据基本上能够刻画研究对象,而人类及其社会则是具有主体性的非线性复杂生命系统,必须用大数据才能够完整刻画研究细节。英国学者、“大数据时代的预言家”维克托·迈耶-舍恩伯格在其畅销书《大数据时代》一书中开门见山地提出了大数据的哲学意义:“大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄意待发。”④由此可见,大数据成了哲学研究的新热点是时代的必然,也是人类进一步认识世界的迫切需要。

二、大数据哲学成为哲学研究的新热点

随着大数据技术的兴起,大数据哲学研究迅速成为国内外哲学研究的新热点。

(1)大数据时代来临前信息哲学家们的先行铺垫

大数据时代来临之前,信息哲学家曾就信息的本质、信息与认知等问题做过先期的研究,为大数据哲学研究做了一些铺垫。托夫勒在其《第三次浪潮》中就宣布人类已经进入了信息社会,信息将彻底改变人类的文明轨迹,在政治、经济、文化、工作、生活、教育等领域全方位地改变我们的社会。后来哲学家们对信息哲学进行了长期的探讨,例如国内学者邬焜、萧峰、刘刚等作了深入的研究。特别是邬焜教授,他30年来坚守在信息哲学领域,对信息的本体论、认识论和方法论等做了全方位的研究,取得了丰硕的成果。⑤这些信息哲学研究工作为大数据哲学研究提供了基础和借鉴。

(2)数据科学的哲学问题成为研究领域

由于计算机的普及,数据量越来越多,数据处理能力也越来越强,存储技术的进步和网络技术的发展让数据的存储和传输也发生了质变。地球与环境科学、生命与健康科学、数字信息基础设施和数字化学术信息交流等方面的科学家都越来越重视基于海量数据的科研活动、过程、方法,他们很早就注意到数据在科学技术研究中的巨大作用,因此越来越多地收集大量数据,并通过数据的处理和计算来发现科学规律,于是20世纪末就出现了数据挖掘这样一门学科。

美国学者、图灵奖获得者吉姆·格雷认为,在海量数据和网络无处不在的年代,以数据挖掘为代表的数据科学与技术是科学发现的重要途径,是继科学实验、理论推演和计算机仿真这三种科研范式之后的科学研究第四范式——数据密集型科学发现。⑥第四范式作为知识发现的又一条新通道和新范式,与前三种范式相辅相成,共同构成发现的认知和方法体系。

国内学者刘红也很早敏锐地注意到了数据在科学研究中的重要性以及数据科学的快速兴起。她的博士论文以科学数据和数据科学为研究对象,对其做了哲学研究:考察了从数到大数据的历史,探讨了数据的本体论进路、数据的认识论基础、数据方法与数据范式,并论述了数据革命对科学范式变革和社会变革的重要意义和影响。在博士论文的基础上,她发表了《数据哲学构建的初步探析》⑦、《数据革命:从数到大数据的历史考察》⑧,提出了数据哲学研究的初步设想,认为应将数据纳入科技哲学研究范畴。

(3)大数据伦理问题引起了学者的高度关注

对大众来说,大数据带来的最现实问题是个人隐私的泄漏与保护问题。2013年的“斯诺登事件”更加剧了人们对大数据时代人们个人隐私保护的担心,因此大数据伦理问题引起了大众和学者们的共同关注,也成了大数据哲学的研究热点。