南大教授党报刊文:大数据使研究不再望数兴叹

中国IDC圈2月18日报道:党的十八届五中全会把握大数据迅猛发展的趋势,提出“实施国家大数据战略,推进数据资源开放共享”。毫无疑问,国家大数据战略的实施为社会科学研究打开了“另一扇窗子”。但是,目前社会科学领域对大数据的运用还存在一定分歧:支持者认为大数据将显著提升社科研究能力和水平;反对者则担忧大数据的运用会削弱社科研究中的伦理、价值等基本要素,可能带来社科研究基本学术精神的蜕变。实际上,只要我们把握社科研究的本质和使命,明确大数据的基本特征和发展走向,就能认清大数据运用给社科研究带来的新变化,改变“望数兴叹”的状况。

其实,利用大数据进行社科研究,并不能算是一种颠覆,反而可以说是一种传承。现代社会科学是近代西方自然科学复兴和科技革命推动的产物,在形成发展过程中不可避免地融入了结构、功能、规律等自然科学研究范畴,形成了实证主义与自然主义相交融、定性研究与定量研究相辉映的社科研究多重范式体系。大数据方法的运用可以为社科研究提供一种新的叙事方式和诠释手法,能够传承社科研究内含的自然科学研究范式,更好地用数据描摹过去难以刻画的抽象概念和知识本体,提供一种综合定性研究与定量研究的可行途径,提供一种无需预设理论假定而从数据集中抽象和发现规律的研究方法。展望未来,在社科研究中运用好大数据,不但可以提高社科研究者的研究能力,还能开启社科研究新局面。

提高社科研究能力。社科研究的目的是服务社会发展。当前,社科研究的数据环境发生了很大变化,政府、企业和研究机构越来越多的数据对社会开放,大量的数字化资料和研究素材极大降低了数据的获取成本,并且数据充裕带来了研究机遇的质变,以往不可研究、不能研究的问题成为研究可能。但是,面对零散、原始、复杂、巨量、多样、多变的碎片化数据缺乏必要的分析技术,大尺度研究中的数据源离散且阻隔,导致许多社科研究者缺乏相应的研究能力,不得不“望数兴叹”。大数据技术的发展和运用,可以弥补社科研究者在数据运用方面的短板,能够有效提高学者们的研究能力。

开启社科研究新局。大数据的运用有助于形成社科研究新思维,进一步推动研究数据有序开放、跨学科深度协作以及社会科学与自然科学技术融合,从而开启社科研究新局面。第一,实现研究全程评价和全部研究数据资产化。科学研究生成的文献、转换与加工数据、原始数据呈金字塔状分布,处于下层的数据一般难以得到有效评价和利用,是“看不见的学术金矿”。而数据资源化、研究素材数字化使得全周期和多维度的社科研究评价成为可能,进而衍生出新的学术资源利用机制,可以使全部研究数据都成为学术资产。第二,实现研究资料的碎片化重组。以往社科研究数据多采用结构化资料,有预设前提,应用面窄。而片段数据的碎片化按需重组,可以快捷有效地应对研究过程中的突发问题,同时兼顾研究效果与效率。第三,实现计算化分析与可视化表现的结合。非计算化的传统社科研究以问题为导向,基本逻辑关系是迭代思维,需要基于已知的研究观点提出新观点,而计算化分析更多采取融合、仿真或推演的方式。可视化技术则将计算化结果简明地呈现出来,能够增强社科研究的可理解性与可阅读性。第四,进一步推动学科融合与数据服务发展。面对学科交叉创新、协同创新的大量涌现,传统研究模式已难以适应,客观上要求计算科学与社会科学紧密协作,推动学科之间向网状交叉与紧密融合方向纵深发展,进而推动学科知识体系网络化。大数据的运用还将进一步推动学术技术分析服务、数据服务的发展。传统承担文献资料服务和普通信息服务的图书馆、情报服务机构等将向数据委托服务、计算分析服务转型。