第四,隐私泄露是大数据应用中的重要问题。克劳福德认为,大数据的倡导者关于“大数据是匿名的,因此它不会侵犯我们的隐私”一说大错特错。尽管许多大数据的提 供 者 尽 力 消 除 数 据 中 的 个 体 身份,但身份重新被确认的风险仍然很大。鉴于利用大量公共数据集可以推断很多信息,这使泄露个人隐私成为“日益严重的担忧”。
第五,大数据为科学研究提供了新的途径,但不可断言“大数据是科学的未来”。克劳福德称,大数据的研究方法只能统计某件事情发生的频率和相关性,但不能得出因果关系。将大数据策略和小数据研究相结合也许是更好的科学研究途径。
库克耶和舍恩伯格也认识到了大 数 据 理 论 的 一 些 内 在 瑕 疵 。 在《大数据的兴起》一文结尾,两位作者表示,大数据是一种资源和工具 , 它 的 目 的 是 告 知 , 而 不 是 解释;它意在促进理解,但可能导致误解关键在于人们对它的掌握程度。他们认为,人们必须用一种不仅欣赏其力量、而且承认其局限的态度来接纳大数据。
(卢朵宝)