目前,大数据不仅完全镶嵌在购物、订票、旅行等日常生活之中,更是在气象学、石油勘探、天文学、医学等诸多科研领域发光发热,其呈井喷式增长的数据量对更高层次的分析和洞察既提供了支持,也提出了相应的要求。
在医学领域,2003年算是大数据涌现过程中的一个里程碑。那一年第一例人类基因组完成了测序。此后,数以千计人类、灵长类、老鼠和细菌的基因组扩充着人们所掌握的数据。每个基因组上有几十亿个“字母”,计算时出现纰漏的危险又同时催生了生物信息学。这一学科借助软件、硬件以及复杂算法之力,支撑着新的科学类型。
图为西尔维奥•康特中心利用数据挖掘理解神经精神障碍的成因以及之间的关系。来源:Andrey Rzhetsky,芝加哥大学。
众所周知,漩涡和窄洋流在海洋中传送热量和碳。为了深入相关研究,海洋环流和气候评估项目提供了所有深度的洋流,在此基础上,一幅2005年6月至2007年12月的海洋表面洋流示意图集成了带有数值模型的卫星数据。这些示意图利用大数据测量海洋在全球碳循环中的作用,并监测地球系统的不同部分内部及相互之间的热量、水和化学交换。