继“物联网”“云计算”之后,“大数据”成为了炙手可热的科技“新贵”,不少地方政府纷纷提出率先布局大数据产业、建设大数据中心。
大数据时代来临意味着什么?政府和业界如何应对大数据时代带来的变革和挑战?科技日报记者就相关问题采访了专家和业内人士。
大数据不只是“数据大”
究竟什么是大数据?中国工程院院士、工信部通信科技委主任邬贺铨认为,随着互联网的出现和发展,数据量每年以40%的速度递增,超过了现有计算机硬件和软件的处理能力,于是人们将无法在容许的时间内用常规软件工具对其内容进行抓取、处理、分析的数据集合称之为大数据。
多大规模的数据才算大数据?“大数据规模的标准是持续变化的,当前泛指单一数据集的大小在几十个TB(百万兆字节)和几个PB(千万亿字节)之间”。
也许你并没有意识到,大数据在日常生活中已不鲜见。邬贺铨举例道,比如一个城市里有几十万个摄像头,单个8兆比特每秒的摄像头一小时就产生3.6GB(千兆字节)的数据,一个城市几十万个摄像头一个月拍摄存储下来的数据量就达到PB量级。再比如,医院一天要做很多例CT检查,一幅CT图像几百兆字节,一个病人可能多达两千幅CT照片,加上病人数据需要保存几十年,自然产生非常庞大的数据量。“大数据已经渗透进了生活的每个角落,基于此,我们才说大数据时代已经来临。”
大数据只是数据大吗?显然不是。牛津大学教授维克托·迈尔-舍恩伯格在他与人合著的《大数据时代》一书中写道:人们在大规模数据的基础上可以做到的事情,在小规模数据的基础上是无法完成的。
大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉。
对此,邬贺铨也表达了相同的看法。“数据量大到一定程度,可挖掘价值超乎想象,是受样本数量所限的小规模数据难以比拟的。因此,世界经济论坛去年发布的报告指出,大数据就是新财富,价值堪比石油。”
大数据带来大挑战
身处大数据时代,如何收集存储海量数据,并将一堆庞大的看似毫无关联的“冰冷”数据转化成帮助决策的利器,无疑考验着人们的智慧。
正如邬贺铨所说,尽管大数据时代已经来临,但这并不意味着我们真正掌控了大数据,在大数据的收集存储和挖掘分析上,还有很多技术难题需要去攻克。