令人难以想象的大数据规模

6

20 年前,电子医疗记录还是个新鲜物,数字音乐还只是人们的幻想,Twitter 这个词汇还只是单纯地指鸟儿唧唧喳喳的叫声,Google 联合创始人 Sergey Brin 还只是 Wolfram Research 的暑期实习生。

20 年后的今天,信息革命已经为我们的生活带来了翻天覆地的变化。从直观的数字上来看,大数据的规模已经让人难以想象。根据市场调研公司 IDC 的报告,2012 年人们创造了 2.8 ZB(1 ZB 是 1 TB 的十亿倍)的数据信息量。09 年的时候,这个数据约为 0.8 ZB,2011 年时该数据是 1.9 ZB。

Wired 归纳了目前全球一些有意思的数据信息:

  • 商务邮件每年的数据量是 298.6 万 TB
  • 每年上传到 Facebook 的内容是 18.25 万 TB
  • Google 的索引条目 9.76 万 TB
  • 每年上传到 YouTube 的视频是 1.5 万 TB
  • 纳斯达克交易所数据库是 3072 TB
  • 2012 年人们发送的 tweet 量是 19 TB

在这个大数据时代,信息爆炸已经不可避免,预计 2020 年人们创造的数据信息量将超过 20 ZB。单单在今天,人们可能就创造了上千或者上万的 PB 数据信息量(1 PB 是 1024 TB),你的一条评论也将是这其中极小的一部分。