25个令人大开眼界的大数据现象

中国IDC圈4月11日报道,随着巨量数据时代来临,大数据一词已经十分普及,甚至有些被滥用的趋势。在这个时代,切身体会到「大数据」货真价实的存在、以及解读大数据的潜力成为我们的重要课题。

在此整理了 25 个所谓的「大数据现象」及「大数据事实」(Big Data fun facts)并附上数据来源供大家参考,看完你将会对大数据有多「大」有更清楚的认知,而且也对大数据的潜力及它带来的改变有更深一层的解读。

1.我们现在每两天产生的数据量是相当于过去到 2003 年为止累积的数据量。

2.根据 IDC,现今世界上 90% 的数据量是在过去两年多里所产生的。

3.根据 UCSD 的研究调查,2008 年光美国居民就生产了 3.6 ZB 的数据量。

4.2016 年的网络流量将会到达 1.3 ZB(Zettabyte = 10^21 bytes)。

5.根据 IDC 跟 EMC 的研究分析,估计了 2020 年时,数码数据量将会从 3.2 ZB 成长到 40 ZB。

6.企业所获取且储存的数据量每 1.2 年就双倍成长。

7.每分钟世界上有近 2 亿封 E-mail 被寄出,也就是每天 2470 亿封 E-mail,不过其中 80% 是垃圾信件。

8.每分钟 Youtube 影片被上传超过 100 个小时,而且每天上传的影片量要花你 15 年的时间来看完。

9.如果我们将一天内产生的数据全部烧录进 DVD 光碟内,那这些光碟叠起来可以搭成地表到月球的 DVD 高塔,而且还是「双塔」。

10.每天每分钟有约 570 个新网站出现。

11.大数据飞快成长,到 2015 年,为了处理大数据,全球多出了 4.4 百万个 IT 职位,也因此这方面的专业人士缺口,各行各业都在抢夺大数据专家 >> 还没决定未来方向的学子们不妨考虑这个领域。

12.根据 McKinsey Global Institute 的数据,到 2018 年时,美国地区将面临 14 万到 19 万的大数据专业人才短缺,以及 1 百 50 万个拥有洞察大数据的能力、因而做出好的企业决策管理阶层人才。

13.目前世界各地的数据中心(超过 50 万个)加起来相当于 6000 个足球场的大小。

14.从 2012 年到 2014 年,行动装置上传输的数据量成长了 81%,达到 1.5 Exabytes (Exabytes = 10^18 bytes),其中 53% 来自影音数据。

15.NSA 每天得分析 1.6 % 的全球网络数据量 —— 约 30 PB (Petabytes = 10^15 bytes)。

16.Hadoop 被公认为大数据主流技术,根据市场研究机构 Allied Market Research,Hadoop 市场价值从 2013 年 20 亿,估计到了 2020 年时会飙涨到 500 亿。

17.根据 IDC 的分析,2008 年时数码数据量就超过了目前已知的宇宙内星星数量,而且以数据成长的速度,2023 年时全球数据量将会超过亚佛加厥常数(Avogadro’s number)—— 也就是 6.022 × 10^23。

18.由于物联网的蓬勃发展,智慧型装置的数量将会从现在到 2020 年将从 130 亿成长到 500 亿。

19.在加州及一些其他地区,大数据已经被用来建立模式、预测犯罪,而且比现今的其他预测技术来得准确。

20.根据 Tata Consultancy Services Limited(TCS)在 2013 年发表的研究,各企业的数据里 51% 是结构化数据、27% 是非结构化数据、21% 是半结构化数据。

21.有将近 75% 的企业表示将逐渐增加对大数据的投资。

22.根据 CIO 的报告,38% 的机构根本不知道大数据是什么,27% 的机构对大数据则是一知半解。

23.根据 EMC2 的报告,25% 的企业已经有聘请数据科学家,24% 的企业正在使用大数据分析工具,57% 的企业则在慎重考虑采用大数据分析工具。

24.如果大数据能善加利用在医疗领域,以美国地区为例,将会减少 8% 的医疗开销并省下 3000 亿美元。

25.最近几年来,已经有 5 亿美元的风险投资基金注入大数据科技公司里。