IDC最新研报:大数据在2020年

IDC和EMC刚刚发布了一份题为“2020年的数字宇宙”的报告,预测了从现在开始八年间的大数据发展状况。下面所列的是一些有意思的亮点。

● 到2020年,数字宇宙将会膨胀到40000EB,或40万亿GB(也就是说2020年每个男人、女人和孩子可以均摊到5200GB以上)。从现在起到2020年,这个数字宇宙的膨胀率大约是每两年翻一番。

● 到2020年,数字宇宙中将近40%的信息都可能会被云提供商“触摸到”——也就是说,一个字节在从源端到目的端的途中都有可能在云中的某个地方被存储或者被处理。或许,还有15%的信息将会始终驻留在云中。

● 在数字宇宙中,需要加以保护的数据占比率会比数字宇宙自身的膨胀率还要快,将从2010年的不到三分之一增长到2020年的40%。

● 今天,需要保护的信息中只有约一半受到了保护。到2020年,这种状况可能会略有改善,某些需要更高安全的信息会比数字宇宙本身增长的更快,但这依然意味着未受保护的数据量也将会以26%速率增长。

● 到2020年,数字宇宙中约三分之一的数据(超过13000EB)将具有大数据价值,但只有当其被标签、被分析时这种价值才会显现。2012年,我们认为数字宇宙中23%的数据(或643EB)对于大数据来说会是有用的,如果它们被标签和分析的话。然而,技术总是超越需求,实际上,我们认为可能有用的数据中只有约3%的数据被标签,而被分析的数据则更少。(波波编译)