更多的大数据不在云中

亚马逊首席技术官沃纳·沃格尔日前开了一个关于用云计算完成大数据的话题,你希望他发表些什么观点呢?

这一观点引人注目,包括对大数据分析尤其是实时分析预测的需求.企业想拥有这一能力,对于沃格尔而言,这意味着他们需要公有云——特别是亚马逊的公有云。沃格尔同时也表示,我们都希望像Hadoop这样的基础设施能够隐身在像亚马逊Redshift这样的分析层之后。

从目前来说沃格尔对了一半,而在5年之后他的观点将完全正确。

事实上是,大数据已经真的很大了,大多数企业都已经有了一些大数据项目,他们也都看到了与沃格尔同样所看到的好处,例如实时分析,包括预测分析,将能帮助CIO在IT上为企业带来非常巨大的价值。

公有云平台的确引人注意,比如自动和自助式的即时的可扩展性特征,以及内建的像hadoop这样的大数据服务。但事实上,现在大多数被称之为大数据的项目还只是运行在企业自己的数据中心上。所以,要往前发展貌似还需要一些时间。

原因也很简单很好理解:使用本地存储系统意味着和运营数据库集成不会因为网络连接的问题而产生问题。在许多案例里,企业把海量数据存储到供应商的数据中心里感觉非常不错,但对供应商产生依赖后你就会非常希望但愿它不要出问题,能够正确加载。

此外,安全和合规性问题仍然是公有云的主要担忧因素,把数据存储在本地的话用起来会更方便一些。另外,因为没有网络传输的延迟问题,本地系统的性能可能也会比较好。最后,软硬件如今都已经非常便宜,把系统搬到云上相比本地系统,投资回报率未必会比你想象的好到哪里去。