从火种到核心,浅析Hadoop大数据用户的演变

我想指出的另一个重要发展是,随着时间的推移从最开始到现在的新浪潮用户,Hadoop项目本身已经是许多用户共同努力的结果,现在的Hadoop已经没有了哪怕一丝一毫初始成员的印记,在所有太常见以至于无人能够代表的行业里Hadoop只是其中之一,唯一值得一提的有且只有Doug Cutting。

现在越来越多的企业级产品在向Hadoop转,拉里·埃里森可不喜欢这种趋势,因为这无益于Oracle数据库的销售。这其实已经成为一种让Doug对Hadoop用户来解释大数据的缩水版请求。事实上大量用户根本不了解这个圈子里最初的那批家伙。时代还在继续进步。

第1.1代——周期性波动

这个圈子看起来封闭的地方,用我个人最喜欢的词来形容就是:技术债务。让我们回到第一代、、但更多成长为第二代的用户。我们能够看到,他们积累了大量的遗留系统,对不断进化的Hadoop生态圈而言这些系统需要不断维护和使用。在实际商业应用中这需要投入人力资本,比如开发产品、提供服务以增加收入。与最初创建它相反的是,当时看上去伟大的想法如今却成为一种不断花钱的负担。对第一代公司而言Hadoop的运行已经成为常态,他们修改代码库的版本以保证自己的Hadoop正常运行。对第二代公司来说,他们现在有非常丰富的工具可供选择,这些工具不需要他们自己去开发,但仍然需要自己去维护。

所以我预测,最终这些前几代的用户将废除其先前的努力,迁移到Hadoop发行版,这将帮助他们专注于自己业务,比如成功地开发数据驱动的产品和服务,而选择Hadoop的供应商将确保他们总是有这样做所需的数据中心。这里有一个伟大的未来!