有一家大数据公司,曾估值41亿,可IPO时只有19亿,为何?

万众瞩目的大数据公司Cloudera终于上市了,但市值表现令人大跌眼镜。

作为国外Hadoop三驾马车中体量最大、估值最高的公司,Cloudera一直受到各方关注。2014年,Intel斥7.4亿美金巨资收购Cloudera约18%股份,使得Cloudera估值达到41亿美金,成为估值第二高的大数据公司,仅次于Palantir,一时风头无二。

上周五,Cloudera登陆纳斯达克市场,IPO价格只有19亿美金,还不到三年前的一半。尽管开盘之后,股价立刻上涨了20%,但短期内很难冲到41亿美元市值。

爱分析认为,从定性层面判断,Cloudera所覆盖的市场规模2020年将超过600亿美金,作为开源社区领导者,Cloudera在技术与产品方面优势明显。从定量层面判断,Cloudera毛利率未来有望提升至80%以上,销售费用占比也有望降至40-50%,盈利空间在5-10%。

综合判断,Cloudera当前市值处于合理估值区间,这个价格也表明了当前资本市场对大数据公司热情骤减,投资趋于理性。

Cloudera Manager是核心产品,帮助客户搭建大数据平台  

随着数据量越来越大,传统数据库已经越来越难以满足企业级客户存储和处理数据的需求,Hadoop等分布式架构成为很多企业的选择。

一方面,分布式架构降低了处理TB、PB级数据的成本,企业不再需要购买高性能机器来满足需求;另一方面,分布式架构的可扩展性更强,企业级客户可以根据自身处理数据的需求提升而不断增加机器,无需在最初就购买大量服务器。

然而,作为一项开源技术,原生Hadoop并不是一款符合要求的企业级产品,其系统稳定性、兼容性、安全性以及易用性都无法达到企业级客户的标准。而企业级客户自身IT能力相对较弱,基于开源技术进行开发符合自身需求的产品难度很大。

1

于是,出现了一系列基于Hadoop开源技术开发企业级产品的公司,Cloudera就是其中的佼佼者,它是世界上第一个发布Hadoop发行版的公司。

Cloudera的Hadoop发行版CDH是技术完全开源的产品,任何人都可以通过其官网免费下载CDH进行安装部署。那么,核心产品完全开放,Cloudera如何盈利呢?

产品安装部署仅仅是开始,使用产品过程中会碰到各式各样的问题,需要有专门人员帮助其解决问题,Cloudera的收入来源就是帮助这些企业客户解决他们日常使用产品过程中的问题,收费方式是以订阅形式,按年付费。

如果仅仅是这样,Cloudera与Hortonworks等其他Hadoop发行版公司没有太大区别,只不过是在开源技术封装方面有所差异,在一些模块的功能、性能上有所侧重。

Cloudera在产品上的优势在于,除了提供Hadoop发行版CDH外,还开发了一款名为Cloudera Manager的产品。这个产品的作用是帮助大型企业管理其Hadoop集群,提升运维能力,这是一个付费产品。

企业级客户一般都会有几十个系统,当企业级客户全面使用Hadoop架构时,每个系统都对应了一个或者多个Hadoop集群,如何将这些集群进行统一管理成为新的问题,而Cloudera Manager就是为解决这个问题而生,这点是Cloudera优于其他Hadoop厂商的核心。

开源社区领导者,技术实力强  

基于开源技术的公司,其在开源社区的地位直接决定其技术实力以及未来发展前景,而Cloudera作为Hadoop开源社区的领导者,在这方面无疑占据优势。

成立伊始,Cloudera就从Yahoo挖来一名技术大牛,Doug Cutting。Cutting是Hadoop社区的第一名作者,之前在Yahoo带领团队研发Hadoop产品,加入Cloudera后担当首席架构师,并在后来成为Apache基金会主席。

Cloudera正是在他的带领下,成为Hadoop开源社区中贡献代码最多,对社区影响力最大的公司。那么,成为开源社区领导者对Cloudera而言,到底有哪些益处?

首先,开源社区是个非常松散的组织,每天都有大量开发者在贡献代码,这就使得开源技术包含的功能非常庞杂,很多模块并不适合用于企业级市场。这个时候,开源社区领导者对整个开源技术的认识是最深的,很清楚其中哪些功能适合做成企业级产品。

其次,很多开发者同时在向社区上传代码,这使得开源技术的未来发展方向存在不确定性,如果基于某个版本开发产品,一旦与开源社区的发展方向相悖,未来这个产品的更新迭代就很难再借助社区的力量。而社区领导者在一定程度上可以影响技术发展路径,减小了自身技术路径与社区发展背道而驰的风险。