Docker生态会重蹈Hadoop的覆辙吗?

  这和目前无限夸大Docker的应用场景有异曲同工之妙,比如Docker向下取代虚拟化,Docker向上取代PaaS之类,几乎成了云计算的唯一技术,这种论调一直充斥各种Meetup/论坛。虽然技术从夸大到理性需要时间,但是理性不会总是迟到。

  Hadoop技术在发展,大数据的相关技术也在发展,Hadoop一直被诟病的处理速度慢,慢慢的被Spark/Storm等解决,特别在流数据处理领域。

  所以,时至今日,人们对Hadoop的态度趋于理性,它只适合在特定场景使用,可是,当初那些在Hadoop不太适用的场景使用了Hadoop的客户交了学费的事情估计没人再提了。Docker估计也是一样的,总有在夸大的场景中交学费的客户,可是只是客户没眼光吗?和无限夸大某种技术的布道师无关么?

  再反观大数据和Docker在全球的发展,在美国,无论是Hadoop和Docker并没有像国内这么狂热过。Hadoop技术来源于Google,成型于Yahoo(DougCutting),而炒作却是在国内。同样,Docker也在走这么个流程,在美国没有这么多的Docker创业公司,主要就是Docker,然后各大厂商支持,创业公司和创投公司都知道,没有自己的技术或是技术受制于人的公司不值得投资,既然Docker一家独大,再去Docker分一杯羹会容易吗?

  而国内二三十家的Docker创业公司,没有一家能对Docker/K8s源码有让人醒目的贡献(反倒是华为在K8s上有些贡献),但是都在市场上拼嗓门,不是比谁的技术有潜力最有市场,而是比谁最能布道谁嗓门大,谁做的市场活动多,某Docker创业公司据说80%的资金用在市场宣传、Meetup上,而且不是个别现象,是普遍现象。反应了某些Docker创业者的浮躁心态。

  三、Hadoop生态圈的演进

  Hadoop兴起和生态圈紧密相关,Hadoop的生态圈的公司主要是两大类——

  第一类是Hadoop的各个发行版公司,如Cloudera、HortonWorks、MapR、Intel、IBM等,第二类基于Hadoop做各行业的大数据项目实施或大数据应用和工具,如Tableau、Markerto、新炬、环星等

  随着大数据的热度提升,Hadoop生态圈的两大类公司蓬勃发展,但是市场有限,市场还没有成熟,竞争就很激烈,特别是第二类做项目实施的企业,那就只能靠烧钱。

  问题是如果是消费者市场,通过烧钱先把市场占领,然后再通过其他手段收费盈利,比如淘宝通过向卖家收费盈利,滴滴打车之类的未来可以通过让司机花的米抢好单、大单可以实现盈利,而Hadoop是企业级市场,通过亏钱树立案例标杆,然后复制,这条路走的并不顺利,因为复制案例的时候会碰到竞争,一开始就低价做烂的市场,客户不愿花钱,总有低价者抢市场,复制案例往往变成低价竞争。低价竞争很难把项目实施好,基本是个多输的模式,客户并没有得到自己预期的大数据项目价值,或是打折的价值,实施厂商没赚钱,留不住人,招不到好的人才。

  这类生态圈公司的发展趋势是最终会留下少数几家公司,规模做大,其他的公司会被淘汰,现在还没有走出各个集成商苦苦支撑的时代。

  对于第一类做发行版的Hadoop厂商,在烧钱进入后期阶段,日子也开始不好过,因为项目实施厂商的大多选择不用发行版,只用开源,发行版和相应的付费支持很难卖出量,进而难以盈利。资本市场成了继续烧钱的救命稻草,Hortonworks第一个上市, 16元的发行价,大数据概念蜜月期一过,要开始考察业绩的时候,股价步入漫漫熊途,到现在只有9元左右。CloudEra虽然没有上市,但是已经融资12亿美元,目前在Hadoop发行版,CloudEra和Hortonworks占据了最大的市场,特别是CloudEra的市场更大,即使CloudEra有巨大的Hadoop市场和技术优势,CloudEra到现在也不敢上市。

  现实很残酷,CloudEra的盈利并不让人满意,现在上市,资本市场不会给出个好股价,但是CloudEra的困境是如果迟迟不上市,大数据热点成为非热点,资本市场那就考察的是盈利能力—市盈率,不是市梦率了,而CloudEra的盈利能力在目前状态能让资本市场满意吗?虽然Hortonworks上市的时候赶上了市梦率。

  技术的演进同样在影响发行版的Hadoop厂商,Hadoop从1.0到2.0,技术有较大的改进,Yarn取代Map-Reduce,原来众多的发行版面临着自己对Hadoop 1.0的定制如何合并到Hadoop 2.0去的问题,定制的越多,合并的难度越大;定制的越少,和开源没啥区别,体现不出价值,这是发行版面对的两难问题。