丁健:金沙江创业投资董事总经理,亚信董事长,同时也是百度的独立董事。
“大数据,我觉得这是第一次,在互联网发展这么多年以后,第一次真正的说需求和应用,已经走在了技术前面。”丁健说。他认为在此之前,互联网更多重复传统的东西,将效率提升上去,对于技术追求也没有现在这么迫切。但是大数据时代,由于有了这么多数据、以及随着数据采集、分析、应用带来的智能,对传统的技术提出了很大的挑战,技术已经大大落后我们数据创造和积累速度了,同时也带来了真正的颠覆性。不仅是传统社会没有的,也让互联网在这个环节真正发挥网络的效用,发生了翻天覆地的变化。
“我们可能是最早开始投资大数据相关的,那个时候还没有大数据概念,可能就是数据营销。当时我们跟管理层争论非常的厉害,他们总是想着怎么去赚钱,我就说你赶紧把数据采集下来,把数据拿下来。你把它分析出来的那个结果,将来那是金矿。”他说。也许是因为创办亚信,和运营商打交道很多,丁健对于数据,怎么把数据拿到具备更多敏感,“每天运营商的数据是了不得的金矿。”他说自己当时就非常坚信,“这是一块非常重要的东西”。
“借用搜狗王小川的那段话,他就是说人的进化到一定程度就变成了体外进化,各种各样的技术都在延伸这个部分。我觉得他的这种描述挺有意思,实际上人类到了大数据时代,是第一次想办法延伸自己的大脑。” 丁健说。“以前人类可以借助机器工具,现在却是真正在延伸自己的大脑、思维和智能这是一个巨大的飞跃。以前我们认为人脑是不可超越的,即便是人工智能也只是仿生,而不是延伸。到了大数据时代,我们突然意识到可以超越它。”
“你就设想有这样一个老中医坐堂,通过你鼻子怎么动,他就能告诉你心脏有没有毛病?你肯定会把他佩服的不得了,因为别的人是归纳不出来的。以后计算机就能做这些事,他可能在看完所有的视频和片子,进行了分析,就是把所有的心脏病人都看了一遍,他会说出你类似‘如果鼻子那样长的话会得心脏病’。”
丁健认为,大数据企业具备投资价值的,这一方面非常的重要。“需要有人去想向哪个方面去应用,或者应用机器学习。”尽管认为现在数据科学家,技术能力和研究能力跟不上大数据时代发展,但是有了大数据在那里,需要人们根据自己的专业去思考应用和商业模式,通过专业的知识去延伸。“你现在让我去分析石油里面某一些元素他们之间是什么关系?我肯定做不出来。”丁健说。“必须有专业人才和数据结合的延伸,专业内知识积累非常重要,在这个基础上可以结合大数据工具,同样的数据,对于不同的人来讲价值是不同的。”
而且对于很多人提出大数据会不会带来更大的企业集中,甚至垄断数据大量数据,丁健认为作为资产,一家公司垄断数据的可能性几乎是没有的。因为他认为,随着未来各个地方产生的数据量会很大,来源也会越来越多。其次,数据本身今天看来好像是有巨大价值,但是到以后数据本身价值不会那么重要,如何对数据进行提炼和处理的能力,会变成更有价值的东西。而且,对于数据保护,打破垄断都是政府的职能,政府也会思考怎么样用专利、反垄断的方法,既保护了企业/个人产权和数据,同时也让数据得到合理利用。丁总说:“今天,我们看到这个问题越早,越可以通过立法手段,一个是保护隐私,另外一个就是保护数据所有者的利益。与此同时,还要保护数据的合理利用,因为它是涉及到整个经济和未来产业发展的一个问题。所以从国家角度来讲,对这个问题要有一个非常重要的限制。”
当然,赢家通吃或者先行者肯定是有机会的,主要还是要看“数据炼金”的能力。丁健举例说:“同样的矿石到一个地方只能炼出铁来,到另一个地方,能把它练炼金子来,这样结果肯定不会一样。”
对于目前数据孤岛和数据孤立问题严重,行业之间的数据如何实现交换,怎么样建立交换/交易机制和促进新的新的商业模式。丁健认为,这些问题最终的解决,首先需要大家都有商业利益上的愿望;其次要建立起商业模式;第三要有一系列交换的机制。他举了一个例子:比如很多公司都需要用到人力资源服务,如果你的公司想知道整个行业工资的情况。你只需要你公司的工资信息提供出来,服务方并不需要给出你竞争对手的工资信息,但是他可以把行业各家公司的平均值告诉你,对你来讲已经足够了:既保护了隐私,同时实现了数据的共享。
丁健说这是他最喜欢用的例子。“关于未来大数据的交换一种形式,它既不会损失我的数据,我的数据不会暴露给别人,但是我的数据跟别的数据混合完了以后的结果,大家又都可以享受到。每个人都在贡献,每个人都在分享。”当然,他说这里面也还需要有技术上的突破,需要政府政策上的引领,以及开发市场方面的运作模式。
“比如说可以通过政府建立一个平台,如果我们公司有很多数据,我就可以把我的数据贡献出来,你们要想用我的数据你必须也把你的数据贡献出来,否则你用不到我的数据。”丁健说。“这个方面政府具有很大优势,毕竟政府占有的数据量最大,一旦政府领头了以后,行业内五六家、七八家加入就有了可能。可能行业内A公司你的数据最多,但是排第二的,第三的都加入进来,它们的数据结合了之后,肯定会有很多的数据是你老大也没有的,你这时候要不要也参加进来?”
“这样一个过程,将来肯定还会有一些市场博弈,还会有一些立法程序的推动,还有一些市场行为的引导。但是这件事情本身我认为不用担心,它一定会逐渐解决和完善。”丁健说。“现在我们已经开始做了,大家也都在高价布局,汇聚数据,设计商业模式。”
“这个战争已经开始了。开始会比较血腥,但是我不认为任何一个公司可以垄断这个领域。” 丁健说。