Teradata首席技术长宝立明:大数据将消失,但融合到你的业务中了

3.你对大数据的定义是什么?

一般来说我们用3V定义大数据,容量(Volume)、快速(Velocity)与多样性(Variety),其中我认为最重要的是多样性,资料不只来自那些传统管道,有更多来自非传统管道的非传统资料产生,我认为价值(Value)是第四个V,人们常常忘了这件事,他们专注于技术,却忘了创造价值,但这却是一个大数据计划能否成功的关键:这不只关乎技术,而是你能用技术创造出什么价值。

4.台湾有许多中小企业,许多中小企业也许认为大数据是个离他们很遥远的概念,因为他们根本没有「大数据」,您会给他们什么样的建议?

这些小企业一看到大数据就会想说,喔这一定是很大的数据才有办法做,但数据的量其实从来都不是重点,我认为「大数据」是个非常差劲的命名,因为它让人们直接联想到「大」,但数据的大小其实是最无趣的部分,最重要的其实是那些你从来没有想过可以用的数据以及那些非传统的资料,我认为这才是人们对大数据应有的认知。

有许多新创企业在思考如何用大数据创造全新的商业模式,例如硅谷最近有一个正在做P2P交易服务的新创公司,比如说我们一起去吃午餐,你买单,然后我透过手机给你我的部份的钱,这不是什么新的概念,但这家公司有趣的地方他不收任何手续费,而银行一点都不喜欢这个主意,你知道现在的银行交易都必须额外负担手续费,银行于是说:「你怎么可以完全不收手续费?」这家公司说,因为这些交易资料本身的价值远远超过手续费本身。

从此之后,这家公司会知道你我之间有一种连结,如果我们每个礼拜五都出去吃饭,他们就可以判断我们之间有强烈连结,如果我们一个月或一年才吃一次,那么也许我们之间的连结比较弱,这家公司可以藉此判断人与人之间的关系强弱,你也许会说:那又怎么样?这可以干嘛?这家公司将会知道谁是社交意见领袖,如果他要卖新产品,他可以先从这些人开始着手,例如我也许会买他的东西,但我没有朋友(笑)所以它就只能卖出一项产品,但你有一百个朋友,你也许是个疑心病比较重的人,所以我要花比较多功夫来说服你买东西,但你一旦用了而且觉得好用,那么你很有可能会将这个讯息散播给你其他一百个朋友,那我搞不好可以再多卖50个产品,这就是一个善加利用社交数据,而且突破旧有思考模式的例子。

5. 如何用大数据创造商业模式?

这是个颇为复杂的问题,因为大数据是由很多不同元素组成的,我会把大数据认定为是比交易系统更深一层的互动分析,首先,如果你有一笔订单,你就得到了顾客的价值,但你无法了解他们为什么如此行动,如果我能够了解他们的行为喜好,我就可以创造更好的顾客体验,我创造了更好的顾客体验,他们就会越买越多,他们会停留更久,如此我当然就可以创造一个非常强大的商业模式。

基本上所有的电商网站都在做这件事情,因为电商网站无法直接与顾客接触,所以他们必须透过分析数据来与顾客建立关系,这是个很显而易见的商业模式,如果你不分析数据去改善顾客经验,顾客就会离你而去。如果就制造业来说,预测性维修是比较常见的大数据商业模式,这跟传统的维修模式全然不同,这当中的经济价值差异是数以千万的美元,就算对中小型企业亦然,如果你知道这些企业每年花多少钱在维修设备和安全改善,你就应该知道预测性维修是门好生意。

6.这些对企业来说是技术层次的问题,但商业嗅觉是否才是如何让大数据变现的关键?

是的,我称之为直觉,你为了验证你的假说,于是你设计了一个实验模型,如果你没有商业嗅觉,你很可能会实验了一千次但得到很差的结果,我相信你一定有听过这个笑话:「一百万只猴子也可以写出莎士比亚等级的著作,只是我们要等很久而已。」你放猴子在那边一直打字,总会有好的产出的,但这其实不太好,对吧?所以我认为还是需要具备一定的商业眼光。

好的数据科学家和不好的数据科学家的差别就在于他们的商业眼光,我认为这不只是管理阶级的职责,而是一个数据科学家的职责之一。

7.大数据项目牵涉到许多跨部门的协作,而不只是IT部门的事,你认为这会更象是一个管理问题而非技术问题吗?

我的确观察到许多只专注在技术层面的公司,他们的大数据表现通常都不怎么好,管理者必须确保你在埋首进行的事是有商业价值的,而不只是在玩技术而已,在麻省理工学院有个词用来形容这些只埋头搞技术的人:追随流行者(Fashionist),这些人盲目追随科技新潮流,看到云端运算就赶快跑去搞云端运算,噢看那边是大数据耶,大家都有我们一定也要有! 他们不知道为什么需要,只是因为大家都有,他们就要有,这不是一个好策略。