华尔街“德温特资本市场”公司CEO保罗·霍廷每天的工作之一,是利用电脑程序分析全球3.4亿Twitter账户的留言,进而判断民众情绪,再以“1”到“50”进行打分。
根据打分结果,霍廷决定如何处理手中数以百万美元计的股票。霍廷的判断原则简单得令人发指:如果所有人似乎都高兴,那就买入;如果大家的焦虑情绪上升,那就抛售。这一招收效显著—当年第一季度,霍廷的公司获得了7%的收益率。
这只不过是大数据应用中最初级的案例。不妨想象一下,今天中国互联网每60秒可以发生哪些事情?
答案足以让人瞠目:60秒内,百度搜索达到450万次,微博发送80万条,淘宝发生8000笔交易,QQ空间照片上传15万张,数据就像滚雪球一样,越滚越大。无论你喜欢与否,整个庞大的数据生态圈早已汹涌扑来。
IDC的研究报告显示,2020年预计全球新建和复制的信息量已超40ZB,是2012年的10倍,而中国产生的数据量将超8ZB,比2012年增长22倍。
一个更加形象的表述是:2020年,全球生产的数据将是地球上沙粒总和的4倍。快速膨胀的数据量,促进了商业智能市场的发展。
毫无疑问,银行、交通、化工—几乎你能够想到的领域,企业决策者们无一不想用大数据作出更明智的判断。
大数据的可视化分析,未来或将成为“企业标配”。正如比尔·盖茨所说:“如何搜集、管理和利用信息,将决定企业胜负。”
决策者对于“正确判断”的渴望,让大数据行业的淘金者们看到了一种可能性—把枯燥无味的数据转变为滚滚现金。
淘金者中,不乏IBM等IT巨头。它们的做法是,让大数据的结果更加简明地呈现在决策者面前。
这些枯燥无味的数据通过可视化后,有些将变成普通的时间轴,有些则像蒲公英,有些则是铺满整个画面的泡泡,泡泡中显示企业客户的粉丝正在谈论什么话题。
早在2013年,IBM实验室就打造了名为“Project Neo”的软件,试图让用户与数据互动。IBM的基础理念是,让不具备专业技能或知识的商务用户无需被迫学习分析技术,便可使用Project Neo软件处理原始数据集合。该软件采用简单界面、交互式可视化与高级分析,可自动使隐藏的洞察与模式浮出水面,并引导商务用户找到深藏于数据中的答案, 而且该软件可托管在云端之上。
举一个例子,当一位营 销经理发起简单的提问,输入相关数据,可视化与引导分析软件就能够发现是什么原因导致某个季度销售额下滑。营 销经理可在第一时间将发现的结果与其他员工分享,并通过向团队成员发送输入通道,让团队成员补充更多信息。
IBM们也有自己的尴尬:过于昂贵的软件价格,让中小企业望尘莫及。这让一些中国公司从中看到机会,它们希望“大象与蚂蚁共存”。
国内数据可视化分析厂商永洪科技正是其中之一。其CEO何春涛总喜欢提及永洪科技服务母婴社区和电商平台“宝宝树”的案例。通过大数据可视化分 析,宝宝树每个月会提炼出一个排名靠前的用户关键词。“孕酮”这个搜索词汇在三年前,根本无法进入关键词前200名,但从2014年开始,“孕酮”则一直 能够进入关键词前十名。
这一发现引起了宝宝树注意。调研之后发现,污染导致孕酮异常。于是,公司与中科院对接,看是否应该根据需求研发一款调整孕酮的孕妇奶粉。最终,这款奶粉销量极佳。
国内另一家名为海云数据的公司,则把数据可视化生意做到了大数据发源地:美国。2014年12月,海云数据创始人冯一村开始了一场“美国之旅”,他们的目的是“拿下”联合利华的服务订单。彼时,联合利华希望解决“快速分析”和“快速决策”问题。
在这片陌生的战场上,冯一村“攻城略地”的方式就是尽可能多提出问题,发现客户更为细枝末节的痛点需求。“这个点是不是你想解决的?那个问题是 不是你迫切需要解决的?”过程或许复杂,但结果令人满意。这笔百万级的单子,冯一村在半个月内拿下。“现在,联合利华还在不断提出新的需求,希望解决更多 问题。”
IDC的预测是,截至2014年底,70%的大型企业机构已经购买了外部数据,到2019年该比例将达到100%。不仅如此,2018年,半数消费者在日常生活中都会用到基于认知计算的服务。