当一切都可以量化,大数据本身就会说话。我们对商机的发现其实就是听的能力——只是传统的耳朵未必听得见“不可能”的声音。
从万事万物中提取数据并存储数据,这是大数据开发的前提也是产业链的上游
世界上万事万物都可以转化成数据,而“转化”本身就有着巨大的技术含量,因此,它无疑是产业链的上游。
在人类社会的发展历程中,计量从长度、重量不断扩展到面积、体积和时间,可以说相当漫长。19世纪随着科学家发明新工具,电流、气压、温度、声频之类的自然现象被量化,其间只经过了一两百年的时间。而计算机把世界推上大数据阶段,仅仅四五十年时间。
文字可以变成数据,谷歌有了数字图书馆,我们都有数据化的书籍;方位可以变成数据,只要你的手机装有百度地图,GPS导航就能用一组数字显示你的位置;沟通可以变成数据,社交网络将我们日常生活的无形元素包括情绪提炼成了数据;甚至作为人本身,我们也一样被数据化了,乔布斯在癌症治疗过程中,医生就为他制作了一个包括整个基因密码的数据文档。
数据化本身造就了一个一个商机。美国四大机票预订系统之一的ITA仅将数据卖给Farecast就是一笔不小的收入。在中国,许多银行保险公司都愿与网络公司合作,它们看中的正是网络公司的数据。在深圳,我们常看到中科院深圳先进技术研究院的一辆怪异的汽车在街上行走,它就是为深圳“智慧城市”建设采集数据的,只可惜,它不是企业行为。
把万事万物转化为数据,还需要存储数据。事实上,大数据时代正是随着存储设备的大幅降价而成为现实的。目前Facebook每天要存储大约100TB的用户数据,美国国家航空航天局每天要处理约24TB的数据,只要推想一下,就能估算数据存储市场有多大。
在大数据存储产品上,华为一直走在国内企业的前列,它们推出的N8000、CSS已为全球客户所青睐。作为高性能存储的一个指标,华为的大数据解决方案在不久前的测试中达到300万OPS,也就是说每秒能进行300万个操作。
数据巨大的、不断被开发的潜在价值,为技术类公司和分析类公司提供了市场
数据本身不是生产力,只有通过技术分析才能产生价值。正如谷歌一位负责人所说,数据只是一个新的生产要素,原始材料从数字流水线的一端输入,而处理后的信息则从另一端输出。
当然,对数据进行处理分析,远非谷歌负责人说的这么简单,不然就不会有众多的数据技术类和分析类公司。一个叫MasterCard Advisors的部门收集和分析来自210个国家的15亿信用卡用户的650亿条交易记录,用来预测商业发展和客户的消费趋势,并把这些分析结果卖给其他公司。美国Inrix公司通过汇集美洲和欧洲1亿辆汽车的实时交通数据,采用软件分析预测交通状况并同步到卫星导航系统中。它们吃的都是技术和分析这碗饭。
数据具有再利用性,它不会因已使用就失去价值;数据具有可重组性,当一个数据与另一个数据结合,它就可能产生新的创意;数据具有可扩展性,一个数据,本来为一个目标而采集的数据结果常常一举数得。数据的这些特点,让数据分析具有无限的可能,只要我们拥有数据分析工具以及必需的设备 ,我们就可以在更多领域更快更大规模地处理数据,创业的机会无处不在。
那么,我们说的数据分析专才是什么样的人呢?是计算机专业人才吗?不一定。他们可能是计算机外行,但只要他们所具有思维的不受限制——用行业术语表达就是“大数据思维”,他可能就是专才。“他们思考的只有可能,而不考虑所谓的可行”,这是数据分析对人才提出的要求。
据麦肯锡全球研究所的一项调查,目前,美国需要19万名以上具备“深度分析”专长的人员,而对具备数据知识的经理的需求超过150万。有人甚至预测,随着数据科学家的崛起,行业专家必将消亡,理由是“数据科学家不受旧观念的影响,能够聆听数据发出的声音。”
大数据引发思维变革,传统产业在新思维的审视中将充满前所未有的生机
大数据是人类历史上的一个里程碑,它使人类第一次有条件获得和使用全面的、完整的和系统的数据,它所引发的思维变革必将使传统产业因为创新而充满前所未有的生机。
《纸牌屋》是被中国网友们戏称为“白宫甄嬛传”的美国政治悬疑剧,它目前正在全球四十多个国家热播。这个叫Netflix的视频网站首次自制的电视连续剧何以能成功?原因是,它们拥有大数据思维。
在Netflix视频网站,用户每天产生高达3000多万个收藏、推荐、回放、暂停之类的行为,订阅用户每天还给出 400万个评分,300万次搜索请求。这些巨量的数据使Netflix发现,一部影片如果同时满足几个要素就可能大卖。于是就有了《纸牌屋》的成功。
影视行业如此,传统报业一样如此。一个叫克罗斯的小伙子创办Prismatic网站,他通过收集网上资源并加以排序而一炮打响。这个对新闻一无所知的小伙子成功的原因是:他通过数据分析发现,一篇报道是否受欢迎,读者并不介意它来自于一个青少年博客、一个企业网站还是一家大报,信息来源并不重要。
“关注相关关系,而不是因果关系。”《大数据时代》一书的作者将此作为一种思维变革提出来不无道理。许多看似不相关的事物在大数据中就有了联系,而这种联系正是商机所在。
一个叫鄂威的清华大学毕业生开发了一个类似于“社交管家”的软件,他在做数据挖掘时发现,听罗大佑现场演唱会的人对上海大众汽车兴趣度会提高30%,作为创业者,鄂威正在做着这种风马牛不相及的生意,当然他一样也在追问为什么。
数据的真实价值就像漂浮在海洋中的冰山,你看到的只是冰山一角。弗洛伊德和海明威的“冰山理论”也适用于大数据的价值评估。
世界的本质就是数据。这是物理学家说的。只不过,过去我们对这一看法多持异议。
支持我们这一异议的是数据获取之不易。人类早期,纯粹凭直觉、经验、假设和推理去认识这个世界;后来当我们有能力获取部分数据的时候,抽样调查就成了我们认识世界的一种方法。我们从来没有想过“样本=总体”,可它却不经意间就变成了现实。
这就是全球热议的大数据时代。在这个时代,雁过留声,人过留数据。只要你随身携带智能手机和计算设备,你的位置、行为,甚至身体生理数据等每一点变化都成了可被记录和分析的数据。根据技术研究机构IDC的预计,新数据以每年50%的速度在增长,或者说每两年就要翻一番多。
面对数据,许多公司也曾进行过开发,如沃尔玛就通过分析销售、定价和经济、人口、天气方面的数据来为特定的门店选择合适的产品,并确定降价的时机;中国移动也用它来进行客户消费行为分析,并用以调整自己的服务内容和价格。但是这些都太低估数据的价值了。
不仅企业本身低估,整个社会都低估了数据的价值。以Facebook为例,在2011年供投资者评估公司的审核账目中,它的资产仅被评估为66亿美元,这些资产包括计算机硬件、专利和其他实物,唯独不见数据。我们对百度、腾讯的认识也一样,没有人把它们拥有的数据当成无形资产。
但事实上,数据已成为企业最大的无形资产。在达沃斯举行的世界经济论坛的一份报告上,数据已被宣布成为一种新型的经济资产,就像货币或者黄金一样。与之相应,对大数据的开发也正在兴起,巨大的商机吸引着全世界的创业者。