大数据是什么?大数据能给我们带来什么?大家为此议论纷纷。
有人说:“大数据是什么,数据早就有了,从淘宝、百度、腾讯建立起来就有数据进行分析,如今换个说法变个“大”字,大家在里面讨论的不亦乐乎!”
又人说:“大数据给互联网大企业增加了巨大的成本,圈了全国各地地盘放了庞大的数据服务器基地,就算后期数据分析做不起来,那么大的地也能值几百个亿。”
也有人说:“大数据里面有黄金,但大家不知道从数据分析中能干嘛?”
而大数据到底什么,它能给用户和企业带来什么,为何各大企业为此争先呼吁数据的重要性。南方周末为这“大数据”做了很好的诠释,“大数据其实最核心的不在于‘数’,而在于‘大’和‘据’,所谓的‘大’,是指数据积累到一定的量级;而‘据’,就是找出论据,为企业决策做参考。”
而在笔者看来,爆发的互联网,缺的不是数据,缺乏的是对数据进行分析的专业人群,以及能对分析过后的数据进行研发,变成有决策性产品的产品经理。从实际情况看,在中国市场,大数据应用尚处于早期应用和摸索时期,而概念热炒,落地的案例并不多。大数据应用分析的技术创新和人才培养的两大发展瓶颈,如果不加以有效解决,大数据就会成为看似美好的“空中楼阁”。
对大数据呼吁最高的互联网企业,在不同行业,对数据的利用又大有不同。但这个数据是如何获取的,又是如何进行分析的,最终又能给我们带来什么,这是我们最想了解。
百度
个人认为,最早利用数据挣钱的应该是搜索引擎企业,而百度是最早从中获得一杯羹的国内搜索引擎企业。百度所获用户数据,自然是从用户搜索行为中获得。
熟知百度的人都知道,其主要盈利模式竞价排名和广告联盟,分别通过关键词的形式在百度搜索引擎平台上作推广以及通过人群定向、主题词定向等精确定位方式,分析网民用户行为及网站页面内容,将最具竞争力的百度推广内容投放到网站相应的页面。而这两大业务就是从用户搜索行为数据行为进行分析得来。
但这两种数据分析都还只停留在数据表层。就拿搜索广告联盟来说,这种展现形式往往是那些已经浏览过某个商品或者已经达成交易,再次重复展现给用户不免有些多余。而真正彻底的数据分析应该是用户买了这款物品,推荐的是与之搭配的未来用户需要的商品。
当然未来的百度绝不是仅限于此,百度此前宣布开放百度云计算、大数据等核心技术能力和搜索、社区产品在用户、流量上的优势。去年8月19日,百度在山西阳泉投资的预计2015年完工的云计算项目奠基开工,总投资额高达47亿元人民币,创下中国互联网企业最大的投资纪录。
结合云计算将数据进行整合,后续对数据进行挖掘再深造。正如国外搜索巨头早在2008年就开始推出“谷歌流感趋势”,用于预警流感的即时网络服务。该系统根据对流感相关关键词搜索进行数据挖掘和分析,创建对应的流感图表和地图,目前可预测全球超过25个国家的流感趋势。遗憾的是,“谷歌流感趋势”暂未将中国纳入其预测范围,而百度完全可以借此做同样的事情,预测目前H7N9的疫情了。
这种数据预测分析,往往要比国家疾控中心来的快。用户换上疾病,往往会先通过搜索引擎查询自身状况,过几天实在受不了才会去医院,这个时候搜索引擎最先获得了数据,往往比医院预测来的更快,百度大数据市场前景庞大。
阿里巴巴
在近日阿里举办媒体开放日上,淘宝网商业智能部首席商业智能官车品觉也向外披露阿里大数据进展。就此阿里集团董事局主席提出的“平台、金融、数据”三步走战略正逐渐清晰起来。继阿里集团架构调整、组建小微金融服务集团之后,阿里大数据的神秘面纱也在一步步揭开。
阿里集团数据的优势在于,用户从搜索到浏览、支付,形成深度的交易链条,其中每一个节点都将产生大量数据。而且阿里巴巴是年交易额过万亿元的中国最大的电子商务平台,目前有两万人左右,其中近千人从事数据业务工作。从数据中掘金阿里集团势在必得。
与搜索引擎数据不同,阿里淘宝除了非注册用户浏览商品之外,阿里基本是通过注册用户获取数据,而这种数据最终分析出的数据将更精确。就算一家三口都用同一台电脑购买东西,但电脑的MAC地址只有一个,从用户购买不同类别的东西,也能中分析出用户之间的关系。而这些数据,阿里除了做精准推送之外,通过用户搜索行为和购买习惯,还能预测今年流行的服饰,布料等等。