沃尔玛大数据技术真相

曾创造了”啤酒与尿布”的经典商业案例的沃尔玛是最早开始投资和部署大数据应用的传统企业巨头之一,通俗得讲,大数据天然不是沃尔玛,但沃尔玛天然是大数据。

在大数据概念引爆流行产业界之前,沃尔玛已经开始了网站数据库整合迁移和Hadoop集群扩展工作,收购Kosmix,在此基础上建立Walmart Labs,并在近年着手收购专注于数据挖掘或移动社交的初创公司如OneOps、Inkiru,Tasty Labs,OneRiot,进军互联网。

沃尔玛希望通过大数据应用让消费者成为bigger spender,同时在电子商务领域奋起直追领导者亚马逊。

通过自身数据积累整合及并购研发,沃尔玛已然拥有一个涵盖消费者线下交易数据、沃尔玛网络商城电子数据与社交媒体应用数据为一体的实时更新积累的大数据库,为沃尔玛在做出决策前,将执行成本降到最低,并且创造新的消费机会。

可以虚拟一个场景来讲沃尔玛的数据操作:

Sam,是沃尔玛的资深会员,其近五年来购买商品的品种、数量、型号、时间信息,支付方式信息,商品配送信息,会员卡信息,住址、联系方式,甚至包括Sam在沃尔玛的购物流程监控视频、门禁数据等线下消费信息都已被沃尔玛的信息系统详细记录。

当Sam近日再一次驱车来到最近的沃尔玛大卖场时,刚进入停车场,Sam的手机或者iPad等移动终端的沃尔玛App可能已经收到购物清单上百分之八十以上商品的推荐信息和电子优惠券信息,App上还按商场流程标注了每件商品的具体位置、型号信息,沃尔玛测试中的“Scan and Go”的系统未来允许Sam用手机扫描商品,然后收银台手机扫描支付。而移动支付完成的瞬间,沃尔玛已经在数据端开始更新Sam的相关消费信息,并开始预判Sam下一次购买比如牛奶和啤酒等商品的时间和数量,并提交数据给APP推荐业务。

另外,Sam很喜欢一款899美金威尔逊网球拍但没有加入扫描清单,球拍旁边的塑胶运动模特脑袋里边的摄像头记录下了他的一举一动,包括Sam的停留时间,拿起网球拍的次数及观察端详球拍的视角,甚至他是左手握拍还是右手握拍等等,而第二个月,Sam的手机推送信息中已经有了沃尔玛推荐的性价比更高的一款Babolat轻碳球拍。

在Sam案例风光的背后,是沃尔玛实验室及相关团队在维持其大数据工作。Walmart Labs着手整合了沃尔玛旗下网站,将试点Hadoop数据节点正式集群扩展,把分散存放在Oracle、Neteeza、Greenplum等数据库中资源统一存入Hadoop数据仓库,并尝试进行内部数据共享分析。通过开发大数据工具加载交易数据,体量相对较小但结构化程度较高的线下零售数据结合电子商务网站数据为前向购物选择预测提供了基本支撑。

2000年网上商店作为应景产品上线,但ebay和亚马逊让沃尔玛认识到电子商务的可怕,便在随后几年开始发力线上。Walmart Labs 推出的 The Social Genome 能够让沃尔玛将消费者线下购物数据、网络浏览点击数据、社交网络关系数据及消费者个人数据等组合成实时更新扩展且具有定向预测功能的强大数据库,逐步解决线上环节与线下渠道数据匹配上的难点,并借助于消费者在社交网络上展现的兴趣,预测他们可能在Walmart下一个购买的产品。

通过对社交网络进行深度的数据挖掘,实现网站主页、商品搜索个性化,依据消费者的兴趣来排列页面上的结果。数据显示,截止到13年1月31日,沃尔玛全球互联网销售额增长30 %增幅十年来第一次超越亚马逊。

接着讲Sam的沃尔玛购物故事:

月末Sam车被借走了,所以选择去沃尔玛的网上商城,cookie自动登录后显示自己上一次登陆沃尔玛网店是在六个月前。Sam的首页推荐上有会员八折的罐装威尔逊网球,还有新款特价的全钢西门子榨汁机,Sam会心一笑:邻居Peter在twitter上抱怨自家的榨汁机真垃圾,自己前天点了赞,沃尔玛竟然知道了!随后Sam发现自己的facebook上的唯一关注音乐人Robbie Williams的新专辑就在眼前。

另外,自家附近的一家健身房年卡正在打折出售,Sam摸摸肚子上的赘肉一咬牙把年卡加入了购物车,心里还抱怨沃尔玛你TM怎么都知道这么多。

实际上,沃尔玛电子商城的消费者线上数据如浏览商品种类时间,购物车状态及支付方式,搜索记录等都将结构化然后汇入全球统一的Hadoop数据仓库,半年前Sam通过Polaris搜索引擎寻找网球拍的数据已经为沃尔玛实体店通过APP给Sam推Babolat轻碳球拍做好了准备。沃尔玛的线上大数据已经能够为其线下营收带来销售增量。