阿里巴巴的大数据梦:数据分层次开放 保护个人隐私

能识别用户之后,在写商品推荐文字的时候,不再是过去那样千篇一律地使用“亲”作为开头。

“今天很多网站犯的错误就是,根据个人购买记录,推荐一个类似的产品。其实用户很可能买过了。用户要的是你给他推荐一个跟他相似的人买的东西。”秦予对南方周末记者说,以前的数据研究思路是从产品出发,大数据时代是从人出发,先去找人。

支付宝发展大数据业务,目前主要是为内部服务。比如,过去支付宝很重视新客户的获取,但后来发现开账户的人多,关账户的人也不少,通过数据分析,支付宝建立了一个流失预警模型,预测每一个人未来三个月是否会离开支付宝,并对潜在的流失用户做一些唤醒。

“支付宝是准金融行业,数据比较敏感,涉及用户隐私,还没有到开放的阶段。”秦予对南方周末记者说,支付宝非常忌讳提供商用化产品给商户,很多合作方惦记着的是支付宝的数据,但这是支付宝的高压线。

“支付宝发展大数据的目的,跟淘宝和天猫有点偏差。我们更多地是为内部服务,淘宝和天猫更多地强调商业化。”秦予对南方周末记者说,阿里巴巴集团的大数据业务商用主要是淘宝平台的几个公司在推进。

“数据分享平台”战略

淘宝平台的数据大概可以分成三块,一是离线的数据,比如什么地方的人最爱吃大闸蟹。另外一些在线数据,主要是图片,淘宝一些大的卖家都把图片存在淘宝里面。还有一些信息是用户的淘宝收藏夹。

2010年3月,淘宝宣布将面向全球首度开放数据,并制定了两条大原则:数据分层次开放;涉及消费者个人或者企业隐私的数据绝对保护。

淘宝的数据开放一是对公众的免费信息,比如推出类似于宏观经济数据的“淘宝指数”。商家可以根据以往的销售信息和“淘宝指数”进行生产、库存决策。对于大众来说,淘宝的数据发布就像是统计局和价格监测机构的功能,淘宝指数相当于行业和宏观经济的各项指标。

作为针对企业的数据开放的商用产品,淘宝推出了数据魔方产品,通过淘宝数据魔方平台,商家可以直接通过数据魔方产品获取行业宏观情况、自己品牌的市场状况、消费者行为情况等,但是不能获得竞争对手的数据。

2011年4月,数据魔方正式上线。在“店小二”的推广下,林氏木业成为第一批使用者。林氏木业是一家完全依靠互联网平台销售家具的电商公司。

该公司一位市场推广人员对南方周末记者介绍了数据魔方的具体运用过程:依据数据魔方关于热词的各项数据变化,及时调整优化商品标题,提高宝贝排名,进而获取更多流量,提高销量。