万昊认为,大数据并不必然就一定有效果。除非人们能从中发现有用的信息和规律,这才是大数据真正重要的地方。传统营销中人群定向是一种退而求其次的方法,广告主直接找到他的核心或潜在用户才是最直接的。而京东大数据就可以实现这种直接的定向,比如定向看过或买过指定商品的、指定品牌和店铺的用户。
京东怎么知道用户在京东的体验得到满足了呢?这也有可以量化的指标衡量:用户购买的商品总额和商品数。京东广告将此两个指标作为主要优化目标,实现的方法是大规模机器学习、标签标引。
万昊说,京东的搜索广告和推荐位广告是一套架构。同一个广告单元,可以有两种定向:购物行为定向和搜索定向,排序根据质量因子×出价决定。所谓质量因子就是机器学习模型起效的地方,比如用户看了两个商品,却只买了其中一个,肯定是对一个感兴趣,对另一个兴趣不大。京东广告使用深度学习技术来预估用户的兴趣,根据结果选择让何种广告处在更显眼的位置上。这样,用户买到了他想买的东西,广告商推广卖出了自己的东西,京东帮助用户选到了心仪的商品,同时也从广告商那收到了广告费,达到三赢的状态。
杜宇甫:构建大数据生态环境京东集团云平台数据首席架构师杜宇甫发表了题为《构建大数据生态环境》的主题演讲,他的演讲内容包括大数据的产生历史,大数据的分析过程以及对于大数据生态的思考。
杜宇甫表示:生态的意义在于整个系统中包含了数据的生产者、分解者和消费者。每次信息革命,人类的数据都在不断增大,当“互联网+信息”爆发的时候也即是人类进入大数据时代的开端。杜宇甫将大数据生态分为:数据收集、数据存储、数据建模和分析、数据应用五个阶段。五个阶段环环相扣,让数据在生态中进行自主运转。
杜宇甫认为,消费不足并不是因为需求不足,而是由于产能供给不足,只有创新才能激发新的消费空间。
针对创新激发需求这个问题,京东建立了数据云平台,目的是想建立一个大的数据生态环境,让数据能在这个生态中循环起来。在这个生态里,任何一个人,在任何一个环节上都能够用起来,玩起来。“当用户数据不足,无法用于决策和优化推广的时候,我们可以为用户提供咨询服务,帮用户做数据收集;我们也有数据市场(京东万象数据开放平台)可以进行数据共享和交易;如果用户不懂数据价值,我们可以提供数据专家帮助用户挖掘价值;如果用户无法支持海量数据分析,我们可以提供分布式数据集群,硬件和软件资源帮用户处理数据;在上层我们提供数据生成工具,把整个数据环节串联起来,最终帮用户将数据变现和产生更多商业价值。数据的交易和增值,开放和共享不仅给企业自身带来价值,同时也会为其他的企业和整个社会带来积极的影响。”
京东数据云生态包含:数据采集工具、离线+流式数据分析平台(BDS:Big Data Service)、实时数据分析平台(RAS:Real-time Analytic Service)、数据集成平台(DAG:Data API Gateway)、数据交易平台(万象),以及云海数据。为用户提供咨询服务、数据专家、数据分析能力、数据开放支持、数据增值服务等全业务线解决方案。京东数据云依托京东基础云稳定强大的IAAS底层服务系统,在基础云之上架设了数据云生态系统,值得用户信赖。
京东的精彩分享引发了大数据技术大会与会者的强烈关注,也成为现场互动最为热烈的几个场次。业界人士认为,京东的大数据技术分享务实而前瞻,体现了京东在电商技术和大数据应用领域的行业领袖地位以及技术对推动京东高速成长的显著贡献,其对先进技术的应用和紧贴业务发展的实践为行业提供了非常有价值的参考,对提升互联网行业大数据应用水平起到了推动作用。