今年《纸牌屋》的收视大火,让Netflix这家原本只做在线租赁DVD的公司成为算法节目制作成功的典范。但在优酷土豆策划总监陈汉泽看来,《纸牌屋》仅仅是Netflix的精准营销的产品,并非众人口中的依靠大数据分析的剧作。“听说Netflix老总是听取了下属的建议,才决定拿下该剧的改编和发行权,而这名下属是英剧《纸牌屋》的忠实粉丝。”
媒体人出身的陈汉泽对大数据持一种审慎的态度。她认为,大数据只是一个工具。在大数据之前,早已有统计学逻辑和数据挖掘技术。比如大数据在互联网的最早应用是流量分析。2005年前后,互联网通过门户网站开始访问,是流量的主要入口。但到了2011年,最大的流量源自于视频网站。
在优酷土豆合并之前,陈汉泽在土豆网负责自制剧业务。她说,数据模型可以精准地识别出在每一部剧里,哪一分钟用户视线离开、重看、拖放观看。这些数据为自制剧选择题材、设计桥段提供极大的参考价值。在好莱坞电影剧本的精细化生产工序中,“剧本医生”扮演了极其关键的角色,他们通常会改编剧本以强化某个情节,突出某个桥段。而大数据分析技术正是陈汉泽口中的“剧本医生”,借助大数据可以分析出观众喜欢的剧情元素。
Netflix上排名前十的影片,分别代表了不同家庭成员对观影的需求。另外,十部影片也可以分别对应不同时间、处于不同情绪下消费者的需求。这背后是对收视群体的多维度分析。陈汉泽说,视频排序的背后是一套清楚的逻辑体系,了解排序和目标指引,才能更准确地推荐给消费者。
五年前,网络上一段视频的爆红通常基于一个点状扩散的模式,属自发的、分享式传播;但随着网络视频行业逐渐转向以自制剧、采购电视节目为导向时,视频公司必须对观众有一个量化分析的过程。基于大数据分析得出的这份数据报告,又可以为电影电视制作方、广告商、第三方统计机构所用。
广告主已不再满足于传统的贴片广告营销模式。原先视频网站重视的PV,现在变成为更关键的指标ROI。“马化腾在近期的演讲时提到,连接一切,互联网+创新涌现,开放协作,消费者参与决策,数据成为资源,顺应潮流的勇气和连接一切的风险。而大数据营销的潮流便是移动端的崛起。”陈汉泽说。
在PC时代,基于cookie和逻辑分析来追踪和分析用户信息是惯用手段。但由于移动端浏览器没有cookie, 再加上cookie对用户隐私的放任,谷歌等巨头正开始寻找新的数据分析模型。
陈汉泽认为,未来可以利用大数据的模型。例如,用户在手机上先打开A网站,长时间访问后,会产生一些交互行为,而这些数据将会共享到下一家他浏览的网站。这必须基于A网站和B网站之间的协助,他们之间可能产生千丝万缕的联系。所有的数据都是共享的,这也是“连接一切”的意思。
“谷歌的PPC模式(每点击一次谷歌网络广告,广告客户就需要谷歌支付一定费用)可能很快就不适用。”陈汉泽说,今后的模式是,用户经过A网站、B网站,直到N网站,广告主才实现最后的盈利,但之前的浏览过程也能参与到盈利的分享。
不过,大数据技术也有其局限性,包括样本选择的有限性、数据筛选过程的真假判断、分析逻辑的正确与否,都能影响到最后的结果。
《大数据时代》作者维克托·迈尔·舍恩伯格认为,大数据时代只需要人们知道是什么,而无需知道为什么。正如商家不必理会为什么啤酒和纸尿裤的销售能如此匹配,只要抓到商机,采用交叉组合的战略提升业绩,无需搞清楚背后的商业逻辑。如果非要把所有事情都分析清楚才做出判断,损失的是眼界和时间成本。关联性远胜过因果性,但这在陈汉泽看来是一个过激的论调。“难道所有的页面排序通过数据模型就能完成,不再需要编辑了?”
她认为卖故事、讲故事的人不死,内容永生,编辑依然能发挥作用。譬如传统视频网站多以动作片、喜剧片、爱情片等类别分档,但在Netflix有上,有一个很小的类别,比如cult影片也被视作一个门类,这是基于编辑对内容的理解和人脑智慧的产物,这是数据无法抓取的。