爱奇艺杨琛:新媒体时代的大数据应用

中云网消息  8月29日-30日,以“数据重构未来”为主题的D-Future七牛数据时代峰会在上海举行。七牛携百名创业明星,技术大咖汇聚国际时尚中心,共话数据发展,探讨行业未来!

在30日上午的活动上,来自爱奇艺的副总裁杨琛介绍新媒体时代的大数据应用。以下是他的文字实录:

杨琛:谢谢各位,今天非常的高兴有机会和大家分享一下爱奇艺的一些工作,我的标题是新媒体时代的大数据应用,区别于传统的媒体,大家来爱奇艺,更多的是认为网络视频,把原先在电视上播出的视频搬到了互联网,其实远远不止如此。我会给大家介绍一下我们到底是干的什么。

我用非常短的时间介绍一下爱奇艺。然后说一下爱奇艺的大数据应用,最后展望一下未来。这是我们爱奇艺的企业愿景,让人们平等便捷的获得更多,更好的视频,爱奇艺这么多的发展一直是在为了更多的用户提供更多更好的视频。

我们是在2010年的4月22日成立,这五年我们收获了很多,我们现在在PC端,日均覆盖都是第一,月度覆盖也是第一。我们还有一个非常让人骄傲的一个成绩,是在移动端的安装,已经超过了10亿,这个数字在整个互联网是非常的令人赞叹的。

还有一块我们在TV端的,根据我们内部后台的数据,我们在2月份的时候,我们的TV端的比重已经是到了一千万。我们看一下爱奇艺做的一些工作,爱奇艺有大量的数据,对于爱奇艺来说,很多的业务也是依赖于存储,最多的是视频的内容,爱奇艺存在这些内容的时候,也有很多延伸的相关的服务,一方面是搜索,还有大量的用户,同时还有电影票,爱奇艺的观影数据,还有一部分的社交。会做四个维度的分析,我们要采购内容,有了内部用户才可以观看这些重要的内容。

内容的选取对我们来说是非常的重要的,有了这些内容,我们可以对用户产生相关的分析,主要是为了给他们提供更好的服务,同时因为本身互联网视频的业务,相对也是要依赖于一部分的变现,所以我们也会做广告,维持和用户的粘度。还有一部分是人群的定向,这些都是大数据业务的一些延伸的应用。

爱奇艺的大数据主要是来自这几个维度,首先是多元化的服务,第一个维度是视频的维度的,依赖于很多相关的产品,比如是搜索推荐,很多的时候会涉及到一些连接,用户在什么终端上看,搜索一些什么关键字。还有一个维度,爱奇艺也会有一些现在其他的电商,包括电影票,还有游戏这一块的业务,这些都是以内容为核心的,所以相对来说的话,有这些业务也会对数据产生大大的补充。同时我们包括了PPC,我们有几百万的长视频的内容,相对的来说,这个量在整个视频行业来说是非常的大的。

同时我们也有海量的用户,每天到达爱奇艺的用户接近二千亿,在访问爱奇艺服务的同时,给我们提供了大量交互的数据,我们可以很好的探测到用户是不是喜欢这个内容,是不是不喜欢这个内容,用户到底喜欢怎么样的内容,喜欢在什么时间,什么终端上看怎么样的内容,这些都可以通过后台分析出来。它的立体相对于Volue是最重要的,不管是什么方面的增长,都会带来Volue的急速的增长。

爱奇艺本身在内容生命周期这一块做的工作,我这里画了一个内容的生命周期,每一个内容爱奇艺决定采购的时候,都会经历这么一个生命的周期,我们要决策到底是不是应该买这个内容,买了这个内容以后,我们就决定应该怎么样营销这个内容,营销是为了让用户知道,让品牌广告主知道,我们有这个内容,可以怎么样变现,同时吸引更多的用户来看,真正的到了运营期的时候,会把内容在终端上上线,让用户很好的享受生服务,然后会再次评估,说这个内容是不是适合爱奇艺的用户,到底是不是适合爱奇艺的平台,我们是不是值得把这个内容采买,总体我们采购这个版权的内容都是有时间的限制的。再次的评估也是非常的重要的。

我们下面做了一些相对应的产品,这个在行业里面做的工作都是类似的,爱奇艺做的比较前面一点,我们主要是做了二块的工作,一部分是VV的流程,VV是视频网站区别于传统的互联网门户不一样的地方,因为传统的互联网的们很多是看PV,UV,但是本身不和观影关联,这一块不能代表互联网的广告价值,所以VV是更重要的指标,在内容还没有上线的时候,我们就要预测这一块的内容有怎么样的表现。

还有一块是电影,作为传统的电视剧,电影,动漫,电影在这里面是非常的特殊的,电影也是一个非常庞大的产业,很多的时候,电影相关的指数对我们的运营,采购非常的重要,对于运营营销,我们主要是会做二块,一块是品牌的更新,哪一些品牌的广告主会对这一块的内容感兴趣,会和后续的品牌广告主之间,做一些探讨。同时会做一些目标受众的分析,告诉广告主,这些用户的特征是什么,让我们的变现,让我们的用户的体验会变的更好。

运营的层面这一方面的产品更多一点,我们推出了第一个针对用户的产品绿镜,传统的媒体做食品播放的时候,是在固定的时间,固定的频道放,并没有任何的交互,同时终端的本身是单向的,不能贡献任何的数据,但是互联网不一样,用户喜欢这个数据,你就可以点开这个视频,并且可以观看,看到了喜欢的部分,一定会拉回去看,不喜欢的部分就会往前看,我们做了一些相关的分析,在统计的意义上,超过一定的预值的时候,这一部分的表现是非常的稳定的,所以我们做了绿镜这个产品,可以让你在很短的时间里, 可以看到自己感兴趣的东西,这个就是互联网带来的一些比较有意思的创新。

同时我们针对用户在爱奇艺上的行为,做了爱奇艺指数,还有一块是新媒体时刻也是比较重要的,传统的内容发现,很多的时候是用户需要去记到底是什么时间,在什么电视台播什么节目,对他们的检索是非常的不方便的,新媒体的话,就非常的简单了,一方面是视频的推荐,推荐是对于很多的人来说,来了以后不知道要看什么,但是根据观影的记录,可以知道什么片子是比较类似的,可以带来很好的点击率,同时还可以发现和他类似的人看了一些什么相关的内容,所以对于提升用户的体验,大大的降低了成本。

还有一个很多的人是知道自己想要什么,所以搜索是很好的入口,爱奇艺的搜索,除了传统的可以更好的检索,还做了一个很好的意图识别,比如是可以输入最近好看的韩剧,就会进行搜索了。爱奇艺也在做相关的工作,还有一块的话,属于我们目前视频网站最大的特色,传统的做大数据的时候,都是依赖于做文本,或者是节奏化相关的挖掘,或者是文本里面做相关的挖掘,视频网站来说,拥有海量的数据并不是结构化的数据,也不是文本的数据,而是大量的视频。感谢计算技术的发展,计算机技术飞速的发展,利用这些新的技术,可以做一些以前不能做的事情,我们可以理解视频里面存在一些什么物体,我们可以做各种有意思的创新性的产品。

同时我们还可以识别里面的人,关于内容评估这一块,我们会对很多的维度的内容做全方面的分析,分析到底带来了多少的广告的价值,带来了多少的会员的价值,可以很好的评估这一部分的价值。下面介绍一下VV预测这一块,本身VV预测这一块并不是每一个公司都可以做,也是二年以前和谷歌发布的文章有关。在爱奇艺成立之初就非常的重视对数据的投入,这个也是我们CEO的一个梦想。

二年以前我们把这个系统做好了。主要的就是凭借着爱奇艺多年的运营数据,因为爱奇艺运营到现在的时间也比较久了,有大量的运营的数据,在运营的过程中,也产生了大量的关于视频的数据,同时我们对内容和用户做了相关的剖析。还有一个非常重要的,我们做了很多在控制条件下的实验,对我们的平台有怎么样的内容会更准确。

第一个是2014年非常火的日播剧,可以看到这这个结果里面体现了二个不一样的东西,一个是日播剧的分布,后面二个是周播剧的分布,可以看到预测和实际的情况非常的不同。第二个是去年春节的时候非常火的《来自星星的你》,预测和真实的情况会发生很大的偏差,主要是因为发生了韩国的沉船的事件,那同时的话,爱奇艺这里本身的运营上的一些侧重点的改变,做了这个数据的下降。这个也给了我们很好的启示,我们可以分析一下到底我们的运营好不好,根据这些预测要求我们的运营,到底应该怎么样的运营,应该怎么样推这样子的事情,以达到更好的效果。

这一块是前面说到的我们目前来说非常的有特色的两个产品,一个是闪植,很多的传统是把拍摄放到内容中,到底好不好,植入方也不知道,我们的这个技术弥补了传统的植入,在拍摄的初期就要介入的弊端,同时还可以规避视频不叫座,植入花了很多的钱,目前在我们爱奇艺也有很好的表现。

还有一块是随时购,通过我们的后台本身对视频做很多的识别,我们会识别视频里面存在相关的商品,把这些商品在播放的时候,同时就在旁边展现出来,根据我们的实验,这个效果是非常高的比一般的高二三倍。这个是爱奇艺的fiigure-Out,可以识别视频里的演员,首先是会做人脸的检测,做人脸的定位,然后做特征的提取,提取好了以后,就会到后台的数据库和明星进行定位,在用真正的播放的时候,就会展现和明星相关的品牌的广告,从这个角度来说,可以更好的促成变现。

这一块是内部和内容相关的,其实爱奇艺目前做的很多的事情,在用户体验和商业的价值之间做权衡,所以需要尽量的多为用户考虑,我们在今年的年初上线了第一个全中文个性化的影院,机遇GBDT个性化的预测,有大量的主题,从效果来看,CTR提高了100%的效果。适合18-25岁的人观看,但是要机器组合成这样子的主题,相对来说还是比较困难的。

还有一块是竞争广告。这一块的话有三个有意思的产品,一个是一搜索百映,依赖于我们和百度的合作,群英荟也是观看时候的一些位置的信息,同时根据性别的定向众里寻TA。

爱奇艺在大数据重构新媒体的未来。怎么样用好大数据,怎么样更好的发展我们的大数据,我们也相信大数据正在重构新媒体的未来,同时今天也非常的高兴,今天能够在这里和大家聊一下,爱奇艺非常希望和业界的同仁一起合作,希望可以把爱奇艺做的更好,谢谢大家!