中国IDC圈12月31日报道:一个数字世界的大门正徐徐开启,大数据成为时代之光,无处不在。
数据随着技术进步不断地积累、繁殖,数据加工处理能力也以几何级速度暴增,营销和管理是否可藉此变得更加简单和精准?这是一个值得研究的问题。近年来,基于中国大数据的管理学术研究日益受到中外学者的重视,日前,复旦大学管理学院数据驱动管理决策研究中心举办“基于中国大数据的市场洞察和管理启示”国际研讨会,邀请经济学、金融学、信息管理系统、新闻传播、市场营销、运营管理和统计等领域从事前沿研究的学者,分享基于中国大数据的市场洞察、管理实践启示以及研究方法,会议同时邀请大数据相关产业的企业高管共同探讨中国大数据应用的现状、趋势和前沿问题,以及大数据产学研用国际合作的方式与前景。
告别泡沫,走向真正的大数据科学研究
媒体消费行为与商品消费行为是无缝衔接的,媒体大数据的挖掘跟市场营销管理决策紧密关联在一起——消费由消费者接触媒体后产生,并通过媒体实现,消费后会把评论和感受反馈到媒体上。
当今社会,什么是文科?什么是理科?我是新闻学教师,新闻学院传统上教授的是文科内容,曾经有同学就因为不想学数学才考进新闻学院。然而现在,要想学好新闻,必须数学好。为什么这么说?今天我想谈一下大数据在新闻传播学中的应用。
首先,什么是传播学?营销跟传播关系特别紧密,均涉及怎样把事情或信息传出去的过程。1948年,美国政治学家拉斯韦尔提出传播学的“5W”模型,明确提出了传播过程及其五个基本要素,即:谁(Who),说了什么(Sayswhat),通过什么渠道(InWhichChannel),对谁说(ToWhom),取得了什么效果(WithWhatEffect)。
以前,新闻传播学比较忽视数据,通常采取“传者中心”模式,希望控制和影响传播过程和效果,发布内容和渠道都由从业者决定。现在,传播业面临剧变,从“5W”中就可看出——传播者从少数精英变成万众;媒体从传统纸媒转变为网络,从大众媒体到社会化媒体;内容原来是有限供给、定时生产,现在是无限丰富,24小时供应;受众从被动接收信息到主动参与、从分散独立到组织互联;效果从难以评估到可以评估。
数据显示,今年9月新浪微博日均活跃用户数达到1亿,每天发布的文章和照片是海量的数据;微信已成为的移动社交平台,有6.5亿的月活跃量,有超过1000万的微信公众号,这背后代表的是社会的“脉动”。媒体的运营方式由此发生变化,以前是专业化生产,现在有两种,一是UGC(用户原创内容),另一种是AGC(自发生成内容),基于某一特定算法自动生成内容。营销过程中也必须洞察这些变化,知晓客户的变化和组成。
在媒体行业,有文字数据、文本数据、关系数据、时间数据、空间分析数据,有音视频的数据,有用户属性、行为和关系的数据等等,最早的大数据是收视率,一个企业要投放广告给电视,首先会考虑收视率。收视率怎么测量?最早是通过人工记录收集,但即使上海只有一千户人家,每隔15秒记录一次,产生的数据也有近600万条,这个数量级已没法用人工处理,后来就通过测量仪测量记录了。
2010年电视基本数字化以后,收视率测量更加精准。今天,我们可以用收视率大数据做很多分析,比如时间序列的分析,可以观察到一个家庭的ID、个人的ID、时间码和观看频道等,时间码可以追踪观众行为变迁的轨迹,电视台可以据此编排节目,广告商和企业可以依此决定购买那个时段投放广告。
在海量数据面前,新闻传播学开始运用信息化的方法、专门的计算和分析工具,研究人类传播行为及其背后的模式法则,形成数据新闻和计算广告等学科,集传播理论、编程、统计建模和计算思维于一体。自此,已很难分清文理科的界限。
新闻传播学中的大数据,首先体现在数据新闻和可视化新闻上。美国媒体上曾刊登了一张类似股市K线图的图表,它代表的是一年中不同时期一千万美国人分手的比率,背后的数据来源于Facebook(脸书)上的个人页面,形成了一个可视化的图表,人们从中可以清晰地看出,美国人在感恩节、圣诞节前后和夏季时提分手,愚人节时却很少分手。
现在,越来越多的媒体呈现可视化的作品,背后都是数据挖掘工作。英国的《卫报》、BBC、美国《纽约时报》、CBS等都在出产数据化作品,从尝试变成常规做法,从简单信息图变成可交互的专题甚至是游戏。在产品营销过程中,企业和广告商也可以根据实际情况多应用可视化的方式。