中国IDC圈3月3日报道:大数据时代的到来将开启人类文明的新纪元,同时也为经济学研究领域的拓展提供了新的机遇。一方面,大数据的出现改变了经济学实证研究的基础。超大规模甚至接近全体的数据样本,既为更加全面客观地考察研究对象提供了丰富的原始信息,也对数据处理和数据分析能力乃至实证经济学的方法论和研究范式带来新的挑战与变革。另一方面,大数据分析和应用在经济社会各领域的扩散渗透,不仅促进相关产业生产率水平的提升,而且还衍生出很多新的经济现象。当前,基于大数据分析和应用的各种新模式、新业态不断涌现,人类生产生活、工作消费的方式正发生根本性转变。这种由技术变革带来的经济社会变革,有望推动新一轮的技术—经济范式转换,而这一切背后的经济学规律都值得深入研究。
大数据分析与经济学研究范式
机器学习、统计学习与计量分析的结合。现有的机器学习、统计学习等大数据分析手段,强调相关性而忽略因果关系;而传统计量分析是建立在因果关系基础上的实证检验。当下流行的机器学习、统计学习等宣称“因果关系不重要”,既是实用主义的具体表现,也源于其“以数据为基础的反向推测”在方法论上的缺陷。如何将计量分析强调的因果关系与机器学习得到的数据相关性进行有效的对接配合,对于理解经济社会变量之间的内在作用机制,采取更有针对性的应对措施应该会有更大裨益。
微观行为数据支撑基于主体建模。传统的宏观经济模型都是遵循自上而下原则构建的;尽管也试图通过所谓代表性主体(Representative agent)刻画其微观基础,但有限的代表性主体与复杂现实相去甚远。
基于主体建模(Agent-based Model)是自下而上,根据微观主体行为模拟宏观效应的主要工具,其核心是归纳梳理不同类型主体的行为方式,设定相互作用的行为规则。以往对行为方式和行为规则设定,需要采用抽样调查或实验的方式,成本高且存在较大偏差,因此一直未能被主流经济学所接受。互联网大数据、电信大数据、金融大数据等,全面记录了个体行为轨迹,为归纳微观主体行为方式和行为规则,改善微观模拟效果提供了很好的数据基础。搜索及社交数据改善经济预测效果。短期预测或即期预测(Instantaneous Forecasting or Nowcasting)通常利用较为简单的时间序列模型来完成。瓦里安(Hal Varian)等国外学者已经在运用谷歌搜索数据等提高短期预测精度,并取得了较好的效果。其基本思路大致是,在时间序列预测基础上,增加搜索指数等变量,另外还采用了组合预测。鉴于其较好的预测效果,该思路值得借鉴。而麻省理工学院的研究团队,利用eBay、亚马逊等电子商务网站销售价格生成的CPI,则具有及时、准确等多项优点。
多渠道数据对接与政策效果评价模拟。税收、医疗、社会保障等公共服务领域积累着现成的高质量大数据,具有结构化特征,对社会成员近乎全覆盖。目前,不同的数据源之间尚处于相互隔离状态,但数据源之间的对接在技术上并不存在太大障碍。充分挖掘、分析行政管理和公共服务方面的大数据,能够更加全面有效地对政府部门出台的各种政策进行效果评价和模拟,有利于提高决策的针对性和有效性。
大数据应用与新前沿
大数据应用带来的直接效果是相关领域运行效率和生产率水平的提升。在商业领域,亚马逊、eBay、淘宝、京东等国内外电商以及沃尔玛等传统零售商,借助基于大数据分析的精准营销和定向推送,销售额或盈利水平都有显著提高。在金融领域,大数据分析为改善信用评级、发展网络小额信贷提供了强大支撑,有效缓解了中小企业融资难问题,提高了全社会资金配置效率;另外,基于大数据的金融欺诈识别、内幕交易识别也成效斐然。在公共交通领域,滴滴打车、快的打车、百度导航等应用,在降低出租车空驶率、节约出行时间方面效果非常显著。
如何测度大数据应用带来的生产率提升,有助于探寻新常态下经济增长的新动力。
大数据应用与科研方式转变。图灵奖获得者Jim Gray指出,当代科学研究已经转变为以数据为中心的第四代模式。超量科学数据是支撑科学研究和各类应用服务不可或缺的一种战略资源;而如何有效地管理科学数据,及时地分析科学数据,解释数据中内含的科学原理,已经成为继理论、实验和计算之后新的科学发现基础,将提供对科学规律和趋势把握的新途径,形成所谓“真理尽在数据中”的局面。