政府大数据挖掘首创成果发布

近日,从第二届工商行政管理创新发展高层研讨会上获悉,由国家工商总局、专家组及龙信数据运用大数据挖掘技术构建的“企业发展工商指数”正持续回升至9月已反弹至44.3,预示着四季度我国宏观经济将持续向好。

大数据著名专家维克托在其著作《大数据时代》揭示:“大数据挖掘的核心特点是‘全量数据、相关关系、预测预判’。”依靠大数据技术,不仅能从海量数据中寻找隐藏其间的关系和联系,更能深层次的认识和挖掘人类社会及科学运行的内在规律,对未来发生的事物作一定的预测。据悉, “企业发展工商指数”课题组,改变以往抽样统计的研究方式,运用大数据挖掘技术,对工商全量、动态的全国企业登记数据进行分析,是典型的大数据价值发现过程,成为我国政府在大数据挖掘领域的首创成果。

1. 全量数据

一直以来,人们都希望让数据“说话”,在信息处理能力受限的时代,人们采用随机采样的处理方式;进入大数据时代,其最根本的改变就在于利用所有的数据,即“样本=总体”。

企业发展工商指数的样本来自国家工商总局“金信工程”构建的国家经济户籍库,该库已经覆盖全国所有市场主体,包括5500多万家企业和个体工商户数据信息,涵盖企业成立、成长、发展、消亡全生命周期数据。在指数构建过程中综合考虑并结合规模、行业、主体类型等维度,初步设计了32个指标,经数据分析验证后,最终选择了10个对宏观经济具有显著先行性的指标合成企业发展工商指数。

2. 相关关系

因果关系仅是事物联系的一种形态,在大数据背景下,运用相关性我们可以比以前更容易、快捷、清楚的分析事物间的内在联系。相关关系的核心是量化两个数据值之间的数理关系,从一个数值的增减去预测另一个数据值的增减。

由此可见,通过大数据挖掘发现不同领域间的相关关系,成为人们观察并分析事物的最新视角。市场主体是市场经济的细胞,是社会财富的创造者,与经济发展息息相关,决定了宏观经济发展水平和政府财政收入。企业发展工商指数正是基于对全国市场主体的大数据挖掘分析,并将工商、财政等不同部门的数据放在一起进行比较分析,从而发现其价值,成功预测我国宏观经济走势。

3. 预测预判

建立在相关关系分析法基础上的预测是大数据的核心。通过大数据挖掘发现:企业发展工商指数与GDP、公共财政收入均呈现出显著相关性,且企业发展工商指数增长领先于同期GDP、公共财政收入大约2个季度。

企业发展工商指数自2013年3月份的32.1开始反弹,到6月份回升至40.1。目前,各项经济指标显示我国经济确实出现企稳态势。三季度以来,企业发展工商指数持续回升,在9月份已反弹至44.3,预示四季度我国宏观经济将持续向好。

由此可见,企业发展工商指数能够先行感应经济形势变化。传统的预测方法周期较短,基于大数据挖掘而构建的企业发展工商指数可提前2个季度左右预测宏观经济走势,为宏观经济调控提供有力支撑。

同时,研究还发现:企业数量、注册资本与公共财政收入和GDP增长具有显著的线性关系。公共财政收入与企业数量、注册资本的相关系数分别为0.832和0.994,企业注册资本每增长1亿元,带动财政收入增长1400万元左右;GDP与企业数量、注册资本的相关系数分别为0.853和0.998,1990年以来,企业注册资本平均每增长1亿元,带动GDP年增长6500万元左右。

未来大数据将改变人类的思考模式、生活习惯和商业法则,将引发社会发展的深刻变革,是未来最重要的国家战略之一。在将近20年的信息化建设中,我国政府沉淀了大量的宝贵数据,这是整个社会经济活动的活化石,是可以被无限次循环使用的非物质财富,是进行科学管理的重要决策依据,政府部门可透过大数据挖掘分析使数据产生价值。此次,工商总局联合课题组及龙信数据构建的“企业发展工商指数”及其研究成果,不仅是我国政府在大数据挖掘领域的良好开端,亦为我国政府在大数据挖掘领域提供了可借鉴的运作模式。