在刚刚一开始的时候,我提到过,中国的征信市场如果有100家征信公司,80家公司都是做原始数据贩卖的,真正以技术立足的不到20家。征信领域很多人说数据为王,很多人说技术为王,二者谁会胜出呢?那我们可以借鉴一下美国的历史,来看以后今后中国市场的走向。
我们先来看看,在征信起步的过程中,数据都扮演了很重要的角色,如果没有数据,建模就无从谈起,更不要说用什么方式建模。我要说的是,在今后征信的发展过程中,数据的获取是会越来越简单,还是越来越难?
先来看一看,数据可以被分成什么样的大类。从我个人的看法,可以分为两类,一类是依托于公共环境或者政府的背景而产生和积累起来的,这一部分我们不妨叫做行政数据,比如说汽车注册信息,学籍学历,犯罪记录等等。这些都是依托于政府或者公共设施积累起来的。另外一些就是私营企业或者上市公司,通过自己独有的生态圈产生出来的数据。
而在这样的第二类的数据中最有代表的,应该就是阿里形成的自己独有的生态圈中的电商数据,腾讯利用微信所形成的独有的社交数据,或者腾讯和网易形成的游戏数据。我们可以从另一个角度看一下今天百度的困境在什么地方。
很早之前的时候,谷歌为了击败Facebook专门制做了一款自己的应用叫Google ,就是为了取代Facebook。当时FB还不大,Google为什么要这么做?因为Google早就看到了今天百度面临的困境——那就是,大家进行百度搜索的时候都不会进行用户名登录,所有的特质信息,在百度的搜索引擎面前都是很苍白的。但是,无论是你是使用阿里的电商或者腾讯的社交,都有很完整的个人信息和轨迹,所以不同的生态圈产生出来数据的价值是完全不同的。