未来的数据流通,宛如上述的河流形成过程,要勾画出一张完整的宏观大数据流通版图,需要首先深入理解数据的形成来源。
对于大数据的理解,很多刚接触的人简单理解为Hadoop+4V特征,存在海量异质异构的数据,需要新技术去应对,从而抽取出内涵的价值。诚然这个认识是说得通的,但却偏重于从科技角度去看待大数据,比如4V特征是IT厂家提出的,无论哪一个V,最终都演变为IT预算的提升,就正如当年淘金热,最后发财的是在河流旁边卖水和工具给淘金者的人。
而正因数据未来的潜在高流动性,我认为需要于从大数据的数据形成来源去深入理解。
数据的本质,是各类信息的数字化编码,数字化使得信息采集、存储、处理及分发的速度得到了不可思议的飞跃,也带领人类进入了信息爆炸的时代。而信息归根到底是以人为主体的、与客观世界各种其他客体之间交互的状态和变化的反映,也是人与其他事物之间相互连接和相互作用的表征。因此从这个角度理解,数据是以人与“其他事物”之间数字化连接下的信息副产物。