大数据与熵:临界分析

大数据方法被认为最适于做预警或预测某种人们事先不知道的状态,而抽样统计则一般是根据已知的状态安排抽样规则。

以上四种模型分析与上节基于熵的分析是一致的。其中无尾和翘尾模型的熵值分别为小于6、介于5-15之间;而长尾和全尾模型的熵值分别为大于15、趋于无穷。前二者多采用传统抽样分析,后二者只能采用大数据方法。更为重要的是,随着量变引起质变,大数据方法会带来更多、更新的概念、理论和技术。