每个受访者平均用到了8.1种算法,这相比于 2011 的相似调查显示的结果有了巨大的增长。
相比2011年对数据分析算法的调查,我们注意到最常用的方法仍然是回归,聚类,决策树/规则以及可视化。比例增幅最大的是(增幅=%2016/%2011 -1):
- Boosting算法,提升了40%。由2011年的23.5%提升倒2016年的40%
- 文本挖掘(Text Mining),提升了30%。从27.7%提升到35.9%
- 可视化(Visualization),提升了27%。从38.3%提升到48.7%
- 时间序列/序列分析(Time series/Sequence analysis),提升了25%。从29.6%提升到37.0%
- 异常检测(Anomaly/Deviation detection),提升了19%,从16.4%提升到19.5%
- 组合方法(Ensemble methods),提升了19%,从28.3%提升到33.6%
- 支持向量机(SVM),提升了18%,从28.6%提升到33.6%
- 回归(Regression),提升了16%,从57.9%提升到67.1%
◆ ◆ ◆
2016年新秀中最为流行的是