数据科学家最常用的10种算法

  • K-最近邻法(K-nearestneighbors), 46%
  • 主成分分析(PCA), 43%
  • 随机森林(Random Forests), 38%
  • 优化(Optimization), 24%
  • 神经网络-深度学习(Neural networks - Deep Learning), 19%
  • 奇异值分解(Singular ValueDecomposition), 16%
  • ◆ ◆ ◆

    降幅最大的是

    • 关联规则(Associationrules),下降了47%,从28.6%降为15.3%
    • Uplift modeling,下降了36%,从4.8% 降为3.1%(出人意料的低,因为有很多相关文献发表)
    • 因子分析(Factor Analysis),下降了24%,从18.6%降为14.2%
    • 存活分析(SurvivalAnalysis),下降了15%,从9.3%将为7.9%

    下面的表格显示了不同的算法类型的使用场所:监督算法,无监督算法,元算法和其它算法。应用类型未知(NA,4.5%)或者其它职业类型(3%)的不包括在内。

    表1:不同职业类型的算法使用

    数据科学家最常用的10种算法