机器学习——海量数据挖掘解决方案

机器学习——海量数据挖掘解决方案

图 7 数据噪声对SVM的影响

解决办法非常简单而巧妙, Corinna Cortes与Vapnik为SVM引入了松弛变量(slack variable),将公式(2)的约束条件修改为:

(3)

其中即为松弛变量。从图8可以看到,引入松弛变量即容忍了outlier的偏移量,抵消了outlier对分类面的负面影响。

机器学习——海量数据挖掘解决方案