众所周知,C参数告诉SVM优化你想要避免错误分类每个训练样例的程度 .

  • 对于较大的C值,如果超平面能更好地将所有训练点分类正确,则优化将选择边距较小的超平面 .

  • 相反,非常小的C值将导致优化器寻找更大边距的分离超平面,即使该超平面错误分类更多的点 . 对于非常小的C值,您应该得到错误分类的示例,即使您的训练数据是线性可分的 .

因此,仍有一个问题仍然没有答案,或者至少是一个我无法找到答案的问题 . 这个问题如下:如何选择最佳(精确)C值?