如何在sklearn中为svm选择参数

提问于 2024-04-28T01:03:33+08:00

浏览次

1

我正在尝试使用sklearn中的SVM来解决分类问题 . 我得到了一个高度稀疏的数据集，其中包含超过50K行和二进制输出 .
问题是我不太清楚如何有效地选择参数，主要是内核，gamma和c .

例如，对于内核，我是否应该尝试所有内核并保留给我最满意结果的内核，或者在选择内核之前我们可以看到与我们的数据相关的内容？
C和伽玛也一样 .

谢谢！

1 回答

0

是的，这主要是一个实验问题 - 尤其是你几乎没有告诉我们你的数据集：可分性，线性，密度，连通性......所有影响分类算法的特征 .

尝试使用线性和高斯内核作为初学者 . 如果线性不能很好地工作而Gaussian有效，那么尝试其他内核 .

找到最好的1或2内核后，再使用cost和gamma参数 . Gamma是一个"slack"参数：它允许内核允许将一定比例的原始分类错误作为其他好处的权衡：间隙的宽度，分区函数的简单性等 .

我还没有一个应用程序从改变成本中获得更多的微不足道的好处 .

回复于 2024-04-28T01:03:33+08:00

相关问题