我有一个高度不 balancer 的数据,非常稀缺的正面标签 . 数据非常高 . 最重要的是,我的功能也很稀疏 .
那么在这种情况下进行特征选择的最佳方法是什么呢 . 基于类似spearmann或pearson相关性的任何相关性度量等级将不是一个好的 . 因为我的大多数标签和功能都是零,并且看起来这个功能高度相关或者某些东西,即使它没那么重要 .
有什么建议吗?
SVM适用于稀疏数据的分类 . 通过检查生成的内核矩阵,您可以识别比其他更重要的功能,并将其用于您的功能选择 .
1 回答
SVM适用于稀疏数据的分类 . 通过检查生成的内核矩阵,您可以识别比其他更重要的功能,并将其用于您的功能选择 .