首页 文章

稀疏和不 balancer 高维数据的特征选择

提问于
浏览
0

我有一个高度不 balancer 的数据,非常稀缺的正面标签 . 数据非常高 . 最重要的是,我的功能也很稀疏 .

那么在这种情况下进行特征选择的最佳方法是什么呢 . 基于类似spearmann或pearson相关性的任何相关性度量等级将不是一个好的 . 因为我的大多数标签和功能都是零,并且看起来这个功能高度相关或者某些东西,即使它没那么重要 .

有什么建议吗?

1 回答

  • 0

    SVM适用于稀疏数据的分类 . 通过检查生成的内核矩阵,您可以识别比其他更重要的功能,并将其用于您的功能选择 .

相关问题