首页 文章

稀疏数据上的离散和连续分类器

提问于
浏览
3

我试图对一个包含离散和连续特征的例子进行分类 . 此外,该示例表示稀疏数据,因此即使系统可能已经训练了100个特征,该示例可能仅具有12个 .

用于实现此目的的最佳分类器算法是什么?我've been looking at Bayes, Maxent, Decision Tree, and KNN, but I'我不确定是否符合条款 . 我最大的支持点是支持稀疏数据集以及离散和连续特征 . 任何人都可以推荐符合这些标准的算法和实现(最好是在Python中)吗?

到目前为止我看过的图书馆包括:

  • Orange(主要是学术性的 . 实施效率不高或实用 . )

  • NLTK(也是学术性的,虽然有很好的Maxent实现,但不能处理连续的功能 . )

  • Weka(仍在研究这个 . 似乎支持广泛的算法,但文档很差,所以不清楚每个实现支持什么 . )

3 回答

相关问题