我有一个文字,
"India, officially the Republic of India is a country in South Asia."
我需要它才能给我,
Country: India Region: South Asia
无论我在scikit的文档中发现了什么,它都能够将它分类为一个类别,例如我可以在两个分类器上训练它来检查一个国家是否存在或区域是否存在,但我希望它告诉我它正在采摘哪个特征对于每个分类,有点像NLTK最丰富的功能 . 我该怎么做呢?
如果您在交叉验证时使用SVM this question可能会让您入门 . 这个想法是解释分类权重,但这不是微不足道的 .
就个人而言,我更喜欢使用内置功能排名的RandomForestClassifier . 它由 feature_importances_ 属性公开 . 在scikit-learn文档中甚至还有an example .
feature_importances_
1 回答
如果您在交叉验证时使用SVM this question可能会让您入门 . 这个想法是解释分类权重,但这不是微不足道的 .
就个人而言,我更喜欢使用内置功能排名的RandomForestClassifier . 它由
feature_importances_
属性公开 . 在scikit-learn文档中甚至还有an example .