-
1 votesanswersviews
即使对于用于训练它的文件,libSVM也会给出非常不准确的预测
这是交易 . 我正在尝试制作基于SVM的POS标记器 . SVM的特征向量是在格式转换器的帮助下创建的 . 现在这是我正在使用的培训文件的屏幕截图 . http://tinypic.com/r/n4fn2r/8 我有25个标签用于各种POS标签 . 当我使用java实现或命令行工具进行预测时,我得到以下结果 . http://tinypic.com/r/2dtw5ky/8 我已经尝试了所有可... -
1 votesanswersviews
AttributeError:'list' object没有属性'isdigit' . 有效地指定句子列表中每个单词的POS?
假设我将句子列表(在大型语料库中)列为标记化词的集合 . 样本格式如下: tokenized_raw_data的格式如下: [['arxiv', ':', 'astro-ph/9505066', '.'], ['seds', 'page', 'on', '``', 'globular', 'star', 'clusters', "''", 'douglas', 'scott'... -
0 votesanswersviews
在nltk中训练Brill tagger,AttributeError:'module' object没有属性'SymmetricProximateTokensTemplate'
我正在训练Brill tagger反对conll2000语料库 . 由于我不明白的原因,我有以下错误: brill.SymmetricProximateTokensTemplate(brill.ProximateTagsRule,(1,1)),AttributeError:'module'对象没有属性'SymmetricProximateTokensTemplate' 我正在关注[this](ht... -
1 votesanswersviews
AttributeError:'list'对象没有属性'isdigit'
我想在熊猫中提取POS . 我这样做 import pandas as pd from nltk.tag import pos_tag df = pd.DataFrame({'pos': ['noun', 'Alice', 'good', 'well', 'city']}) s = df['pos'] tagged_sent = pos_tag(s.str.split()) 但得到追溯: Tra...