我正在寻找开发一种机器学习算法来解析一个句子并识别其中的各个部分 . 这就是我的意思:

考虑一句“在没有电的情况下向我展示打开风扇的程序” . 我想把这句话分成:

Command: 'Demonstrate'

Action: 'Turn on a fan'

Condition: 'When there is no electricity'

我计划这样做的方法是使用大量的句子样本输入并在每种情况下指定目标输出 . 然后,我会使用适当的机器学习算法进行分类 .

The problem I am facing is with data preparation for machine learning training . 到目前为止,我已经考虑过以下方法:

1-解析句子并确定每个单词的POS . 根据词性将每个单词分类为1-7 . 组合每个单词和句子将得到一个特定的代码:例如,102163374 . 使用它作为一个独立的功能 .

2-使用总字数作为第二个独立功能 .

这种方法的确切问题是第一个特征会根据句子中的单词数量而变化很大 . 那是问题吗?如果是这样,我该如何处理呢?