首页 文章
  • 0 votes
     answers
     views

    拆分用R和Quanteda标记语料库

    我正在为NLP开展一个项目 . 我需要在.txt文件中获取一些博客,新闻和推文(您可能已经听说过这个顶点)并创建n-gram频率 . 我做了一些实验,将 txt 文件带到频率 data frame 进行分析: Read > Conver to corpus > Clean corpus > Tokenize > Convert to dfm > Convert to ...

热门问题