首页 文章
  • -1 votes
     answers
     views

    使用NLP理解文本并获得相关输出[暂停]

    我有特定的用例,一个人会告诉我这样的事情: “嘿(触发词),在对象历史中注意XYZ”或“嘿(Tigger Word),在对象诊断中记录PQR” [hte示例中使用的“对象”是占位符,可以替换为维护/患者等字样] 我的NLP引擎的目的是在“对象历史”中注明“XYZ ......”或在“对象诊断”中注意“PQR ......”,即注意说话者对某些特定内容的说法 . 领域 . 我不确定如何训练我的系统识...
  • 1 votes
     answers
     views

    在C#中使用CoreNLP时出现SLF4J错误

    我想在我的Unity3D项目中包含Stanford CoreNLP . 我从Nuget收录了CoreNLP,并从CoreNLP下载了NLP模型 . 然后我将NLP模型文件夹复制到 project -> bin -> Debug 文件夹中 . 代码如下所示: var jarRoot = @"stanford-corenlp-3.9.1-models\"; const ...
  • 2 votes
     answers
     views

    上下文单词的表示矩阵在SkipGram中意味着什么?

    我正在学习斯坦福NLP课程,我从Skipgram中了解了一个概念,如下图所示 . 从左到右,第一列向量是单热编码器,第二列是来自1层神经网络的单词嵌入矩阵,第三列是单词表示向量 . 然而,当谈到第四个时,它是一个具有'v by d'维度的矩阵 . 不确定我是否正确地听,但是发言者说这是上下文单词的表示,这三个矩阵是相同的吗? 我的问题是:1 . 为什么这三个矩阵是相同的,但三个乘法结果是不同的? ...
  • -6 votes
     answers
     views

    什么是火花中的这个例外的意思

    16/03/30 23:23:20 WARN TaskSetManager:阶段0.0中失去的任务1.0(TID 1,10.208.91.144):java.lang.NoClassDefFoundError:java.lang.Class中的edu / stanford / nlp / trees / TreebankLanguagePack .getDeclaredFields0(本机方法)...
  • 0 votes
     answers
     views

    如何使用词性标注器标记字段特定名词?

    我想使用词性技术在一个句子中标记特定领域,例如技术和科学名词 . Example 考虑句子: 1)计算机需要键盘,监视器,CPU才能工作 .2)汽车使用齿轮和离合器 . 现在我的目标是,必须将例句标记为 第一句 计算机/技术需求/名词键盘/技术CPU /技术/介词工作/动词 第二句 汽车/机械用/动词齿轮/机械和/连接离合器/机械 My need我想在java上实现上面提到的目标,...
  • 20 votes
     answers
     views

    是否有可能训练斯坦福NER系统识别更多命名的实体类型?

    我现在正在使用一些NLP库,(stanford和nltk)斯坦福我看过演示部分,但只是想问一下是否有可能用它来识别更多的实体类型 . 因此,目前斯坦福NER系统(如演示所示)可以将实体识别为人(姓名),组织或位置 . 但被认可的组织仅限于大学或一些大型组织 . 我想知道我是否可以使用它的API为更多实体类型编写程序,例如,如果我的输入是“Apple”或“Square”,它可以将其识别为公司 . 我...
  • 1 votes
     answers
     views

    执行stanford corenlp共指消解

    我正在尝试执行stanford corenlp软件包以获得共识解析 . 这是给coref执行的命令: java -cp <jars_in_corenlp> -Xmx8g edu.stanford.nlp.dcoref.SieveCoreferenceSystem -props <properties file> 我这样执行 - java - cp "*&quot...
  • 0 votes
     answers
     views

    斯坦福CoreNLP错误的共指解决方案

    我仍然在玩斯坦福大学的CoreNLP,我在Coreference分辨率的非常简单的测试中遇到了奇怪的结果 . 给出两句话: 酒店有一个大浴室 . 这很干净 . 我希望句子2中的“It”可以被句子1的“浴室”或至少“大浴室”所共处 . 不幸的是,它指向“酒店”,在我看来是错误的 . 有没有办法解决这个问题?我需要训练任何东西,还是应该开箱即用? Annotation a = getPipelin...
  • 1 votes
     answers
     views

    使用Stanford CoreNLP进行共指解决

    我是Stanford CoreNLP工具包的新手,并尝试将其用于解决新闻文本中的核心问题的项目 . 为了使用Stanford CoreNLP共同参考系统,我们通常会创建一个管道,它需要标记化,句子分割,词性标注,词形化,命名实体重新定义和解析 . 例如: Properties props = new Properties(); props.setProperty("annotators&...
  • 2 votes
     answers
     views

    如何在stanford core nlp工具包中获取Coreference Resolution注释?

    我正在尝试使用Stanford Corenlp工具包来注释文本 . 我试着使用这里提供的代码:http://stanfordnlp.github.io/CoreNLP/并且效果很好 . 问题是当我想使用 Co-reference Resolution tool embedded in coreNLP toolkit 时 . 这是行不通的 . 我使用了stanford nlp group发布的代码 ...
  • 0 votes
     answers
     views

    什么是对斯坦福NLP关系标记器的XML输出中的实体跨越开始和结束的正确解释

    Stanford NLP工具3.6.0版的XML输出包含这样的块用于关系提取: <relation id="RelationMention-11">Located_In <arguments> <entity id="EntityMention-3">PEOPLE ...
  • 0 votes
     answers
     views

    斯坦福nlp-Coreference解析 - “java.lang.OutOfMemoryError:Java堆空间”

    我试图用conll 2012试验数据训练统计共指解析系统(http://conll.cemantix.org/2012/data.html) . 我想训练它用于医疗数据 . 但我开始使用conll 2012试验数据,以了解统计学共享管道 . 我只拿了两个大小小于2MB的文件(eng_0012.conll,eng_0014.conll) . 这两个文件共包含8个培训文档 . 我按照下面的链接来构建模...
  • -1 votes
     answers
     views

    斯坦福大学NLP:共同参与解决方案的语料库

    我只是想知道哪个语料库是斯坦福NLP的英语统计共指解析系统 . 如果用在小说上会有效吗?
  • 0 votes
     answers
     views

    斯坦福核心NLP管道

    我正在尝试使用NER标记创建管道 . 如何以这种方式获得NER标记? 行触发错误: String nerrr = token.ner(); 码: public class NLPpipeline { public AnnotationPipeline buildPipeline() { Properties props = new Properties(); Annotatio...
  • 0 votes
     answers
     views

    使用Netbeans的Stanford NER上的Java堆空间错误

    我使用斯坦福NER来解析一个句子以获得以下标签:tokenize,ssplit,pos,lemma,ner . 我还通过Project-> Properties-> Run-> VM Options将netbeans中的内存增加到 -Xms1600M -Xmx1600M . 我仍然得到Java内存异常 . 我在Windows 7 JDK 1.7版上运行32位java . 这是我...
  • 1 votes
     answers
     views

    StanfordCoreNLP和Semantic Graph的性能问题

    当我尝试使用Stanford-NLP和CoreNLP分析文本时,性能非常差 . 从CNN.com处理文档大约需要30秒 . 我的代码基本上创建了一个StanfordCoreNLP的单个实例,其配置如下: annotators = tokenize,ssplit,pos,lemma,ner,parse,dcoref sutime.binders = 0 当我禁用“ner,parse,dcoref”时...
  • 0 votes
     answers
     views

    在斯坦福CoreNLP强制POS标签

    有没有办法使用Stanford CoreNLP处理已经POS标记的文本? 例如,我有这种格式的句子 They_PRP are_VBP hunting_VBG dogs_NNS ._. 并且我想通过强制给定的POS注释来引用引理,ner,parse等 . Update. 我试过这段代码,但它没有用 . Properties props = new Properties(); props.setPr...
  • 0 votes
     answers
     views

    获取Stanford CoreNLP中的注释器列表

    我通过添加一些新的Annotators来定制Stanford CoreNLP,每个Annotators都有其要求 . 有没有办法从StanfordCoreNLP对象中获取需求和满意度列表? 例如,我实例化CoreNLP对象: Properties props = new Properties(); props.setProperty("annotators", "to...
  • 3 votes
     answers
     views

    使用NER注释文本:异常:无法读取TokensRegexNER

    我正在尝试使用Java中的Stanford CoreNLP v3.9.1来注释文本 . 使用的注释器是:tokenize,ssplit,pos,lemma,ner 我已经包含了https://stanfordnlp.github.io/CoreNLP/download.html的模型 jar . 两个英语模型都包含在我的项目中(普通kbp) . 但是,在加载 english.muc.7class...
  • 1 votes
     answers
     views

    Stanford NLP:java.lang.IllegalArgumentException:没有名为openie的注释器

    我想知道是否有人可以帮助我 . 我正在使用stanford-corenlp 3.5.2 maven包从教程中运行OpenIEDemo . 我收到以下输出: - 添加注释器标记化TokenizerAnnotator:未提供标记器类型 . 默认为PTBTokenizer . 添加注释器ssplit添加注释器pos从edu / stanford读取POS标记器模型/ nlp / models / po...
  • 0 votes
     answers
     views

    Stanford Core NLP服务无法正常运行

    我正在尝试通过发出以下命令来运行Stanford CoreNLP服务 . java -Djava.net.preferIPv4Stack=true -cp "*" -mx7g edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -- listing properties -- port=9000 Starting...
  • 1 votes
     answers
     views

    线程“main”中的异常java.lang.NoClassDefFoundError:edu / stanford / nlp / pipeline / StanfordCoreNLP

    我从https://stanfordnlp.github.io/CoreNLP/下载了stanford corenlp zip文件,然后将其解压缩并插入其中 . 现在我尝试运行以下java文件 . javac -cp "*" SentimentAnalysis.java works 很好,但 java SentimentAnalysis 抛出错误,线程中的异常"m...
  • 0 votes
     answers
     views

    如何从dotnet连接Stanford Core Server

    我正在尝试使用Stanford NLP for .NET . 我对此很新 . 如何从c#程序连接Stanford核心NLP服务器 我的NLP服务器在localhost:9000上运行
  • 0 votes
     answers
     views

    如何在Windows 10下启动Stanford CoreNLP服务器以进行远程访问(而不是localhost)

    服务器在本地模式下运行良好:我可以在localhost:9000或192.168.1.nn:9000下正确使用Stanford CoreNLP网页 . 不幸的是,当我从另一台计算机(在LAN上)调用网页时(我称之为192.168.nn.nn:9000),我在互联网浏览器中出现了ERR_CONNECTION_TIMED_OUT错误 . 我注意到端口无法访问(通过telnet) . 如何启动Stanf...
  • 0 votes
     answers
     views

    为什么当我使用共享时,standfordCoreNLP不会输出?

    我在windows 64bit python(3.6)上使用stanford CoreNLP Server进行共参考解析,我的代码如下:def coref(句子):#StanfordCoreNLP服务器正在运行http://127.0.0.1:9000 nlp = StanfordCoreNLP('http://localhost:9000 ') props = {' annotators ': ...
  • 0 votes
     answers
     views

    来自Stanford CoreNLP解析器的树结构

    我正在尝试运行StanfordCoreNLP解析器,我有以下代码: from pycorenlp import StanfordCoreNLP nlp = StanfordCoreNLP('http://localhost:9000') def depparse(text): parsed="" output = nlp.annotate(text, pro...
  • 0 votes
     answers
     views

    斯坦福NLP工具和大量文本

    我目前正在使用Stanford CoreNLP工具从文本中提取三元组 . 我一直在处理相对较小的文本,但我需要让它适用于较大的文本 . 此外,我需要平均机器上的这项工作与平均内存量 . 关于如何减少内存负载的任何建议?也许将文本拆分成更小的部分(这会搞砸芯片式但是......)? 谢谢
  • 7 votes
     answers
     views

    使用斯坦福NLP检测语言

    我想知道是否可以使用 Stanford CoreNLP 来检测一个句子写入哪种语言?如果是这样,那些算法有多精确?
  • -1 votes
     answers
     views

    斯坦福NLP如何预处理文本

    我有这样一句话“在@walman工作的人不好” 我有一个预处理的文本文件,其中包含映射,类似于以下两行: @walman Walman @text Test 对于上面的句子,我必须通读文本文件并将该单词替换为文本文件中找到的任何匹配单词 . 上述句子将改为“在沃尔曼工作的人不好” 我正在寻找Standford NLP中可用的API来读取输入文本文件并替换文本 .
  • 1 votes
     answers
     views

    斯坦福NLP:OutOfMemoryError

    我正在注释和分析一系列文本文件 . 每次读取文件时,pipeline.annotate方法变得越来越慢 . 最终,我得到一个OutOfMemoryError . Pipeline is initialized ONCE: protected void initializeNlp() { Log.getLogger().debug("Starting Stanford NLP&qu...

热门问题