-
0 votesanswersviews
使用 Nokogiri 读取 xhtml 文件会给标签带来无效错误
我正在使用 rails 5 和 ruby 2.3我正在使用 gem nokogiri(1.8.5)来读取我的 xml,svg 和 xhtml 文件。 在阅读我的 xhtml 文件时,nokogiri 给了我以下错误。 > [#<Nokogiri::XML::SyntaxError: 8:159: ERROR: Tag x3d invalid>, > #<Nokogir... -
0 votesanswersviews
XPath:如果元素不存在,是否可以返回空字符串
我使用nokogiri(反过来使用xpath)来解析xml文件 . xml有一些数据,包括每个元素的“定义” . 一些子节点没有定义元素 . 示例示例: <parent> <definition> It is XYZ </definition> </parent> <parent> <definition> It i... -
1 votesanswersviews
LoadError:与nokogiri 1.6.8.1不兼容的库版本
我正在研究在旧版本的Ruby和Rails上运行的相当旧的项目 . Ruby版本= 1.9.3p551 Rails verison = 3.1.10 因此,当我尝试在新机器上配置此项目时,它会显示与NOKOGIRI相关的错误 . “LoadError:不兼容的库版本 - /home/global/.rvm/gems/ruby-1.9.3-p551/gems/nokogiri-1.6.8.1/lib... -
3 votesanswersviews
XPath选择前面的元素与可选的插入空白文本节点
给定一个元素作为上下文我想选择前面的兄弟元素并检查它是否具有特定的名称 . 需要注意的是,如果存在具有非空白内容的插入文本节点,我不想选择它 . 例如,给定这个XML文档...... <r> <a>a1</a><a>a2</a> b <a>a3</a> <a>a4</a>... -
0 votesanswersviews
Scrapy未能找到Nokogiri发现的Xpath
我正在为一个需要从多个商店/网站抓取产品的网站新工作...... 我对python和scrapy有点新,其中编写了原始代码,因此在测试爬虫和Xpath时,我使用Scrapy并打开另一个控制台来测试使用nokogiri(Ruby gem) 在一个特定的网站,我没有使用scrapy提取一些内容,但我发现我可以使用相同的xpath从相同的URL获取此内容 以下是两种情况下使用的代码段: Scrapy ... -
2 votesanswersviews
基于Ruby / Nokogiri中的XSLT转换XML
我试图在Ruby / Nokogiri中基于XSLT转换XML . doc = Nokogiri::XML(File.read('some_file.xml')) xslt = Nokogiri::XSLT(File.read('some_transformer.xslt')) puts xslt.transform(doc) 但它失败了: I / O警告:无法加载外部实体“dateD... -
1 votesanswersviews
难以使用Nokogiri拉<li>元素
我正在尝试开发一个刮刀来从NewEgg中提取内容 . 我在Ruby on Rails上安装了Nokogiri,据我所知,它正在运行 . 但是,我很难找到一个包含定价信息的特定元素,而我并不完全确定它为什么不起作用 . 下面的代码应该查找列表类“price-current”并放置该代码的每个实例 . 相反,我没有得到任何结果 . require 'rubygems' require 'open-ur... -
2 votesanswersviews
LoadError:不兼容的库版本 - /home/ubuntu/.rvm/gems/ruby-2.3.1@lm5/gems/nokogiri-1.8.2/lib/nokogiri/nokogiri.so
尝试使用 生产环境 模式运行rake资源预编译,如下所示 . rake assets:precompile 它适用于ubuntu 14.04(32位)和16.06(32位) . 但是在aws ec2中获得16.04(64位)的加载错误 . 请帮我解决这个问题 . 提前致谢 . 这是我的完整堆栈跟踪 耙子流产! LoadError:不兼容的库版本 - /home/ubuntu/.rvm/gems... -
2 votesanswersviews
Bundler找不到gem“nokogiri”的兼容版本
我将rails应用程序推送到appfog,但收到以下错误消息: /var/vcap.local/dea/apps/superb-0-dc92a2e492e46c40c06d2abc3ad59841/app/rubygems ruby / 1.9.1 / gems / bundler-1.1.3 / lib / bundler / resolver.rb:129:在`block in resolv... -
-1 votesanswersviews
如何使用Nokogiri和Ruby解析XML文件
我有一个XML文件: <root> <person name="brother">Abhijeet</person> <person name="sister">pratiksha</person> </root> 我想用Nokogiri解析它 . 我尝试使用CSS和X... -
23 votesanswersviews
为什么Nokogiri xpath不像xmlns声明
我正在使用Nokogiri :: XML来解析来自Amazon SimpleDB的响应 . 响应类似于: <SelectResponse xmlns="http://sdb.amazonaws.com/doc/2007-11-07/"> <SelectResult> <Item> <Attribute>&l... -
0 votesanswersviews
处理存储具有相同名称和不同XPath的子元素?
我正试图用Nokogiri从XML中提取值 . 我想在数组中分隔具有相同名称但不同xpath的子元素 . 这些元素是 ProdA , ProdB . 目前我只是尝试打印子元素,但到目前为止我的代码只打印“SDocument”而不是子元素 . 目标是有这样的数组: array = [["2","8"], ["8","9"... -
0 votesanswersviews
Mechanize / Nokogiri无法使用xpath解析XML
我从API收到一个xml文件 . 我正在尝试使用Mechanize解析它,它将其作为XML文件接收 . Nokogiri的基础 . 无论我做什么,我似乎无法使用任何xpath变量返回任何内容 . 它似乎认识到xml文件很好,即它作为Mechanize :: XmlFile出现,如果我使用Nokogiri则显示元素 . 我可以跑 . xml.at("/") 并获得响应,但我运... -
1 votesanswersviews
Nokogiri拉解析器(Nokogiri :: XML :: Reader)问题与自闭标签
我有一个包含产品的巨大XML(> 400MB) . 因此排除使用DOM解析器,因此我尝试使用pull解析器解析和处理它 . 下面是 each_product(&block) 方法的片段,其中我遍历产品列表 . 基本上,使用堆栈,我将每个 <product> ... </product> 节点转换为哈希并处理它 . while (reader.read) c... -
11 votesanswersviews
使用Nokogiri将元素添加到元素中
显然,Nokogiri的add_class方法仅适用于 NodeList s,使此代码无效: doc.search('a').each do |anchor| anchor.inner_text = "hello!" anchor.add_class("whatever") # WHOOPS! end 我该怎么做才能使这段代码有效?我觉得它有点像... -
1 votesanswersviews
使用nokogiri难以截屏http://www.momondo.com
我从飞行结果中提取总价(css selector ='.total')有些困难 . http://www.momondo.com/multicity/?Search=true&TripType=oneway&SegNo=1&SO0=KUL&SD0=KBR&SDP0=31-12-2012&AD=2&CA=0,0&DO=false&... -
0 votesanswersviews
Nokogiri从Nokogiri获取xpath :: XML :: Element
如何获取 rc 的xpath搜索返回的元素 f=File.open('/media/cc.xml') doc = Nokogiri::XML f rc = doc.search('realmCode') [#<Nokogiri::XML::Element:0x15a4d714 name="realmCode" namespace=#<Nokogiri::XML::... -
0 votesanswersviews
如果存在与否,Nokogiri会获得元素
Quite simply can you do a conditional scrape, i.e. I want an <a> tag within a parent, and if a <span> is contained within that parent (so the span is holding the <a>, instead of the... -
57 votesanswersviews
nokogiri宝石安装错误
我知道有很多关于这个宝石的问题,但没有答案对我有用 . 当我在SSH gem install nokogiri 中运行时出现此错误: Extracting libxml2-2.8.0.tar.gz into tmp/x86_64-unknown-linux-gnu/ports/libxml2/2.8.0... OK Running patch with /home/user58952277/.g... -
1 votesanswersviews
使用Nokogiri仅刮掉可见元素
我试图像这样用Nokogiri刮掉一些网站 Nokogiri::HTML(open(url_path)) 当我得到这个HTML我搜索一个值,但Nokogiri选择所有元素,包括我不需要的隐藏的元素 . 如何仅获取 display: block 元素或排除 display: none ? -
0 votesanswersviews
使用Nokogiri刮痧数据
我正在尝试使用Nokogiri来抓取数据 . 我试图访问的代码是: <div class="main-header"> <span>Make More Money</span> </div> 我只想获得“赚更多钱”的文字 . 这是我的代码: url = 'xyz.com' doc = Nokogiri::HTML(ope... -
0 votesanswersviews
Nokogiri结果没有循环
我试图了解如何刮页 . 结果不会在视图页面上循环 . 它只显示第一个 . 为什么? LinksController: class LinksController < ApplicationController def craigslist_scrape require 'open-uri' url = "https://losangele...