嘿,我正在寻找水晶中的一些html解析库 . 类似于nokogiri的红宝石 . 我有一个正常的表达式,但更喜欢html解析库,因为html正则表达式==坏 . 谢谢 .
Crystal标准库中的标准方法是XML.parse_html . 这将给你一个 XML::Node ,它有一个非常好的界面 .
XML::Node
如果你需要使用CSS选择器,你可以使用Crystagiri,否则我不会提供't see much benefit over the stdlib' .
经过几个小时的谷歌搜索后,我发现了myhtml,modest和Crystagiri . 所有这些都是HTML解析库 .
我是Crystagiri的创造者 . 这是一个用于Crystal的HTML解析器库(就像令人惊叹的Nokogiri Ruby宝石 . 我不会假装Crystagiri像Nokogiri那样做很多,但你可以使用CSS选择器 .
贝娄一个基本的例子:
require "crystagiri" doc = Crystagiri::HTML.from_url "http://example.com/" puts doc.css("li > strong.title") { |tag| puts tag.node} # => <strong class="title"> .. </strong> # => <strong class="title"> .. </strong>
感谢Crystal Lang,Crystagiri比Nokogiri快三倍(根据我的测试) .
3 回答
Crystal标准库中的标准方法是XML.parse_html . 这将给你一个
XML::Node
,它有一个非常好的界面 .如果你需要使用CSS选择器,你可以使用Crystagiri,否则我不会提供't see much benefit over the stdlib' .
经过几个小时的谷歌搜索后,我发现了myhtml,modest和Crystagiri . 所有这些都是HTML解析库 .
我是Crystagiri的创造者 . 这是一个用于Crystal的HTML解析器库(就像令人惊叹的Nokogiri Ruby宝石 . 我不会假装Crystagiri像Nokogiri那样做很多,但你可以使用CSS选择器 .
贝娄一个基本的例子:
感谢Crystal Lang,Crystagiri比Nokogiri快三倍(根据我的测试) .