首页 文章

HtmlAgilityPack - 使用c#解析带有cookie /标签的网站

提问于
浏览
0

当我想从网页获取数据时,我通常使用带有HtmlDocument对象的HtmlAgilityPack,该对象使用网站的主网址,然后使用主表的HtmlNode对象,例如我想从页面获取的所有数据并复制它的XPath进入输入 . 例:

HtmlDocument hDocument = GetHtmlDocumentFromUrl("http://someweb.com");
HtmlNode mainNode = hDocument.DocumentNode.SelectSingleNode("//*[@id='XpathOfTableWithData']");

这样做之后,我可以循环到这个主节点的childNodes并获得我想要的东西,但是有些网站包含“标签”,它们就像新版本的网站一样新风格然后我只是得到主节点空值 . 如果页面包含cookie并有标签,我如何使用c#和HtmlAgilityPack获取此信息?

谢谢!

1 回答

  • 0

    'tabs'应该仍然是使用CSS增强的html元素 . 如果您查看其中一个相关网站,您应该看到结构并相应地修改您的代码 .

相关问题