-
0 votesanswersviews
ASP.NET Core HtmlAgilityPack编码错误
有一些关于编码问题的帖子和 HtmlAgilityPack 但是这个问题没有得到解决: 因为我尝试解析的网站包含像 € 或 ä 这样的Unicode符号, ü 我尝试将编码设置为Unicode: public class WebpageDeserializer { public WebpageDeserializer() {} /* * Example address:... -
2 votesanswersviews
XPATH查询,HtmlAgilityPack和提取文本
我一直试图从名为“tim_new”的类中提取链接 . 我也得到了一个解决方案 . 解决方案,摘要和必要信息都给出了here 上面说的XPATH查询是 "//a[@class='tim_new'] ,我的问题是,这个查询如何区分片段的第一行(在上面的链接和片段的第二行中给出) . 更具体地说,这个XPATH查询的字面翻译(英文)是什么 . 此外,我想写几行代码来提取针对 NSE: 的文本... -
0 votesanswersviews
(不可能)在Unity中找不到HtmlAgilityPack
我有HtmlAgilityPack的问题...我已经在Visual Studio中正确导入了包(参考>管理NuGet包>浏览,只是安装了包)在Unity中我收到此错误: Assets / Scripts / Searcher.cs(13,7):错误CS0246:找不到类型或命名空间名称'HtmlAgilityPack' . 你错过了装配参考吗? 我没有忘记在我的脚本中添加两个 us... -
1 votesanswersviews
HtmlAgilityPack下载通过javascript异步加载的网页
我正在使用HtmlAgilityPack并尝试加载一些网页 . 一些网页是基于JavaScript的,并且异步加载 . 是否有任何方法可以在x秒后或确保页面完全加载后加载网页 -
36 votesanswersviews
HtmlAgilityPack选择childNodes不符合预期
我试图使用HtmlAgilityPack库来解析页面中的一些链接,但我没有看到我期望从这些方法得到的结果 . 在下面我有一个HtmlNodeCollection的链接 . 对于每个链接,我想检查是否有图像节点,然后解析其属性,但linkNode的SelectNodes和SelectSingleNode方法似乎在搜索父文档而不是linkNode的childNodes给出了什么? HtmlDocume... -
1 votesanswersviews
HtmlAgilityPack:Descendants vs Xpath
我正在使用HtmlAgilityPack lib,并从我有限的xpath知识中了解一些问题 . 如下面的代码示例所示,从即时窗口,table是从DocumentNode中选择的htmlnode . 因此,如果选择“/ div”,则选择“div”,选择“div”,“// div”选择文档中的所有div(因此它不会仅找到它的后代 . 因此我选择了table.Descendants相反,它给了我想要的5... -
1 votesanswersviews
HtmlAgilityPack - SelectNodes在一种情况下返回节点,在另一种情况下返回null(对于相同的html)?
我有一个非常简单的html页面,看起来像这样: (index.html的): <html> <head> <title>Test</title> </head> <body bgcolor="white" text="black"> <center><h1>Tes... -
0 votesanswersviews
HtmlAgilityPack - 使用c#解析带有cookie /标签的网站
当我想从网页获取数据时,我通常使用带有HtmlDocument对象的HtmlAgilityPack,该对象使用网站的主网址,然后使用主表的HtmlNode对象,例如我想从页面获取的所有数据并复制它的XPath进入输入 . 例: HtmlDocument hDocument = GetHtmlDocumentFromUrl("http://someweb.com"); HtmlN... -
4 votesanswersviews
XPath在浏览器和HtmlAgilityPack中给出不同的结果
我试图在C#程序中使用HtmlAgilityPack解析网页的一部分 . 以下是本部分的简化版本(2015年1月30日下午2:40美国东部时间编辑): <html> <body> <div id="main-box"> <div> <div>... -
0 votesanswersviews
HTMLAgilityPack选择从第一次迭代到div的节点
我正在尝试使用HTMLAgilityPack首次解析一些网站 . 一切都按预期工作,但仅适用于第一次迭代 . 在每次迭代中,我都会获得带有数据的唯一div,但SelectNodes()始终从第一次迭代中获取数据 . 下面列出的代码解释了问题 工作站的所有属性都从第一次迭代中获取值 . static void Main(string[] args) { List<Sta... -
0 votesanswersviews
HtmlAgilityPack - SelectNodes以NullPointer异常间歇性响应
我是HTMLAgilityPack的新手,但现在逐渐能够在我的程序中成功实现 . 我所遇到的问题是“SelectNodes”间歇性地返回Nullpointer异常 . 但它确实有效 . 我试图强行等待,使用Sleep命令,在代码中调试/步骤,但没有帮助,有时我通过该行,但有时我在该行失败,错误“类型'System.ArgumentNullException'的未处理异常发生在System.Core... -
0 votesanswersviews
使用htmlagilitypack从网页中提取所有`href` /请求任何内容
我有这个网页来源: <a href="/StefaniStoikova"><img alt="" class="head" id="face_6306494" src="http://img0.ask.fm/assets/054/771/271/thumb_tiny/sam_7082.jpg... -
0 votesanswersviews
使用HTMLAgilityPack获取select元素的所有值
这是我到目前为止: HtmlAgilityPack.HtmlDocument ht = new HtmlAgilityPack.HtmlDocument(); TextReader reader = File.OpenText(@"C:\Users\TheGateKeeper\Desktop\New folder\html.txt"); ht.... -
2 votesanswersviews
如何将HtmlAgilityPack的Htmlnode转换为webbrowser HtmlElement
我正在创建一个自动将数据插入html输入标签的应用程序 . 我有特定标签的xPath,如'/ html / body / form / div / div [2] / div / div / input',我设法在HtmlAgilityPack的帮助下得到HtmlNode var documentAsIHtmlDocument3 = (mshtml.IHTMLDocument3)webBrowse... -
1 votesanswersviews
使用HtmlAgilityPack删除HtmlNode中的HtmlNode
如何从房屋中删除号码节点及其值? Document : <number>123456</number> <house> <number> </number>Red</house> <house> <number>12</number>Blue</house> <number... -
1 votesanswersviews
在HtmlAgilityPack中复制HtmlNode?
我正在使用HTML Agility Pack在同一页面上执行两项不同的操作 .对于第一个我需要删除像脚本,样式等元素 . 但是对于第二个,我必须保留所有元素 . 因为我不能在第一部分之前做第二部分,所以我首先想要一种复制对象的方法,所以我可以保存第二部分的所有元素 . 这是我试过的代码,但是对于一些共鸣,我没有得到它内部的节点 . HtmlDocument HTMLdoc = new HtmlDo... -
2 votesanswersviews
htmlAgilityPack HtmlNodeCollection项目与节点集合
我正在使用htmlAgilityPack来解析一些html值 . 我加载文档,然后执行selectNodes(“/ html / body // a”),一切正常 . 但是,如果我为每个循环做一个像 对于htmlnodecollection.nodes中的每个htmlnode htmlnode对象没有属性,只有标签中的文本 . 如果我使用项目索引(如htmlnodecollection(0))遍历... -
5 votesanswersviews
如何在没有使用HtmlAgilityPack的子标签的情况下单独获取innertext?
我有一个HTML页面,如下所示 . 我需要单独从'span'标签中取出'blah blah blah' . <span class="news"> blah blah blah <div>hello</div> <div>bye</div> </span> 这给了我所有的 Value : div.Sel... -
1 votesanswersviews
如何用string.Empty [duplicate]替换Html Comment <! - comment - >标签
这个问题在这里已有答案: Accessing Comments in XML using XPath 4个答案 How to strip comments from HTML using Agility Pack without losing DOCTYPE 2个答案 我试图从我的htmlNode中删除所有Html注释标记,以下是我的c#中的HtmlNode选择代码 HtmlNode ... -
11 votesanswersviews
HtmlAgilityPack - 如何通过Id获取标签?
我有一项任务要做 . 我需要检索特定 id 的 tag 或 href ( id 来自用户输入) . 示例我有一个像这样的 html <manifest> <item href="Text/Cover.xhtml" id="Cov" media-type="application/xhtml+xml" /> ... -
45 votesanswersviews
HtmlAgilityPack和HtmlDecode
我目前正在使用带有控制台应用程序的HtmlAgilityPack来抓取一个网站 . 由于html是编码的(它返回编码字符,如 &#039; ),我必须在将内容保存到我的数据库之前进行解码 . 有没有办法使用HtmlAgilityPack解码返回的html而不必使用HttpUtility.HtmlDecode?我希望尽可能避免将System.Web添加到我的控制台应用程序中 . -
8 votesanswersviews
HtmlAgilityPack - 获取文档中的所有节点
我想使用HtmlAgilityPack将遍历documnet中的所有节点 foreach (HtmlNode node in myhtml.DocumentNode.SelectNodes("//@")) 做? -
33 votesanswersviews
HtmlAgilityPack并选择节点和子节点
希望有人可以帮助我 . 假设我有一个包含多个div的html文档,如下例所示: <div class="search_hit"> <span prop="name">Richard Winchester</span> <span prop="company">Kodak&l... -
1 votesanswersviews
HtmlAgilityPack不循环收集
我有一个带有“消息”类的div集合的网页 . 我试图循环它们并将它们放入CSV文件,但我不能让集合正确循环 . 这是代码: string fpath = @"C:\Texts\messages.html"; HtmlDocument page = new HtmlWeb().Load(fpath); var msgs = page.DocumentNode.SelectNo... -
0 votesanswersviews
xpath和htmlagilitypack迭代类似的节点
我正在抓取的HTML是在下面 . 它包含一个帖子和2个回复: <div class="share_buttons noprint">...</div> <strong>Dan</strong> Says: <span class="small soft"><time datetime=&qu... -
12 votesanswersviews
Htmlagilitypack:创建html文本节点
在HtmlAgilityPack中,我想创建 HtmlTextNode ,这是一个 HtmlNode (来自HtmlNode的inherts),它有一个自定义的InnerText . HtmlTextNode CreateHtmlTextNode(string name, string text) { HtmlDocument doc = new HtmlDocument(); ... -
1 votesanswersviews
使用htmlagilitypack搜索具有特定属性的节点
我只看到了如何搜索属性具有或包含某些值的节点的示例,但我找不到一个搜索属性存在的节点的地方 . 怎么做的? -
-2 votesanswersviews
使用HtmlAgilityPack解析innerHTML
只是想弄清楚如何解析已经解析过的信息中的信息 . foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div [@class=\"result-link\"]")) { if (node == null) Console.WriteLine("debug&quo... -
0 votesanswersviews
在C#中的HTMLAgilityPack中循环遍历单个节点
我试图从具有以下结构的项目列表中获取“ID”和“URL”: <li class="ad container"> <article class="item_list view_listing " data-id="109199375"> <div class="i... -
0 votesanswersviews
HtmlAgilityPack找不到节点
我试图从Here获得 Start 的调用范围 Chrome给了我这个xPath: //*[@id="guide-pages"]/div[2]/div[1]/div/div[1]/div/div/div[2]/div/div[3]/div[2]/div[1]/h2 但是在我尝试逐个删除之后,HtmlAgilityPack返回null;这有效: //*[@id="guid...