首页 文章

.net WebBrowser控件修改html? [关闭]

提问于
浏览
-1

我正在抓网页,当我在带有IE 8的Windows XP盒子上运行我的刮刀应用程序时(它是Windows XP支持的最大版本),它返回webBrowser.Body.OuterHtml中的不同HTML源,而不是在使用IE9的Windows 7上运行时 . 有谁知道如何从webbrowser控件中修改未修改的原始HTML?我知道IE修改HTML所以我想知道如何获取从Web服务器返回的原始html . 这很麻烦,因为我在我的Windows 7开发盒上编写了刮刀,然后当我在Windows XP盒子上托管它时它将无法工作 . 如果您回答不要告诉我使用WebClient并下载页面,我想轻松支持浏览页面,而不必担心webbrowser控件处理的其他小网页内容 . 我使用webbrowser控件是有原因的 . webBrowser.DocumentText是否返回原始html或者这仍然是修改过的HTML是IE吗?

1 回答

  • 2

    从根本上说,你有两个相反的问题:

    • 您希望获得原始来源,不受浏览器可以执行的任何操作

    • 你想让浏览器做一些事情,因为你显然觉得它很有用 . (你've said you'正在使用 WebBrowser "for a reason"但你实际上并没有告诉我们这是什么原因 . )

    如果由于某种原因确实需要使用 WebBrowser ,您可能需要两次获取每个页面:一次在浏览器中(以便它可以执行您需要的任何操作)和一次使用 WebClient (以便您可以在没有任何内容的情况下获取响应)搞乱) .

    也可以在浏览器控件中禁用脚本来完成您需要的所有操作 - 但是由于您没有首先使用浏览器控件的原因,这可能没有帮助......

相关问题