这就是我想要实现的目标 . 我想写一个脚本,将导航到一个网站,要求我作为我自己,Facebook,Live Spaces,Twitter或任何其他人进行身份验证,然后让该脚本在网站的其中一个页面上搜索某些信息 .
我在过去使用Windows.Forms WebBrowser控件做了类似的事情,这是一个完整的IE实现,可以通过代码控制,并且可以存储经过身份验证后获得的任何cookie,但是它非常不友好 . 修改,我希望使用脚本语言,也许是Powershell或类似的东西 .
网上有没有关于这方面的一些好的教程?
谢谢!
4 回答
如果Python是您的第一选择,Mechanize Twill Beautiful Soup .
看看SO screen-scraping标签也是如此 .
有很多选择 . 在过去,我使用Chickenfoot自动浏览经过身份验证的网站,或者使用Mechanize从控制台自动执行浏览器 .
然后抓取网站并检查每个页面的HTML数据 .
您可以使用IRobotSoft网络刮刀 . 它自动化用于Web数据挖掘的IE WebBrowser控件 . 有关典型问题,请参阅他们的论坛http://www.irobotsoft.org/bb/ .
我创建了一个新的PowerShell模块,目前在Technology Preview中 . 试试http://facebookpsmodule.codeplex.com,让我知道这对你有用!