-
0 votesanswersviews
Mechanize / Nokogiri无法使用xpath解析XML
我从API收到一个xml文件 . 我正在尝试使用Mechanize解析它,它将其作为XML文件接收 . Nokogiri的基础 . 无论我做什么,我似乎无法使用任何xpath变量返回任何内容 . 它似乎认识到xml文件很好,即它作为Mechanize :: XmlFile出现,如果我使用Nokogiri则显示元素 . 我可以跑 . xml.at("/") 并获得响应,但我运... -
0 votesanswersviews
机械化和美丽的汤蟒蛇
我正在尝试使用漂亮的汤和机械化将表单提交到网站 . 机械化本身会引发嵌套表单的错误,所以我尝试遵循使用另一个解析器的建议 . 这是代码: browser = mechanize.Browser() browser.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Ge... -
0 votesanswersviews
机械化br.submit()限制?
我的目的是使用Mechanize向网站提交搜索查询,并使用BeautifulSoup分析结果 . 这将用于同一网站,因此表格名称等可以硬编码 . 我的初始查询出现问题,如下所示: import mechanize import urllib2 #from bs4 import BeautifulSoup def inspect_page(url): br = mechanize.Bro... -
1 votesanswersviews
Python,使用Anaconda python IDE的库的路径
我试图在我的Windows 7上使用机械化模块python,我将文件夹复制到我的路径 . “[..] \ Anaconda3 \ LIB \站点包\机械化” 问题是当我尝试导入机械化时,路径就像“[..] \ Anaconda3 \ lib \ site-packages \ mechanize-0.2.6.dev20161221-py3.5.egg \ mechanize__init __ .... -
1 votesanswersviews
提取复选框输入对象的标签值,用美丽的汤代替python中的mechanize
机械化和BeautifulSoup的新手,我很喜欢它 . 我使用了机械化打开URL的原型方法,现在我有了返回的对象: def OpenURL(URL, USERAGENT): br = Browser()# Create a browser br.set_handle_robots(False) # no robots br.set_handle... -
5 votesanswersviews
使用mechanize检索robots.txt的HTTP 403错误
这个shell命令成功 $ curl -A "Mozilla/5.0 (X11; Linux x86_64; rv:18.0) Gecko/20100101 Firefox/18.0 (compatible;)" http://fifa-infinity.com/robots.txt 并打印robots.txt . 省略user-agent选项会导致服务器出现403错误 . ... -
11 votesanswersviews
Web Crawler - 忽略Robots.txt文件?
某些服务器具有robots.txt文件,以阻止网络抓取工具抓取其网站 . 有没有办法让网络抓取工具忽略robots.txt文件?我正在使用Mechanize for python .