-
0 votesanswersviews
在手动生成的线程上调用UIGetScreenImage()会打印“_NSAutoreleaseNoPool():”消息以记录
这是 NSThread +detachNewThreadSelector:(SEL)aSelector toTarget:(id)aTarget withObject:(id)anArgument 中指定的选择器的主体 NSAutoreleasePool *pool = [[NSAutoreleasePool alloc] init]; while (doIt) { ... -
-1 votesanswersviews
使用Libreoffice Basic读取HTML页面
我试图在LibreOffice Calc中编写一个宏,它将从一个单元格(例如Stark)中读取一个贵族House of Westeros的名字,然后通过查看the relevant page在冰与火的Wiki上输出该House的单词 . 它应该像这样工作: 这是伪代码: Read HouseName from column A Open HtmlFile at "http://www... -
1 votesanswersviews
除了一个标记之外,在BeautifulSoup中提取文本
我正在尝试使用BeautifulSoup提取文本 . 这是html: <div> "BLABLA" <span> "RRRRR" </span> <span> "ZZZZZ" </span> </div> 我想只获得 'BLABLA' 和 '... -
46 votesanswersviews
jsoup发布和cookie
我正在尝试使用jsoup登录网站,然后抓取信息,我遇到问题,我可以成功登录并从index.php创建一个文档,但我无法在网站上获取其他页面 . 我知道我需要在发布后设置一个cookie,然后在我尝试在网站上打开另一个页面时加载它 . 但是我该怎么做?以下代码允许我登录并获取index.php Document doc = Jsoup.connect("http://www.example... -
0 votesanswersviews
Datomic可以简化查询动态访问的HTML文档中包含的数据吗?
我需要编写一个API,它可以访问从Web服务器作为HTML文档提供的数据 . 我需要我的用户能够对数据执行查询 . 在网站上说有一个页面列出了项目及其所有者 . 然后还为业主提供了一组额外的 Profiles 页面,供每个所有者提供有关其声誉的信息 . 我可能需要回答的示例查询是“向我提供2013年提交的所有项目的ID和所有者,其所有者的声誉至少为10” . 给定一个要回答的查询,我需要能够仅屏蔽... -
1 votesanswersviews
如何自动导航到需要身份验证的网站?
这就是我想要实现的目标 . 我想写一个脚本,将导航到一个网站,要求我作为我自己,Facebook,Live Spaces,Twitter或任何其他人进行身份验证,然后让该脚本在网站的其中一个页面上搜索某些信息 . 我在过去使用Windows.Forms WebBrowser控件做了类似的事情,这是一个完整的IE实现,可以通过代码控制,并且可以存储经过身份验证后获得的任何cookie,但是它非常不友... -
3 votesanswersviews
Python urllib2.open通过对等错误重置连接
我正在尝试使用python抓取一个页面 问题是,我不断通过同行重置Errno54连接 . 运行此代码时出现错误 - urllib2.urlopen("http://www.bkstr.com/webapp/wcs/stores/servlet/CourseMaterialsResultsView?catalogId=10001&categoryId=9604&storeI... -
0 votesanswersviews
vba excel替代application.SendKeys
我看了帖子Excel VBA: Alternative to SendKeys但没帮我解决问题... Preview : 我有一个宏从网页中提取数据(scraping..i使用internetExplorer对象) . 完成所有操作后,弹出窗口保存或打开文件 . 我想保存文件并保存文件我使用 application.SendKeys "%{S}" (和工作) . 我要做这个我必... -
33 votesanswersviews
如何在python中下载任何(!)网页和正确的字符集?
问题 When screen-scraping a webpage using python one has to know the character encoding of the page. 如果你得到的字符编码错误,你的输出就会搞砸了 . 人们通常使用一些基本技术来检测编码 . 它们使用标头中的字符集或元标记中定义的字符集,或者使用encoding detector(它不关心元标记或 He... -
3 votesanswersviews
美丽的汤4导入错误?安装错误?
背景: 我在Mac OSX上,10.8.5 python -V 说我跑2.7.2 pip freeze 说我安装了beautifulsoup4 == 4.3.2 . 根据本教程,我正在尝试使用Beautiful Soup 4来抓取网页:http://www.pythonforbeginners.com/python-on-the-web/web-scraping-with-beau... -
0 votesanswersviews
Excel VBA数据挖掘来自刷新数据的网页的实时数据
我想捕获更新到网页表格中的实时数据;我更喜欢使用VBA将其捕获到excel中,但如果我更容易,我会用.NET C#或VB编写它 . 数据更新大约1或2秒,我想 grab 最新的数据引号并将其记录到我的电子表格中;表名相同,只刷新数据,并在网页上自动刷新 . 我已经做了很多Excel VBA,我知道如何将URL下载到文件 - 这不是我想要的;我希望能够访问我的网页,这些网页处于活动状态,并在我登录我... -
0 votesanswersviews
在Microsoft excel vba中刮网
我在excel中创建了一个vba来读取产品DKP编号并将其添加到网站URL的末尾,并在我的vba代码中正确执行 . 例如DKP-145686,我在excel单元格中输入,它将它添加到以下链接:https://www.digikala.com/Product/结果是:https://www.digikala.com/Product/DKP-145686 在第二步中,我们需要查看URL地址为:http... -
0 votesanswersviews
多个表单从结果页面提交和解析数据
我有一个有多种形式的网页 . 每个提交的表单都会打开一个新页面我正在尝试从这些页面获取数据 . 使用下面的代码,我可以打开页面,但数据是从表单页面提取的,而不是提交后出现的页面 . 我看了这个解决方案,但它在我的情况下不起作用 . excel vba form submit and parse data from result 这是我的代码; Set formsw = IE.document.fo... -
1 votesanswersviews
如何使用scrapy对每个href进行爬行
我如何使用scrapy爬行到每个href?我只知道如何显示它,但我希望能够进入每个链接 . 这是我们的Intranet数据,因此您无法访问这些链接 . 另外,如何在数据显示在文件中时格式化日期?我是否需要在start_url中添加网址列表?我是否需要将initSpider更改为crawlSpider? <row> <cell type="href" href=... -
11 votesanswersviews
网站特别难以爬行和刮擦? [关闭]
我对面向公众的网站(登录/身份验证后面没有任何内容)感兴趣,其中包括: 高度使用内部301和302重定向 反刮削措施(但不通过robots.txt禁止抓取) 非语义或无效标记 以onclicks或无限滚动的形式通过AJAX加载内容 网址中使用了很多参数 典型问题 内部链接结构复杂 和其他任何通常会使抓取网站的事情变得令人头疼! 我已经构建了一个爬虫/蜘蛛,它可以... -
8 votesanswersviews
使用python和BeautifulSoup从html中提取表内容
我想从html文档中提取某些信息 . 例如 . 它包含一个表(在其他表中包含其他内容),如下所示: <table class="details"> <tr> <th>Advisory:</th> <td>RHBA-2... -
2 votesanswersviews
如何获取谷歌 Map 查询字符串的Lat / Lng?
我有这个链接: http://www.google.com/maps?cid=0,0,612446611849848549&f=q&source=embed&hl=en&geocode=&q=Универзална+Сала+&sll=,&&ie=UTF8&hq=&hnear=Универзална+Сала+&...