首页 文章
  • 0 votes
     answers
     views

    Jsoup解析iso-8859-1文件

    我一直在网上寻找并试图理解 . 我正在解析一些在iso-8859-1中编码的html文件 . 一旦解析,我希望所有输出都是标准的java编码(utf-something) 我是这样做的: currentDocument = Jsoup.parse(new File("thing.htm", "ISO-8859-1"); Element elt = curre...
  • 1 votes
     answers
     views

    如何使用Jsoup爬网单个网站?

    我是从网站主页开始的 . 我正在解析整个网页,我正在收集该主页上的所有链接并将它们放入队列中 . 然后我从队列中删除每个链接并做同样的事情,直到我得到我想要的文本 . 但是,如果我收到像youtube.com/something这样的链接,那么我将转到youtube上的所有链接 . 我想限制这个 . 我只想在同一个域内抓取 . 我怎么做? private void crawler() throws...
  • 0 votes
     answers
     views

    将HTML文件转换为文本文件

    我得到一个html文件,我需要将文本移动到我将创建的新textFile中 . 我不知道我是否走在正确的轨道上 . 我应该先把它变成一个Document然后一个textFile吗?我目前正在做的是正确的吗?对不起,我是初学者,有点困惑 . public void parseIntoFile(){ Document docParse = Jsoup.parse("example.ht...
  • 10 votes
     answers
     views

    在Java中将HTML转换为纯文本

    我需要将HTML转换为纯文本 . 我对格式化的唯一要求是在纯文本中保留新行 . 不仅应在 <br> 的情况下显示新行,还应显示其他标记,例如 <tr/> , </p> 也导致新的一行 . 用于测试的示例HTML页面是: http://www.particle.kth.se/~lindsey/JavaCourse/Book/Part1/Java/Chapter...
  • 90 votes
     answers
     views

    使用jsoup将html转换为纯文本时如何保留换行符?

    我有以下代码: public class NewClass { public String noTags(String str){ return Jsoup.parse(str).text(); } public static void main(String args[]) { String strings="&lt...
  • 0 votes
     answers
     views

    在插入SQL Server之前检查列值是否存在

    使用JSoup解析HTML,然后将行插入MS SQL Server数据库 . 为了避免重复,我需要在插入执行之前检查guid是否存在 . 该代码有效,但我无法对guid进行验证 . 请参阅插入块中的Select语句 . 返回以下错误: 线程“main”中的异常com.microsoft.sqlserver.jdbc.SQLServerException:无法绑定多部分标识符“FeedMessag...
  • 4 votes
     answers
     views

    使用pdfbox从PDF文件中提取文本

    我试图使用pdfbox从PDF文件中提取文本,但不是作为命令行工具,而是在我的Java应用程序中 . 我正在使用jsoup下载pdf . res = Jsoup .connect(host+action) .ignoreContentType(true) .data(data) .cookies(cookies) .method(Method.POST) .timeout(20*1000) .ex...
  • 0 votes
     answers
     views

    JSOUP multipart / form-data响应

    下午好, 通常,我需要通过JSOUP以响应multipart / form-data的形式将数据发送到站点 例如,采用sgeniriruet您的查询的简单形式 . <form action =«[localhost:8000](http://localhost:8000)»method =«post»enctype =«multipart / form-data» <input typ...
  • 0 votes
     answers
     views

    Jsoup程序类型已经存在

    我正在使用JSoup在我的Java应用程序中解析我的HTML响应,但是当我添加实现时,我得到以下内容: 程序类型已存在:org.jsoup.Connection $ KeyVal消息{kind = ERROR,text =程序类型已存在:org.jsoup.Connection $ KeyVal,sources = [未知源文件],工具名称= Optional.of(D8) )} 我想知道以前...
  • 0 votes
     answers
     views

    Jsoup表单登录并登录并显示Android应用程序的数据

    我想登录网站并显示每个细节,并在用户输入时执行发布请求 . 所有这些都是在Android应用程序中完成的,通过jsoup html解析 . 这是我的android工作室代码: getbtn.setOnClickListener(new View.OnClickListener() { @Override public void onClick(View v) { ...
  • 0 votes
     answers
     views

    如何解决java.lang.IllegalArgumentException:JSOUP上的头名称不能为空

    我正在尝试使用Jsoup库从URL解析HTML 但是当我进行调试时,我发现了这个异常抛出 > 12-09 08:48:09.741 5188-5422/com.example.virusmahmoudaidi.parkbookingsystem W/System.err: java.lang.IllegalArgumentException: Header name must not ...
  • 0 votes
     answers
     views

    如何使用jsoup从html元素获取html预览结果作为字符串?

    我想从jsoup元素中获取HTML预览结果 . 假设我有jsoup元素,它具有以下html代码: 元素的HTML代码: <div class="code-container"> <div id="highlighter_245626" class="syntaxhighlighter nogutter night"&...
  • 0 votes
     answers
     views

    无法使用Android应用程序登录网站

    我正在尝试使用我在Eclipse(Android v.4.3)中编写的Android应用程序连接到我的大学网站,提供我的凭据,然后保持登录以下载我的课程安排 . 我已经搜索了几天这些论坛并尝试了许多不同的方法 . 我很容易在Java中使用HtmlUnit来完成这项任务 . 我可以访问该网站,登录,然后转到包含我需要的数据的页面 . 但是,HtmlUnit与Android应用程序不兼容,因为它使用许...
  • 0 votes
     answers
     views

    Jsoup登录废弃游戏数据

    问题是我可以使用Jsoup发布由javascript控制的登录数据吗?这是迄今为止的信息 该站点的登录URL: http://www.cybernations.net/login.asp (他们确实有一个无机器人政策,但我通过电子邮件发送给管理员,并有权自动登录下载游戏数据文件) 存储文件的URL http://www.cybernations.net/stats_downloads.asp ...
  • 0 votes
     answers
     views

    调用Jsoup.connect会崩溃Android应用程序

    我正在开发一个基于位置的应用程序,它可以检测用户的位置并根据网站上的位置提取数据 . 我能够创建一个应用程序来成功获取用户位置,我甚至可以创建一个应用程序来使用Jsoup来提取和解析HTML数据 . 现在我尝试将两者结合起来,但应用程序崩溃了 . 我从其他帖子中读到,为HTTP请求创建新线程将解决问题,但我无法理解在程序中创建它的位置并启动线程 . 我尝试在onCreate函数中创建一个线程并在L...
  • 2 votes
     answers
     views

    Android HTML Jsoup解析速度

    这是交易 . 在我的Android应用程序中,我正在使用Jsoup进行一些网络抓取 . 现在它工作正常,但它太慢了 . 我在我的代码中做的是: 通过Jsoup中的POST方法登录页面; 获取cookie; 通过重用cookie,我将浏览6页(POST和GET)并抓取它们(主要是表格和大量行 . 我的意思是很多......所以,真的很多foreach循环); 将所有必需的数据写入SQ...
  • 0 votes
     answers
     views

    使用包含多个页面的多个字母选项卡刮取网站

    我正在抓取一个网站,该网站在A-Z标签中按字母顺序列出数据,每个字母标签还包含几个页面 . 如何从中提取所有网址? public static void main(String [] args)throws Exception { String keyword = "a"; String url = "http://www.medindia.net/drug-pric...
  • 4 votes
     answers
     views

    Java JSoup错误提取URL

    我正在创建一个应用程序,它可以让我从特定网站获取值到控制台 . 该值来自 <span> 元素,我正在使用JSoup . 我的挑战与此错误有关: 获取URL时出错 这是我的Java代码: public class TestSl { public static void main(String[] args) throws IOException { Docum...
  • 2 votes
     answers
     views

    使用Jsoup从url获取数据时停止工作错误

    我是android编程的业余爱好者 . 我正在使用Jsoup从网站获取html并将其放入textview但我收到错误 . 我怎样才能解决这个问题? My code: package com.example.hashtag.asdasd; import android.os.AsyncTask; import android.support.v7.app.AppCompatActivity; im...
  • 0 votes
     answers
     views

    将html转换为文本

    我正在使用JSF . 我使用过RichFaces的'RichEditor' . 我将此编辑器中的内容存储到bean中并显示为JSF表单 . 但它在JSF表单上显示HTML标记 . 为此,我使用了JSoup HTML Parser . 但它完全将富编辑器的书面内容转换为简单文本,删除所有格式,如粗体,使用的按钮,换行符等 . 我需要显示为jSF格式的编辑器 . 请帮忙... Rich Editor的...
  • 0 votes
     answers
     views

    使用Jsoup检索sessionId cookie的问题

    我'm to write a Java program, which in part, parses 200 unique pages that require the user to log in beforehand. I'已使用Chrome的开发者控制台来确定我的特定登录URL(https://r.espn.go.com/members/v3_1/login),验证登录过程是否使用了POST...
  • 3 votes
     answers
     views

    jsoup发布Java

    我正在努力让java通过HTTPS提交POST请求 使用的代码在这里 try{ Response res = Jsoup.connect(LOGIN_URL) .data("username", "blah", "password", "blah") .method(Method.PO...
  • 2 votes
     answers
     views

    JSoup POST身份验证

    我正在尝试使用基本用户名和密码身份验证连接到站点,保留cookie并从需要登录页面上提供的cookie的站点解析数据 . 当从本地Apache Web服务器使用网站副本时,解析工作非常完美 . 这是认证给我带来麻烦 . 我正在使用Eclipse作为我的IDE,并且我使用以下代码时出现错误: Response res = Jsoup .connect("site_with_...
  • 0 votes
     answers
     views

    Jsoup使用选择元素登录

    我的Boss告诉我写一个HTML解析器,它正在获取一些表数据....好吧,我被困在这里,真的需要你的帮助:) 首先,我需要登录网站,然后导航到另一个网址(我希望它可以使用cookie)并获取数据 . Loginform获得了用户名和密码字段以及包含许多选项的选择列表,我喜欢选择第二个选项 . 我可以这样做吗? 这是我已经获得的代码: System.setProperty("javax.n...
  • 0 votes
     answers
     views

    如何使用JSoup来导航页面

    我正在开发一个Android应用程序,它解析一个html页面并使用它的元素,然后转到下一页并提取其元素 . 我之前和Selenium一起做这个工作,但是当我在Android上使用它时,它使用了太多的内存,应用程序停止响应 . 现在我被困在登录页面,我必须输入用户名和密码 . 我设法做到了,但我无法进入下一页 . 它返回相同的登录页面而不是下一页 . 我真的需要用JSoup来做这件事,因为最终代码必...
  • 0 votes
     answers
     views

    使用jsoup登录espn幻想足球联赛并刮取统计数据

    我有一个宠物项目,我正在努力与espn幻想足球 . 任何我的联盟都是私人的,它需要我登录到网站才能导航到该页面 . 比如我去的时候在浏览器上 http://games.espn.go.com/ffl/standings?leagueId=491518&seasonId=2014 我被重定向到登录页面 . 我正在尝试使用jsoup登录并从网页上删除一些数据,但我无法解决登录问题 . 无论我尝...
  • 7 votes
     answers
     views

    使用重定向Java / Jsoup登录安全网站

    我如何阅读和定位我需要在jsoup中输入登录信息的位置才能访问VPN上的网络?我对所涉及的步骤/主题的解释以及使用java的编程方法感兴趣(基本上如何使用jsoup在java中编写代码) . 注意:对于所有重定向,我很难理解在jsoup-login中发生了什么以及如何/何时/在哪里编码 . 到目前为止,这是我的工作流程: 我有一个目标页面,如下所示 [debug] status code 302 ...
  • 46 votes
     answers
     views

    jsoup发布和cookie

    我正在尝试使用jsoup登录网站,然后抓取信息,我遇到问题,我可以成功登录并从index.php创建一个文档,但我无法在网站上获取其他页面 . 我知道我需要在发布后设置一个cookie,然后在我尝试在网站上打开另一个页面时加载它 . 但是我该怎么做?以下代码允许我登录并获取index.php Document doc = Jsoup.connect("http://www.example...
  • 2 votes
     answers
     views

    JSOUP提取文本包括<br>,&nbsp;和<strong>

    我正在尝试使用JSOUP从HTML URL源中提取div标签中的文本,这是: &lt;div class=&quot;some_text&quot;&gt; &lt;strong&gt;Lorem ipsum&lt;/strong&gt; dolor sit amet, consectetur adipiscing elit, &amp;nbsp;sed do eiusmod tempor...

热门问题