我正在尝试使用jsoup登录网站,然后抓取信息,我遇到问题,我可以成功登录并从index.php创建一个文档,但我无法在网站上获取其他页面 . 我知道我需要在发布后设置一个cookie,然后在我尝试在网站上打开另一个页面时加载它 . 但是我该怎么做?以下代码允许我登录并获取index.php
Document doc = Jsoup.connect("http://www.example.com/login.php")
.data("username", "myUsername",
"password", "myPassword")
.post();
我知道我可以使用apache httpclient来做到这一点,但我不想这样做 .
4 回答
当您登录该站点时,可能会设置一个授权会话cookie,需要在后续请求中发送以维护会话 .
您可以像这样获取cookie:
然后在下一个请求发送它,如:
代码是:
我遇到了困难,直到我改为:
现在它完美无缺 .
这是你可以尝试的......
现在保存所有cookie并向您想要的其他页面发出请求 .
向另一个页面发出请求 .
询问是否需要进一步帮助 .