首页 文章

CURL如何使用Captcha和Session登录

提问于
浏览
12
define('COOKIE', './cookie.txt');
define('MYURL', 'https://register.pandi.or.id/main');

function getUrl($url, $method='', $vars='', $open=false) {
    $agents = 'Mozilla/5.0 (X11; U; Linux i686; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.204 Safari/534.16';
    $header_array = array(
        "Via: 1.1 register.pandi.or.id",
        "Keep-Alive: timeout=15,max=100",
    );
    static $cookie = false;
    if (!$cookie) {
        $cookie = session_name() . '=' . time();
    }
    $referer = 'https://register.pandi.or.id/main';
    $ch = curl_init();
    if ($method == 'post') {
        curl_setopt($ch, CURLOPT_POST, 1);
        curl_setopt($ch, CURLOPT_POSTFIELDS, "$vars");
    }
    curl_setopt($ch, CURLOPT_HEADER, 1);
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_HTTPHEADER, $header_array);
    curl_setopt($ch, CURLOPT_USERAGENT, $agents);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 5);
    curl_setopt($ch, CURLOPT_MAXREDIRS, 10);
    curl_setopt($ch, CURLOPT_REFERER, $referer);
    curl_setopt($ch, CURLOPT_COOKIE, $cookie);
    curl_setopt($ch, CURLOPT_COOKIEJAR, COOKIE);
    curl_setopt($ch, CURLOPT_COOKIEFILE, COOKIE);
    curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
    curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 2);

    $buffer = curl_exec($ch);
    if (curl_errno($ch)) {
        echo "error " . curl_error($ch);
        die;
    }
    curl_close($ch);
    return $buffer;
}

function save_captcha($ch) {
    $agents = 'Mozilla/5.0 (X11; U; Linux i686; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.204 Safari/534.16';
    $url = "https://register.pandi.or.id/jcaptcha";
    static $cookie = false;
    if (!$cookie) {
        $cookie = session_name() . '=' . time();
    }
    $ch = curl_init();    // Initialize a CURL session.
    curl_setopt($ch, CURLOPT_URL, $url);  // Pass URL as parameter.
    curl_setopt($ch, CURLOPT_USERAGENT, $agents);
    curl_setopt($ch, CURLOPT_COOKIESESSION, true);
    curl_setopt($ch, CURLOPT_COOKIE, $cookie);
    curl_setopt($ch, CURLOPT_COOKIEJAR, COOKIE);
    curl_setopt($ch, CURLOPT_COOKIEFILE, COOKIE);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);  // Return stream contents.
    curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1); // We'll be returning this
    $data = curl_exec($ch);  // // Grab the jpg and save the contents in the
    curl_close($ch);  // close curl resource, and free up system resources.
    $captcha_tmpfile = './captcha/captcha-' . rand(1000, 10000) . '.jpg';
    $fp = fopen($tmpdir . $captcha_tmpfile, 'w');
    fwrite($fp, $data);
    fclose($fp);
    return $captcha_tmpfile;
}

if (isset($_POST['captcha'])) {
    $id = "yudohartono";
    $pw = "mypassword";
    $postfields = "navigation=authenticate&login-type=registrant&username=" . $id . "&password=" . $pw . "&captcha_response=" . $_POST['captcha'] . "press=login";
    $url = "https://register.pandi.or.id/main";
    $result = getUrl($url, 'post', $postfields);
    echo $result;
} else {

    $open = getUrl('https://register.pandi.or.id/main', '', '', true);
    $captcha = save_captcha($ch);
    $fp = fopen($tmpdir . "/cookie12.txt", 'r');
    $a = fread($fp, filesize($tmpdir . "/cookie12.txt"));
    fclose($fp);
<form action='' method='POST'>
        <img src='<?php echo $captcha ?>' />
        <input type='text' name='captcha' value=''>
        <input type='submit' value='proses'>
    </form>";
if (!is_readable('cookie.txt') && !is_writable('cookie.txt')) {
        echo "cookie fail to read";
        chmod('../pandi/', '777');
    }
}

这个cookie.txt

# Netscape HTTP Cookie File
# http://curl.haxx.se/rfc/cookie_spec.html
# This file was generated by libcurl! Edit at your own risk.

register.pandi.or.id    FALSE   /   FALSE   0   JSESSIONID  05CA8241C5B76F70F364CA244E4D1DF4

在我提交表格后才显示

HTTP/1.1 200 OK Date: Wed, 27 Apr 2011 07:38:08 GMT Server: Apache-Coyote/1.1 X-Powered-By: Servlet 2.4; Tomcat-5.0.28/JBoss-4.0.0 (build: CVSTag=JBoss_4_0_0 date=200409200418) Content-Length: 0 Via: 1.1 register.pandi.or.id Content-Type: text/plain X-Pad: avoid browser bug

如果没有错误"Captcha invalid"总是失败登录到pandi我的脚本有什么问题?
我不想破解Captcha,但我想从我的网页上显示验证码和用户输入验证码,因此用户可以自动从我的网站注册域名dotID

6 回答

  • 2

    使用无头浏览解决方案是可能的 . 即:节点上的zombie.js coffee.js ..也可以从验证码中提取“图像”,并使用图像识别“读取”图像并将其转换为文本,然后使用表格发布 .

    截至今天,“欺骗”验证码的唯一可靠方法是使用无头浏览 .

  • 0

    它发生的原因是,
    您从第一个 getURL (ie first curl_exec) 获取了验证码图像并处理了验证码但是要提交您的验证码,请求 getURL (ie again curl_exec) 这意味着再次使用新的验证码进入新页面 .

    所以你要放置旧的验证码并将其放入新的验证码中 . 我遇到了同样的问题并解决了它 .

  • 0

    使用PHP我不知道该怎么做,你必须得到验证码并找到解决它的方法 . 它有很多算法可以帮到你,但是如果你想使用java,我已经从this link攻击了源代码以获得解码验证码的代码,它对许多验证码系统都很有效 .

    因此,您可以尝试实现自己的验证码解算器,这将花费大量时间,尝试找到PHP的现有实现,或者,恕我直言,最好的选择,使用JDownloader代码库 .

  • 20

    Captcha是服务器在您点击页面时创建的动态图像 . 它会不断变化,您必须从页面中提取验证码,然后解析它,然后提交您的页面以进行登录 . 当页面被触发加载时,Captcha将不断变化!

  • 0

    是的,Andro Selva是对的 . 在第二个请求它给出了新的验证码 . 一旦用getUrl函数加载验证码,第二个加载来自save_captcha函数,所以这是2个不同的图像 .

    它必须做这样的事情:在关闭curl之前和发布之前下载验证码图像并告诉脚本等待直到你提供验证码答案 - 我将使用preg_match . 它还需要一些javascript .

    如果验证码图像是从javascript生成的,则需要使用相同的cookie或令牌执行此javascript . 在这种情况下,更简单的解决方案是用例如记录 Headers . livehttpheaders addon for mozila ffox .

  • 0

    验证码旨在区分人类和机器人(程序) . 好像你正试图用程序登录 . 验证码似乎可以完成它的工作:) .

    我没有看到合法的方式 .

相关问题