PHP CURL检索部分页面-Java 学习之路

我有以下CURL代码：

$ch = curl_init(); 
curl_setopt($ch, CURLOPT_URL, $url);
if ($postParameters != '') {
    curl_setopt($ch, CURLOPT_POST, TRUE);
    curl_setopt($ch, CURLOPT_POSTFIELDS, $postParameters);
}
curl_setopt($ch, CURLOPT_COOKIEFILE, __DIR__.'cookie.txt');
curl_setopt($ch, CURLOPT_COOKIEJAR, __DIR__.'/cookie.txt');
curl_setopt($ch, CURLOPT_ENCODING, '');
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE); 
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($ch, CURLOPT_TIMEOUT, 60); 
curl_setopt($ch, CURLOPT_REFERER, $referer);
$pageResponse = curl_exec($ch); 
curl_close($ch);

当我尝试获取页面时，大多数时候我会得到我要求的整个页面 . 但是，我不时会得到页面的一部分，例如：

DOCTYPE html PUBLIC“ - // W3C // DTD XHTML 1.0 Transitional // EN”“http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd”> html xmlns =“http：/ /www.w3.org/1999/xhtml“dir =”ltr“lang =”en“> head> meta http-equiv =”Content-Type“content =”text / html; charset = windows-1251“/> meta name =“generator”content =“

我删除了标签前面的“<”，这样HTML代码就会显示在堆栈交换中 . 有谁知道为什么突然停止接收？我注意到数据经常在打开双引号后突然停止（即content =“或username =”） . 不确定100％是否总是以这种方式发生 . 无论如何，这可能是编码问题吗？还有其他想法吗？

任何帮助，将不胜感激 .

1 回答

您可以尝试添加一些调试 .

添加以下选项：

curl_setopt($ch, CURLOPT_VERBOSE, true);
curl_setopt($ch, CURLOPT_STDERR,$f = fopen(__DIR__ . "/error.log", "w+"));

而这些在curl_close（）之前：

if($errno = curl_errno($ch)) {
    $error_message = curl_strerror($errno);
    echo "cURL error ({$errno}):\n {$error_message}";
}

如果这不起作用，请尝试增加超时并查看它是否消失：

curl_setopt($ch, CURLOPT_TIMEOUT, 300);

如果超时增加有效，那么找出原因 .

回复于 2024-05-09T07:32:45+08:00

PHP CURL检索部分页面

1 回答

相关问题