웹 캡처 및 변환 도구
GrabzIt의 온라인 커뮤니티

사용자 에이전트가 'grabzit'으로 설정되지 않았습니까?

GrabzIt의 웹 스크레이퍼 도구와 관련된 질문을 하십시오. 웹 스크레이퍼 및 API를 사용하여 웹 페이지, 이미지 또는 PDF 문서에서 데이터를 추출하는 방법 등.

안녕,

Grabzit을 리퍼러 또는 사용자 에이전트로 식별해야 합니다. 하지만 로그에 리퍼러가 표시되지 않고 useragent가 일반 브라우저로 설정되어 있고 'grabzit'이 없습니다. 

그래서 나는 php $_SERVER의 출력으로 PDF를 만들었습니다. 

array (
'USER' => 'dk',
'HOME' => '***',
'HTTP_ACCEPT_LANGUAGE' => '*,en;q=0.5',
'HTTP_ACCEPT_ENCODING' => 'gzip, deflate',
'HTTP_ACCEPT' => 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
'HTTP_USER_AGENT' => 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4104.0 Safari/537.36',
'HTTP_UPGRADE_INSECURE_REQUESTS' => '1',
'HTTP_SEC_FETCH_USER' => '?1',
'HTTP_SEC_FETCH_SITE' => 'same-origin',
'HTTP_SEC_FETCH_MODE' => 'navigate',
'HTTP_CONNECTION' => 'keep-alive',
'HTTP_HOST' => '*****',
'SCRIPT_FILENAME' => '******',
'REDIRECT_STATUS' => '200',
'SERVER_NAME' => '****',
'SERVER_PORT' => '443',
'SERVER_ADDR' => '****',
'REMOTE_PORT' => '52588',
'REMOTE_ADDR' => '195.206.181.230',
'SERVER_SOFTWARE' => 'nginx/1.17.9',
'GATEWAY_INTERFACE' => 'CGI/1.1',
'HTTPS' => 'on',
'REQUEST_SCHEME' => 'https',
'SERVER_PROTOCOL' => 'HTTP/1.1',
'DOCUMENT_ROOT' => '****',
'DOCUMENT_URI' => '/****.php',
'REQUEST_URI' => '/****.php',
'SCRIPT_NAME' => '/****.php',
'CONTENT_LENGTH' => '',
'CONTENT_TYPE' => '',
'REQUEST_METHOD' => 'GET',
'QUERY_STRING' => '****',
'PHP_ADMIN_VALUE' => '****',
'DOMAINNAME' => '****',
'FCGI_ROLE' => 'RESPONDER',
'PHP_SELF' => '/****.php',
'REQUEST_TIME_FLOAT' => 1587134704.587993,
'REQUEST_TIME' => 1587134704,
)

내 PHP 코드는 다음과 같습니다

$oGrabz = new GrabzItClient($gr['apikey'],$gr['apisecret']);
$oGrabz->URLToPDF($url);
$oGrabz->SaveTo('test.pdf');

다른 일을 해야 하나요?

사전에 감사합니다, 

리디아
라인스톤66

17년 2020월 XNUMX일 Royston이 질문함

예, Grabz그것은 일반 브라우저처럼 보입니다. 차단되는 것을 방지하기 위한 것입니다. 요청을 감지하려면 항상 URL 매개변수를 통과하면 됩니다. https://www.example.com/?grabzit=true처럼요

22년 2020월 XNUMX일 GrabzIt 지원팀에서 답변함