웹 캡처 및 변환 도구

제품 목록 및 세부 사항 페이지를 긁는 방법

웹 사이트에는 종종 항목 목록이 포함 된 검색 페이지가 있으며, 각 항목에는 항목에 대한 자세한 정보가 포함 된 세부 정보 페이지에 대한 링크와 함께 요약 설명이 제공됩니다.

이 구조가 자주 사용되므로 검색 페이지에서 각 항목에 대한 일부 정보와 세부 사항 페이지에서 나머지 항목을 스크랩해야하는 경우가 종종 있습니다. 이 기사는 그러한 정보를 긁는 방법에 대한 지침을 제공합니다.

먼저 스크랩하려는 제품 목록 페이지의 URL을 입력하십시오. 그런 다음 제품 목록 페이지에서 선택하려는 정보를 선택하십시오. 데이터의 모든 예제가 선택되어 있는지 확인하십시오.

그런 다음 스크랩 지침 페이지에서 스크랩 명령 추가.

알아야 할 첫 번째 사항은 Google 스크레이퍼가 브라우저와 정확히 동일한 방식으로 작동하므로 쿠키 보안 알림 또는 페이지를 클릭하지 못하게하는 다른 인라인 팝업이있는 경우 스크래퍼가 팝업을 닫도록 지시해야합니다. 나머지 긁힘은 가능합니다. 이 팝업의 대부분은 한 번만 클릭하면되므로 GrabzIt도 같은 작업을 수행 할 수 있습니다. 이렇게하려면 요소를 클릭하십시오 작업을 수행하고 팝업을 닫는 데 필요한 HTML 요소를 클릭하십시오. 그런 다음 한 번만 옵션을 클릭 한 다음 Save 그리고 다음.

다음을 선택하십시오 데이터를 추출 작업을 선택한 다음 추출 할 데이터를 선택하십시오. 따라서 검색 결과 목록에서 항목 제목을 선택하려면 해당 목록의 모든 제목이 선택되어 있는지 확인하십시오.

마법사가 자동으로 데이터 세트를 식별하려고하며 자동보다 원하는 정보를 더 많이 선택할 수 있습니다. 이 경우 다시 선택하지 않으려는 항목을 다시 클릭하면 더 이상 포함되지 않습니다. 이것은 우리의 웹 스크레이퍼가 추출해야 할 것을 가르쳐줍니다.

이제 추출하려는 데이터 항목의 속성을 선택하십시오. "텍스트"와 같은 다음을 클릭하십시오. 다음 화면에서 제목을 지정하십시오. 여기서 모든 데이터가 기본 템플릿을 사용하기를 원합니다. 특수 템플릿에 없을 때 데이터를 추출하기를 원하기 때문입니다.

제품 검색 페이지에서 추출하려는 모든 항목 데이터를 선택한 후 제품 세부 사항 페이지에서 자세한 정보를 보려면 모든 링크를 선택하십시오. 예를 들어 이미지 일 수 있습니다. 그런 다음 요소를 클릭하십시오 동작. 템플리트를 "세부 사항"으로 설정 한 후 5 초 동안 지연시킨 후 다음을 클릭하십시오. 새 페이지에서 데이터를 추출 할 것인지 묻는 메시지가 표시되면 예를 선택하십시오. 이제 이전과 같이 추출하려는 데이터를 선택하십시오. 그러나 이번에는 "세부 사항"템플리트에서 실행해야 함을 지정하십시오.

다른 스크랩 지침을 추가하고 메인 페이지로 돌아갑니다. 이번에는 페이지 매김 링크에서 다음 버튼을 선택하십시오. 때 동작 클릭 옵션 상자가 나타나면 다음 페이지 버튼 선택권. 이렇게하면 스크레이퍼는이 버튼이 실제로 페이지 매김 버튼이며 모든 결과에서 페이지를 매길 것임을 알 수 있습니다. 이 스크랩 지침이 마지막인지 확인하십시오. 마지막 긁기 명령이 아닌 경우 끝까지 끌 수 있습니다.

그런 다음 스케줄 탭으로 이동하여 작성을 클릭하여 스크랩을 시작하십시오. 스크랩 관리 페이지에서 행 아이콘을 클릭 한 다음 스크랩의 뷰어 아이콘을 클릭하여 스크랩 진행 상황을 실시간으로 볼 수 있습니다.