가장 일반적인 요구 사항 중 하나는 웹 사이트에서 데이터를 추출하여 사용하는 것입니다 into 추가 처리를 위해 내보낼 수있는 테이블 구조. 그러나 데이터 셋이란 무엇이며 어떻게 사용됩니까? GrabzIt의 웹 스크레이퍼?
아래는 데이터 세트에 포함 된 테이블 데이터입니다 가격표테이블은 세 개의 열로 구성됩니다. 아이템 라벨, 항목 설명 및 품목 가격.
아이템 라벨 | 항목 설명 | 품목 가격 |
---|---|---|
카메라 | 디지털 사진을 찍습니다 | $99.00 |
이 데이터 세트를 만들려면 다음 스크랩 지침을 사용해야합니다.
Data.save('Camera', 'price list', 'item label'); Data.save('Takes digital photos', 'price list', 'item description'); Data.save('$99.00', 'price list', 'item price');
이것은 Data.save
추가하는 방법 데이터 가치 특정 데이터 세트 및 칼럼. 때마다 Data.save
새 행이 해당 열에 추가 된 동일한 데이터 세트 및 열 이름 매개 변수로 메소드가 호출됩니다. 그러나 정적 값을 사용하여 데이터 집합을 만들 때 위의 스크랩 지침은 그다지 유용하지 않습니다. 아래 코드는 웹 페이지의 HTML을 보여줍니다. 그런 다음 스크랩 지침을 작성하여 페이지에서 데이터를 동적으로 추출합니다. save it intoa 데이터 세트.
<html> <body> <span id="spnLabel">Nikon 1055</span> <span id="spnDescription">Great little camera, creates clear sharp images.</span> <span id="spnPrice">$99.99</span> </body> </html>
우리는 이제 Page.getTagValue
span 태그에서 값을 추출하는 방법입니다.
Data.save(Page.getTagValue({"id":{"equals":"spnLabel"}}), 'price list', 'item label'); Data.save(Page.getTagValue({"id":{"equals":"spnDescription"}}), 'price list', 'item description'); Data.save(Page.getTagValue({"id":{"equals":"spnPrice"}}), 'price list', 'item price');
보시다시피 Page.getTagValue
메소드는 텍스트를 추출해야하는 HTML 요소를 고유하게 식별하는 필터를 사용합니다. 이 경우 필터는 id HTML 속성이 같아야 함을 지정합니다. spnLabel, spnDescription or spnPrice 각기. 를 클릭하여 쉽게 필터를 생성 할 수 있습니다 필터를 간단하게 구성 할 수있는 마법사가 표시됩니다.
여기에 표시된대로 데이터 세트를 구성한 후 데이터 세트를 내보내는 방법을 결정할 수 있습니다. 내보내기 옵션 탭.