웹 캡처 및 변환 도구

데이터 추출 및 변환 intoa 데이터 세트

가장 일반적인 요구 사항 중 하나는 웹 사이트에서 데이터를 추출하여 사용하는 것입니다 into 추가 처리를 위해 내보낼 수있는 테이블 구조. 그러나 데이터 셋이란 무엇이며 어떻게 사용됩니까? GrabzIt의 웹 스크레이퍼?

데이터 세트 예 : 가격표

아래는 데이터 세트에 포함 된 테이블 데이터입니다 가격표테이블은 세 개의 열로 구성됩니다. 아이템 라벨, 항목 설명품목 가격.

아이템 라벨 항목 설명 품목 가격
카메라 디지털 사진을 찍습니다 $ 99.00

이 데이터 세트를 만들려면 다음 스크랩 지침을 사용해야합니다.

Data.save('Camera', 'price list', 'item label');
Data.save('Takes digital photos', 'price list', 'item description');
Data.save('$99.00', 'price list', 'item price');

이것은 Data.save 추가하는 방법 데이터 가치 특정 데이터 세트칼럼. 때마다 Data.save 새 행이 해당 열에 추가 된 동일한 데이터 세트 및 열 이름 매개 변수로 메소드가 호출됩니다. 그러나 정적 값을 사용하여 데이터 집합을 만들 때 위의 스크랩 지침은 그다지 유용하지 않습니다. 아래 코드는 웹 페이지의 HTML을 보여줍니다. 그런 다음 스크랩 지침을 작성하여 페이지에서 데이터를 동적으로 추출합니다. save it intoa 데이터 세트.

<html>
    <body>
        <span id="spnLabel">Nikon 1055</span>
        <span id="spnDescription">Great little camera, creates clear sharp images.</span>
        <span id="spnPrice">$99.99</span>
    </body>
</html>

우리는 이제 Page.getTagValue span 태그에서 값을 추출하는 방법입니다.

Data.save(Page.getTagValue({"id":{"equals":"spnLabel"}}), 'price list', 'item label');
Data.save(Page.getTagValue({"id":{"equals":"spnDescription"}}), 'price list', 'item description');
Data.save(Page.getTagValue({"id":{"equals":"spnPrice"}}), 'price list', 'item price');

보시다시피 Page.getTagValue 메소드는 텍스트를 추출해야하는 HTML 요소를 고유하게 식별하는 필터를 사용합니다. 이 경우 필터는 id HTML 속성이 같아야 함을 지정합니다. spnLabel, spnDescription or spnPrice 각기. 를 클릭하여 쉽게 필터를 생성 할 수 있습니다 필터 버튼 필터를 간단하게 구성 할 수있는 마법사가 표시됩니다.

여기에 표시된대로 데이터 세트를 구성한 후 데이터 세트를 내보내는 방법을 결정할 수 있습니다. 내보내기 옵션 탭.