웹 캡처 및 변환 도구

웹 스크레이퍼 설명서

웹 스크레이퍼를 통해 사용할 수있는 특수 스크랩 명령 방법에 대한 개요입니다.

Criteria.apply (배열)

제공된 배열에서이 기준의 이전 작업으로 제거 된 항목과 동일한 위치에있는 항목을 제거합니다.

  • array-필수, 변경 사항을 적용 할 배열.

기준 오름차순 (값)

값을 오름차순으로 반환합니다.

  • 값-필수, 오름차순으로 정렬하려는 배열을 전달하십시오.

기준. (바늘, 가치)

지정된 값을 포함하는 needles 배열의 항목 만 반환합니다.

  • needles-필수, 필터링 할 배열.
  • 값-필수, 값 항목이 포함되어야합니다.

Criteria.create (배열)

새 어레이에서 작업을 수행 할 준비가 된 새 기준을 만듭니다.

  • array-필수, 변경 사항을 적용 할 열 배열.

  • 기준 내림차순 (값)

    내림차순으로 값을 반환합니다.

    • 값-필수, 정렬하려는 배열을 내림차순으로 전달합니다.

    Criteria.equals (니들, 값)

    needles 배열에서 지정된 값과 동일한 항목 만 반환합니다.

    • needles-필수, 필터링 할 배열.
    • 값-필수, 값 항목이 같아야합니다.

    기준 추출 (배열, 패턴)

    지정된 패턴에 따라 일치하는 항목이있는 배열의 모든 항목을 반환합니다.

    • array-필수 항목이며 일치하는 항목을자를 배열입니다.
    • pattern-필수, 패턴은 반환 된 텍스트의 원하는 부분을 자르는 방법을 정의합니다. 다듬을 값은 패턴에서 {{VALUE}}로 표시됩니다.
      예를 들어 '내 나이는 33'입니다. '나이는 {{VALUE}}입니다.' 사용됩니다.

    기준.보다 큼 (바늘, 가치)

    needles 배열에서 지정된 값보다 큰 항목 만 반환합니다.

    • needles-필수, 필터링 할 배열.
    • 값-필수, 값 항목은보다 커야합니다.

    기준 유지 (바늘, 건초 더미)

    haystack 배열에서 찾은 일치 항목을 유지 한 후 needles 배열을 반환합니다.

    • needles-필수, 필터링 할 배열.
    • 건초 더미-바늘을 유지하는 데 사용할 배열.

    Criteria.lessThan (바늘, 가치)

    needles 배열에서 지정된 값보다 작은 항목 만 반환합니다.

    • needles-필수, 필터링 할 배열.
    • 값-필수, 값 항목은보다 작아야합니다.

    기준. 한도 (값, 한도)

    n이 한계 변수 인 첫 n 개의 값을 반환합니다.

    • 값-필수, 제한하려는 배열을 전달하십시오.
    • limit-필수, 배열에서 반환하려는 값의 수

    Criteria.notEquals (needles, value)

    needles 배열에서 지정된 값과 같지 않은 항목 만 반환합니다.

    • needles-필수, 필터링 할 배열.
    • 값-필수, 값 항목이 같지 않아야합니다.

    기준 제거 (바늘, 건초 더미)

    haystack 배열에서 찾은 일치 항목을 제거한 후 needles 배열을 반환합니다.

    • needles-필수, 필터링 할 배열.
    • haystack-바늘을 제거하는 데 사용할 배열입니다.

    Criteria.repeat (배열)

    가장 긴 열의 길이와 일치 할 때까지 배열의 항목을 반복하십시오.

    • array-필수, 반복 할 배열.

    기준. 고유 (바늘)

    needles 배열에서 고유 한 값만 반환합니다.

    • needles-필수, 모든 중복 값을 제거하려는 배열을 전달하십시오.

    Data.countFilesDownloaded ()

    다운로드 한 총 파일 수를 계산합니다.


    Data.log (메시지)

    스크랩 로그에 메시지를 씁니다.

    • message-필수, 로그에 쓸 메시지

    Data.pad (padValue, dataSet)

    특정 데이터 집합의 모든 열이 같은 수의 셀을 가질 때까지 빈 셀을 열 끝에 추가하여 데이터 집합에있는 모든 열을 채 웁니다.

    • padValue- 선택, 셀을 채울 값입니다. 아무것도 지정하지 않으면 빈 값이 사용됩니다.
    • dataSet- 선택데이터 세트를 채 웁니다.

    Data.readColumn (데이터 세트, 열)

    지정된 데이터 세트에서 지정된 열을 읽습니다.

    • dataSet- 선택값을 읽을 데이터 세트.
    • 열- 선택값을 읽을 데이터 세트의 열입니다.

    데이터.save(값s, dataSet, 열)

    Save지정된 데이터 세트 및 열에 대한 임의의 값.

    • value-필수, 원하는 값 또는 값의 배열을 전달 save.
    • dataSet- 선택, 데이터 세트 save 가치 into.
    • 열- 선택, 데이터 세트의 열을 save 가치 into.

    데이터.saveDOCX 스크린 샷 (htmlOrUrls, 옵션, dataSet, 열)

    HTML, URL 또는 URL의 DOCX 스크린 샷을 만들고 선택적으로 지정된 데이터 세트 및 열에 파일에 대한 링크를 넣습니다.

    • url-필수, DOCX 스크린 샷을 만들려는 url 또는 url 배열을 전달하십시오.
    • 옵션- 선택, 스크린 샷 옵션.
    • dataSet- 선택, 데이터 세트 save DOCX 스크린 샷 링크 into.
    • 열- 선택, 데이터 세트의 열을 save DOCX 스크린 샷 링크 into.

    데이터.save이미지 스크린 샷 (htmlOrUrls, 옵션, dataSet, 열)

    HTML, URL 또는 URL의 이미지 스크린 샷을 만들고 선택적으로 지정된 데이터 세트 및 열에 파일에 대한 링크를 넣습니다.

    • url-필수, 이미지 스크린 샷을 만들려는 url 또는 url 배열을 전달하십시오.
    • 옵션- 선택, 스크린 샷 옵션.
    • dataSet- 선택, 데이터 세트 save 이미지 스크린 샷 링크 into.
    • 열- 선택, 데이터 세트의 열을 save 이미지 스크린 샷 링크 into.

    데이터.savePDF 스크린 샷 (htmlOrUrls, 옵션, dataSet, 열)

    HTML, URL 또는 URL의 PDF 스크린 샷을 작성하고 선택적으로 지정된 데이터 세트 및 열에 파일에 대한 링크를 넣습니다.

    • url-필수, PDF 스크린 샷을 만들려는 url 또는 url 배열을 전달하십시오.
    • 옵션- 선택, 스크린 샷 옵션.
    • dataSet- 선택, 데이터 세트 save PDF 스크린 샷 링크 into.
    • 열- 선택, 데이터 세트의 열을 save PDF 스크린 샷 링크 into.

    데이터.save표 스크린 샷 (htmlOrUrls, 옵션, dataSet, 열)

    HTML, URL 또는 URL의 테이블 스크린 샷을 작성하고 선택적으로 지정된 데이터 세트 및 열에 파일에 대한 링크를 넣습니다.

    • url-필수, 표 스크린 샷을 만들려는 url 또는 url 배열을 전달하십시오.
    • 옵션- 선택, 스크린 샷 옵션.
    • dataSet- 선택, 데이터 세트 save 테이블 스크린 샷 링크 into.
    • 열- 선택, 데이터 세트의 열을 save 테이블 스크린 샷 링크 into.

    데이터.save파일 (urls, 파일 이름, dataSet, 열)

    Save파일 또는 URL을 파일로 지정하고 선택적으로 지정된 데이터 세트 및 열에 파일에 대한 링크를 넣습니다.

    • url-필수, 설정하려는 URL 또는 URL 배열을 전달하십시오. intoa 파일.
    • 파일 이름 - 선택, 생성 된 파일 이름 대신 사용하려는 파일 이름을 전달하십시오.
    • dataSet-옵션, 데이터 세트 save 파일 링크 into.
    • 열- 선택, 데이터 세트의 열을 save 파일 링크 into.

    데이터.saveToFile (데이터, 파일 이름, dataSet, 열)

    Save데이터 또는 데이터 항목을 파일로 지정하고 선택적으로 지정된 데이터 세트 및 열에 파일에 대한 링크를 넣습니다.

    • 데이터-필수, 원하는 데이터 또는 데이터 배열을 전달 save 파일에.
    • 파일 이름 - 선택, 생성 된 파일 이름 대신 사용하려는 파일 이름을 전달하십시오.
    • dataSet-옵션, 데이터 세트 save 파일 링크 into.
    • 열- 선택, 데이터 세트의 열을 save 파일 링크 into.

    데이터.save고유 (값s, dataSet, 열)

    Save지정된 데이터 세트 및 열에 대한 고유 한 값. 동일한 데이터 세트 및 열의 중복 값은 무시됩니다.

    • value-필수, 원하는 값 또는 값의 배열을 전달 save.
    • dataSet- 선택, 데이터 세트 save 가치 into.
    • 열- 선택, 데이터 세트의 열을 save 가치 into.

    데이터.saveUniqueFile (URLs, 파일 이름, dataSet, 열)

    Save파일 또는 URL을 파일로 지정하고 선택적으로 지정된 데이터 세트 및 열에 파일에 대한 링크를 넣습니다. 이 방법은 save 지정된 데이터 세트 및 열에 대한 고유 값 또는 전체 스크랩에 대한 데이터 세트 및 열 고유 URL이없는 경우

    • url-필수, 설정하려는 URL 또는 URL 배열을 전달하십시오. intoa 파일.
    • 파일 이름 - 선택, 생성 된 파일 이름 대신 사용하려는 파일 이름을 전달하십시오.
    • dataSet- 선택, 데이터 세트 save 파일 링크 into.
    • 열- 선택, 데이터 세트의 열을 save 파일 링크 into.

    데이터.saveVideoAnimation (videoUrls, 옵션, dataSet, 열)

    온라인 비디오 또는 비디오 변환 into 애니메이션 GIF이며, 선택적으로 지정된 데이터 세트 및 열에 파일에 대한 링크를 넣습니다.

    • videoUrl-필수, 변환하려는 모든 비디오 URL 또는 URL 배열을 전달 into 애니메이션 GIF.
    • 옵션- 선택애니메이션 옵션.
    • dataSet- 선택, 데이터 세트 save 애니메이션 링크 into.
    • 열- 선택, 데이터 세트의 열을 save 애니메이션 링크 into.

    Global.get (이름)

    가져옵니다 saved 변수 값.

    • name-필수, 반환 할 변수의 이름

    Global.set (이름, 값s, 지속)

    Save스크랩 된 페이지 사이의 값.

    • name-필수, 변수 이름 save.
    • value-필수, 변수 값 save.
    • persist-선택 사항. true 인 경우 변수는 스크랩 사이에 유지됩니다.

    Navigation.addTemplate (urls, 템플릿)

    지정된 템플리트에 속하는 URL을 정의하십시오. 이를 통해 특정 URL에서만 스크랩 명령을 실행할 수 있습니다.

    • url-필수, 템플릿을 정의하려는 url 또는 url 배열을 전달하십시오.
    • 템플릿-필수.

    Navigation.clearCookies ()

    현재 스크랩에 대한 모든 쿠키를 제거하십시오.


    탐색. 탐색 (필터, 템플릿)

    하나 이상의 HTML 요소를 클릭하십시오.

    • filter-필요한 HTML 요소를 식별하는 데 사용되는 필터입니다.
    • template-선택한 HTML 요소를 탐색 할 때 지정할 템플리트입니다.

    Navigation.goTo (url)

    지정된 URL로 즉시 이동하십시오.

    • url-필수이며 탐색 할 URL입니다.

    Navigation.hover (필터)

    하나 이상의 HTML 요소 위로 마우스를 가져갑니다.

    • filter-필요한 HTML 요소를 식별하는 데 사용되는 필터입니다.

    Navigation.isTemplate (템플릿)

    현재 페이지가 지정된 템플릿에 속하는 경우 true를 반환합니다.

    • template-필수, 페이지가 속하는지 확인하는 템플릿

    Navigation.paginate (필터, 초)

    지정된 요소를 페이지 매김.

    • filter-필요한 HTML 요소를 식별하는 데 사용되는 필터입니다.
    • 초-필수, 페이지가 매겨진 결과 사이의 시간 (초)입니다.

    탐색. 제거 (필터)

    하나 이상의 HTML 요소를 삭제하십시오.

    • filter-삭제할 HTML 요소를 식별하는 데 사용되는 필터입니다.

    Navigation.scroll (필터)

    선택한 요소 또는 전체 웹 페이지를 스크롤하십시오.

    • filter-선택 사항. 전체 웹 페이지가 제공되지 않은 경우 스크롤 할 요소를 식별하는 데 사용되는 필터로, 전체 웹 페이지가 스크롤됩니다.

    Navigation.select (값s필터)

    선택 요소에서 하나 이상의 유효한 값을 선택하십시오.

    • value-필수, 선택할 하나 이상의 값.
    • filter-필요한 선택 요소를 식별하는 데 사용되는 필터입니다.

    Navigation.stopScraping (중단)

    긁는 것을 즉시 중지하십시오.

    • 중단-선택 사항입니다. true 인 경우 더 이상 처리를 중지하고 결과를 내보내거나 전송하지 않습니다.

    Navigation.type (텍스트s필터)

    텍스트를 입력하십시오 intoa 요소.

    • text-필수, 입력 할 하나 이상의 텍스트 항목.
    • 필터-필수, 입력 할 요소를 식별하는 데 사용되는 필터 into.

    Navigation.wait (초)

    계속하기 전에 몇 초 동안 기다리십시오. 이 클릭, 선택 및 입력 명령을 사용할 때 가장 유용합니다.

    • 초-필수, 대기 시간 (초)

    Page.contains (찾기, 속성, 필터)

    Page에 찾을 텍스트가 포함되어 있으면 true를 반환합니다.

    • 찾기-필요한 텍스트를 찾습니다.
    • attribute-검색 할 속성입니다 (선택 사항).
    • filter-검색 할 요소를 식별하는 데 사용되는 필터입니다 (선택 사항).

    Page.exists (필터)

    Page에 검색 필터와 일치하는 요소가 포함되어 있으면 true를 반환합니다.

    • 필터-필수, 검색 할 요소를 식별하는 데 사용되는 필터.

    Page.getAuthor ()

    페이지 작성자가 지정된 경우이를 가져옵니다.


    Page.getDescription ()

    지정된 경우 페이지 설명을 가져옵니다.


    Page.getFavIconUrl ()

    페이지의 FavIcon URL을 가져옵니다.


    Page.getHtml ()

    원시 페이지 HTML을 가져옵니다.


    Page.getKeywords ()

    스크랩되는 페이지의 키워드를 가져옵니다.


    Page.getLastModified ()

    페이지 메타 데이터 또는 응답 헤더에서 웹 페이지가 마지막으로 수정 된 시간을 가져옵니다.


    Page.getPageNumber ()

    스크랩중인 현재 URL의 페이지 번호를 가져옵니다.


    Page.getPreviousUrl (index)

    이전 URL을 가져옵니다. -1는 마지막 URL을 나타내고 낮은 숫자는 이전 URL을 나타냅니다.

    • index-선택 사항, 반환 할 이전 페이지의 인덱스 기본값은 -1입니다.

    Page.getTagAttribute (속성, 필터)

    일치하는 속성 값을 반환합니다.

    • attribute-필수, 검색 할 속성
    • filter-검색 할 요소를 식별하는 데 사용되는 필터입니다 (선택 사항).

    Page.getTagAttributes (속성, 필터, linkedTo)

    일치하는 CSS 값을 반환합니다.

    • attribute-검색 할 CSS 속성입니다.
    • filter-검색 할 요소를 식별하는 데 사용되는 필터입니다 (선택 사항).
    • linkedTo-옵션으로,이 값을 연결해야하는 열에 의해 상대 값이 함께 유지됩니다.

    Page.getTagCSSAttribute (속성, 필터)

    일치하는 CSS 값을 반환합니다.

    • attribute-검색 할 CSS 속성입니다.
    • filter-검색 할 요소를 식별하는 데 사용되는 필터입니다 (선택 사항).

    Page.getTagCSSAttributes (속성, 필터, linkedTo)

    일치하는 속성 값을 반환합니다.

    • attribute-필수, 검색 할 속성
    • filter-검색 할 요소를 식별하는 데 사용되는 필터입니다 (선택 사항).
    • linkedTo-옵션으로,이 값을 연결해야하는 열에 의해 상대 값이 함께 유지됩니다.

    Page.getTagValue (필터)

    일치하는 요소 값을 반환합니다.

    • filter-검색 할 요소를 식별하는 데 사용되는 필터입니다 (선택 사항).

    Page.getTagValues ​​(필터, 링크 대상)

    일치하는 요소 값을 반환합니다.

    • filter-검색 할 요소를 식별하는 데 사용되는 필터입니다 (선택 사항).
    • linkedTo-옵션으로,이 값을 연결해야하는 열에 의해 상대 값이 함께 유지됩니다.

    Page.getText ()

    페이지에서 보이는 텍스트를 가져옵니다.


    Page.getTitle ()

    페이지 제목을 가져옵니다.


    Page.getUrl ()

    페이지의 URL을 가져옵니다.


    Page.getValueXPath (xpath)

    제공된 XPATH와 일치하는 값을 반환합니다.

    • xpath-요소 값 또는 속성과 일치하는 XPATH입니다.

    Page.getValuesXPath (xpath)

    제공된 XPATH와 일치하는 값을 반환합니다.

    • xpath-요소 값 또는 속성과 일치하는 XPATH입니다.

    Page.valid ()

    현재 스크랩중인 URL이 유효한 웹 페이지 인 경우 true를 리턴합니다.


    Utility.Array.clean (값s)

    값 배열에서 null이 아닌 값을 모두 반환합니다.

    • 값-필수, 정리할 모든 값 배열을 전달하십시오.

    Utility.Array.에 포함 (값s)

    바늘이 건초 더미 배열에 있으면 true를 반환합니다.

    • 바늘-필수, 찾을 값 또는 값의 배열을 전달하십시오.
    • haystack-바늘을 검색하기위한 배열입니다.

    Utility.Array.merge (array1, array2)

    두 개의 배열을 병합 int빈 값 또는 널값을 두 번째 배열의 값으로 바꾸는 것. 두 배열의 크기가 같아야합니다.

    • array1-필수, 병합 할 값의 배열을 전달합니다.
    • array2-필수, 병합 할 값의 배열을 전달합니다.

    Utility.Array.unique (값s)

    값 배열에서 고유 한 값을 반환합니다.

    • 값-필수, 고유하도록 모든 값 배열을 전달하십시오.

    Utility.Text.extractAddress (텍스트)

    지정된 텍스트 매개 변수 내에서 첫 번째 이메일 주소를 추출합니다.

    • text-이메일 주소를 추출 할 텍스트입니다.

    Utility.Text.extractAddresses (텍스트)

    지정된 텍스트 매개 변수 내에서 모든 이메일 주소를 추출합니다.

    • text-필수, 모든 이메일 주소를 추출 할 텍스트입니다.

    Utility.Text.extractLocation (텍스트, 언어)

    지정된 텍스트 매개 변수 내에서 첫 번째 위치를 자동으로 추출합니다.

    • text-필수, 위치를 추출 할 텍스트
    • language-선택 사항이며 두 글자 ISO 639-1 형식으로 추출 할 텍스트 언어입니다. 기본값은 'en'입니다. 텍스트 언어를 자동으로 감지하려면 '자동'을 사용하십시오.

    Utility.Text.extractLocations (텍스트, 언어)

    지정된 텍스트 매개 변수 내에서 위치를 자동으로 추출합니다.

    • text-필수, 위치를 추출 할 텍스트
    • language-선택 사항이며 두 글자 ISO 639-1 형식으로 추출 할 텍스트 언어입니다. 기본값은 'en'입니다. 텍스트 언어를 자동으로 감지하려면 '자동'을 사용하십시오.

    Utility.Text.extractLanguageName (텍스트)

    텍스트 매개 변수 내에서 지정된 언어를 자동으로 추출합니다.

    • text-필수이며 언어를 추출 할 텍스트입니다.

    Utility.Text.extractLanguageCode (텍스트)

    텍스트 매개 변수 내에서 지정된 언어를 자동으로 추출합니다.

    • text-필수이며 언어를 추출 할 텍스트입니다.

    Utility.Text.extractName (텍스트, 언어)

    지정된 텍스트 매개 변수에서 이름을 자동으로 추출합니다.

    • text-필수이며 이름을 추출 할 텍스트입니다.
    • language-선택 사항이며 두 글자 ISO 639-1 형식으로 추출 할 텍스트 언어입니다. 기본값은 'en'입니다. 텍스트 언어를 자동으로 감지하려면 '자동'을 사용하십시오.

    Utility.Text.extractNames (텍스트, 언어)

    지정된 텍스트 매개 변수 내에서 이름을 자동으로 추출합니다.

    • text-필수이며 이름을 추출 할 텍스트입니다.
    • language-선택 사항이며 두 글자 ISO 639-1 형식으로 추출 할 텍스트 언어입니다. 기본값은 'en'입니다. 텍스트 언어를 자동으로 감지하려면 '자동'을 사용하십시오.

    Utility.Text.extractOrganization (텍스트, 언어)

    지정된 텍스트 매개 변수 내에서 첫 번째 조직을 자동으로 추출합니다.

    • text-필수, 조직을 추출 할 텍스트
    • language-선택 사항이며 두 글자 ISO 639-1 형식으로 추출 할 텍스트 언어입니다. 기본값은 'en'입니다. 텍스트 언어를 자동으로 감지하려면 '자동'을 사용하십시오.

    Utility.Text.extractOrganizations (텍스트, 언어)

    지정된 텍스트 매개 변수 내에서 조직을 자동으로 추출합니다.

    • text-필수이며 조직을 추출 할 텍스트입니다.
    • language-선택 사항이며 두 글자 ISO 639-1 형식으로 추출 할 텍스트 언어입니다. 기본값은 'en'입니다. 텍스트 언어를 자동으로 감지하려면 '자동'을 사용하십시오.

    Utility.Text.extractSentiment (텍스트)

    지정된 텍스트 매개 변수 내에서 감정을 자동으로 추출합니다.

    • text-필수, 감정을 추출 할 텍스트입니다.

    Utility.Image.extractText (urls언어)

    광학 이미지 인식을 사용하여 지정된 이미지에서 텍스트를 추출하려고합니다.

    • url-필수, 텍스트를 추출하려는 이미지의 URL 또는 URL 배열을 전달하십시오.
    • language-선택 사항이며 두 글자 ISO 639-1 형식으로 추출 할 텍스트 언어입니다. 기본값은 'en'입니다.

    Utility.URL.addQueryString매개 변수 (urls, 핵심 가치)

    검색어 추가string URL에 매개 변수를 추가하십시오.

    • url-필수, 검색어를 추가하려는 URL 또는 URL 배열을 전달 string 매개 변수
    • key-필수, 추가 할 매개 변수의 키
    • value-필수, 추가 할 매개 변수의 값

    Utility.URL.getQueryString매개 변수 (urls키)

    쿼리 값을 가져옵니다string 모든 URL의 매개 변수.

    • url-필수, 검색어를 읽으려는 URL 또는 URL 배열을 전달하십시오.string 매개 변수 from.
    • key-필수, 읽을 매개 변수의 키

    Utility.URL.removeQueryString매개 변수 (urls키)

    검색어 제거string 모든 URL의 매개 변수.

    • url-필수, 검색어를 삭제하려는 URL 또는 URL 배열을 전달string 매개 변수 from.
    • key-필수, 제거 할 매개 변수의 키

    Utility.URL.exists (urls)

    각 URL을 호출하여 URL이 실제로 존재하는지 확인하십시오.

    • url-필수, 확인하려는 URL 또는 URL 배열을 전달하십시오.