웹 캡처 및 변환 도구

이미지에서 텍스트 추출

중요한 텍스트 정보는 종종 이미지에 저장 될 수 있습니다. 하나 GrabzIt의 웹 스크레이퍼 광학 문자 인식을 사용하여이 정보를 자동으로 추출하는 기능을 제공합니다. 이것은 인공적인 형태이지만 intelligence 결과가 항상 완벽하지는 않습니다.

이미지에서 텍스트를 추출하려면 Utility.Image.extractText 방법은 아래와 같습니다.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));

이 예제는 웹 페이지에서 모든 이미지 URL을 가져온 다음 URL을 extractText 메소드에 전달하여 extractText 메소드에 전달합니다.이 메소드는 각 이미지에서 텍스트 데이터를 추출하려고 시도하고 일치하는 항목을 strings.

이미지의 텍스트가 다른 언어 인 경우 아래에 표시된 것처럼 두 글자 (ISO 639-1) 형식을 사용하여 올바른 언어 코드를 지정해야합니다.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');