일반 텍스트에는 쉽게 추출 할 수없는 많은 정보가 포함될 수 있습니다. 예를 들어 한 문장은 회사에 대한 리뷰 일 수 있지만 좋은 리뷰인지 나쁜 리뷰인지 어떻게 알 수 있습니까?
일반적인 웹 스크레이퍼는이 정보를 추출 할 수 없습니다. 그러나 GrabzIt은 자연 언어 처리 기능을 내장하여 사용할 수 있습니다. 아래 예에 표시된 것처럼 페이지 텍스트가 분석되어 다음 음수, 음수, 중립, 양수 및 매우 양수 값 중 하나를 반환합니다.
Data.save(Utility.Text.extractSentiment(Page.getText()), 'Dataset', 'Sentiment');
이기는하지만 GrabzIt의 웹 스크레이퍼 언어 감지, 위치 이름, 사람 이름 및 조직 이름을 포함한 텍스트에서 훨씬 더 많은 정보를 추출 할 수 있습니다. 그 예는 다음과 같습니다.
//Language Detection Data.save(Utility.Text.extractLanguageName(Page.getText()), 'Dataset', 'Language'); //Identify Geographic Locations Data.save(Utility.Text.extractLocations(Page.getText()), 'Dataset', 'Locations'); //Identify People's Names Data.save(Utility.Text.extractNames(Page.getText()), 'Dataset', 'Names'); //Identify Organizations Names Data.save(Utility.Text.extractOrganizations(Page.getText()), 'Dataset', 'Organizations');
스크레이퍼 마법사에서 해당 HTML 요소를 선택할 때 자동으로 표시되므로 이러한 스 크레이프 지침을 직접 작성할 필요는 없습니다.