웹 캡처 및 변환 도구
GrabzIt의 온라인 커뮤니티

도움이 필요한 초보자(원래 잘못된 영역에 게시됨)

GrabzIt의 스크린 샷 도구 사용법에 대해 질문하십시오.

안녕하세요. 커뮤니티,

저의 무지를 용서해주세요. 저는 기술적인 사람이 아니라 사업가입니다. 나는 그것이 내 질문에서 빛을 발할 것이라고 확신합니다.

URL 패턴(가장 중요) 및 라인 따르기 제어 설정과 같은 Web Scrape 도구의 보다 강력한 선택 및 제어 매개변수를 스크린샷 도구와 함께 사용할 수 있습니까? 내가 원하는 것은 크롤링이 진행되는 레이어 수에 대한 제한을 두고 기본 URL과 해당 URL에서 확장 도메인을 크롤링하는 것입니다. 내 목표는 특정 도메인 세트에서 뉴스 기사를 수집하는 것입니다. 나는 텍스트만 출력으로 사용하고 싶지만 docx에 전달되는 이미지를 그대로 사용할 수 있습니다. 스크린샷 도구의 출력은 기본 요구 사항에 적합하지만 선택 및 제어 기능이 너무 제한되어 있습니다. 해당 도구의 표준 입력을 사용하려면 모든 하위 도메인과 기사 이름을 알아야 하는데 이는 현실적이지 않습니다.

나는 스크레이퍼가 훌륭할 것이라고 생각하고 사용하기 시작했지만 곧 그 도구에 대한 가격과 제한 사항이 상당하다는 것을 알게 되었습니다! 해당 비용 구조를 기반으로 이를 사용하는 것은 실현 가능하지 않습니다.

참고로, API를 가지고 놀고 있는 Python을 작성하는 코더가 있지만 그녀는 이 도구에 대해 잘 모르고 우리는 내 기대에 대해 서로 명확하게 의사소통하는 데 어려움을 겪고 있습니다. 그래서 그녀의 작업이 나에게 최적이 아닙니다. 특히 저는 웹 스크래퍼와 동일한 입력 제어 기능을 갖고 싶지만 스크린샷 도구에는 사용하고 싶다고 말했습니다. 하지만 나는 그녀가 내 문제를 이해하거나 평가하지 않는다고 생각합니다. API를 사용하여 웹스크랩터에 대해 엄청나게 높은 가격을 지불하지 않고도 강력한 선택 기준을 활용할 수 있습니까?

모든 지침은 크게 감사하겠습니다.

미리 감사드립니다!!!
1년 2024월 XNUMX일 익명의 질문자

1년 2024월 XNUMX일 익명의 질문자

안녕,

문제없습니다. 최선을 다해 귀하의 질문에 답변해 드리겠습니다.

일반적으로 웹 스크레이핑은 웹사이트 또는 URL 패턴으로 제한됩니다. 그렇지 않으면 웹사이트의 특성으로 인해 int링크를 따라가면 웹 스크랩이 절대 끝나지 않을 것입니다.

스크린샷 도구는 일정에 따라 또는 웹페이지가 변경될 때 지정된 URL의 스크린샷을 한 번 찍습니다. 캡처하려는 URL 목록이 있는 경우 이를 가져올 수 있습니다. into 스크린샷 도구.

API를 사용하면 자체 로직을 사용하여 스크린샷을 실행할 수 있습니다. 그래서 당신이 하고 있는 일을 위해서는 API를 트리거하는 일종의 맞춤형 웹 스크레이퍼가 필요할 것이라고 생각합니다. 

희망이 도움이됩니다.

1년 2024월 XNUMX일 GrabzIt 지원팀에서 답변함