Narzędzia do przechwytywania i konwertowania Internetu
Społeczność online GrabzIt

Nowicjusz potrzebujący pomocy (pierwotnie opublikowano w złym miejscu)

Zadaj pytania dotyczące korzystania z narzędzia do zrzutów ekranu GrabzIt.

Witaj, społeczność,

Proszę wybaczyć moją niewiedzę. Jestem biznesmenem, a nie technikiem. Jestem pewien, że będzie to widoczne w moich pytaniach.

Czy możliwe jest użycie bardziej niezawodnych parametrów wyboru i kontroli w narzędziu Web Scrape, takich jak wzorzec adresu URL (najbardziej krytyczny) i ustawienia kontroli podążania za liniami za pomocą narzędzia do zrzutów ekranu? Chcę tylko przeszukać podstawowy adres URL i rozszerzone domeny z tego adresu URL, z ograniczeniami dotyczącymi głębokości przeszukiwania. Moim celem jest po prostu pobranie artykułów prasowych z określonego zestawu domen. Wolałbym przyjmować tylko tekst jako wynik, ale mogę żyć z obrazami dostarczanymi w dokumencie. Dane wyjściowe narzędzia do zrzutów ekranu są dla mnie świetne, biorąc pod uwagę moje podstawowe wymagania, ale funkcjonalność wyboru i kontroli jest zbyt ograniczona. Musiałbym znać wszystkie subdomeny i nazwy artykułów, aby móc korzystać ze standardowego wejścia tego narzędzia, a to nie jest realistyczne.

Pomyślałem, że skrobaczka będzie świetna i zacząłem jej używać, ale szybko odkryłem, że ceny i ograniczenia dotyczące tego narzędzia są znaczne! Nie mogę tego wykorzystać w oparciu o tę strukturę kosztów.

Uwaga: mam programistę piszącego w Pythonie, który bawi się interfejsem API, ale nie ma wiedzy na temat tego narzędzia i mamy problemy z jasnym komunikowaniem się ze sobą na temat moich oczekiwań, więc obawiam się, że jej praca idzie w kierunku, który będzie nie będzie dla mnie optymalny. W szczególności powiedziałem jej, że chcę mieć tę samą kontrolę wejścia, co skrobak sieciowy, ale dla narzędzia screeshot. ale nie sądzę, że ona rozumie i docenia mój problem. Czy możliwe jest użycie interfejsu API w celu wykorzystania solidnych kryteriów wyboru bez płacenia szalenie wysokich cen za webscraptera?

Wszelkie wskazówki będą mile widziane.

Z góry dziękuję!!!
Pytanie zadane przez anonima 1 lutego 2024 r

Pytanie zadane przez anonima 1 lutego 2024 r

Cześć,

Nie ma problemu, postaram się odpowiedzieć na Twoje pytania.

Ogólnie rzecz biorąc, skanowanie sieci ogranicza się do wzorca witryny lub adresu URL, w przeciwnym razie ze względu na charakter pliku internet, podążanie za linkami spowodowałoby, że przeglądanie sieci nigdy by się nie skończyło.

Narzędzie do zrzutów ekranu wykonuje zrzuty ekranu określonych adresów URL jednorazowo, zgodnie z harmonogramem lub po zmianie stron internetowych. Jeśli masz listę adresów URL, które chcesz przechwycić, można ją zaimportować into narzędzie do zrzutów ekranu.

Dzięki interfejsowi API możesz użyć własnej logiki do uruchomienia zrzutu ekranu. Więc do tego, co robisz, myślę, że potrzebujesz jakiegoś niestandardowego skrobaka sieciowego, który uruchomiłby API. 

Mam nadzieję że to pomoże.

Odpowiedź udzielona przez wsparcie GrabzIt w dniu 1 lutego 2024 r