Częstym zadaniem jest pobieranie obrazów ze strony internetowej za pomocą Skrobak internetowy GrabzIt to jest łatwe. Przede wszystkim utwórz nowe zadrapanie z normalnymi szczegółami, takimi jak strona początkowa zadrapania i inne opcje.
Następnie przejdź do Instrukcje złomowania i kliknij przycisk przycisk. To wejdzie do
Page
keyword into instrukcje zeskrobania i otworzy listę rozwijaną. Wybierz getTagAttributes
z listy. Następnie dodaj 'src'
jako pierwszy parametr informuje program zgarniający, aby wyodrębnił atrybut src, a następnie wpisz przecinek.
Następnie kliknij pozwala to powiedzieć skrobaczce internetowej, z których elementów należy wyodrębnić atrybut src. W oknie filtru upewnij się, że typ jest ustawiony na „Strona internetowa”, a ograniczenie to „nazwa znacznika” i „równa się”. Następnie wejdź
img
w polu tekstowym, a następnie kliknij przycisk Dodaj, a następnie przycisk Wstaw filtr. Zakończ instrukcję, dodając średnik na końcu linii.
Powinieneś zostać z czymś takim, jak pokazano poniżej.
Page.getTagAttributes('src', {"tag":{"equals":"img"}});
Powyższy kod wyodrębni wszystkie adresy URL obrazów ze strony internetowej, ale teraz musimy użyć tych adresów URL obrazów save te obrazy jako pliki. W tym celu wstawimy to polecenie minus średnik do litery a Data.saveFile
dowództwo. Aby to zrobić, przejdź do początku linii i wybierz przycisk. Następnie z rozwijanego menu wybierz
saveFile
, a następnie przejdź do końca linii i dodaj )
przed średnikiem.
Powinieneś teraz mieć następujące instrukcje zgarniania.
Data.saveFile(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));
Teraz, jeśli uruchomisz scrape, wyodrębnisz wszystkie obrazy ze strony internetowej. Wiele z tego samouczka można było również osiągnąć za pomocą przycisku kreatora na pasku narzędzi Instrukcje zdrapania.