Narzędzia do przechwytywania i konwertowania Internetu

Zeskrob adresy e-mail ze strony internetowej

Poniższe dwa przykłady są częścią tego samego szablon.

Skrobak internetowy GrabzIt udostępnia kilka specjalnych metod narzędziowych, które ułatwiają wyodrębnianie adresów e-mail ze strony internetowej. Poniższy przykład pobiera całą zawartość HTML ze strony internetowej, a następnie przesyła ją przez Utility.Text.extractAddresses Metoda znajdowania wszystkich prawidłowych adresów e-mail przed zapisaniem adresów into zbiór danych, który jest następnie wysyłany do użytkownika.

Alternatywnie tylko pierwszy pasujący adres e-mail można wyodrębnić za pomocą Utility.Text.extractAddress Metoda.

Data.save(Utility.Text.extractAddresses(Page.getHtml()));

Zeskrob adresy e-mail z dokumentów PDF

Dokumenty PDF można również zeskrobać dla adresów e-mail w podobny sposób, jak strony internetowe są zeskrobane powyżej. Jak widać w poniższym przykładzie, proces jest dokładnie taki sam, z wyjątkiem tego, że PDF.getText() zamiast metody używana jest metoda Page.getHtml() Metoda.

Data.save(Utility.Text.extractAddresses(PDF.getText()));

Zeskrob adresy e-mail ze zdjęć

GrabzIt ma zdolność do wyodrębnij tekst z obrazów oznacza to, że tę zdolność można również wykorzystać do wyodrębnienia adresów e-mail z obrazów. Poniższy przykład wyodrębnia adresy e-mail ze wszystkich obrazów na stronie internetowej.

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}))));

Podczas gdy poniższe instrukcje zdrapywania wyodrębniają adresy e-mail z obrazów znalezionych w dokumentach PDF.

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(PDF.getValue({"type":"image"}))));