Skrobak internetowy GrabzIt udostępnia kilka specjalnych metod narzędziowych, które ułatwiają wyodrębnianie adresów e-mail ze strony internetowej. Poniższy przykład pobiera całą zawartość HTML ze strony internetowej, a następnie przesyła ją przez Utility.Text.extractAddresses
Metoda znajdowania wszystkich prawidłowych adresów e-mail przed zapisaniem adresów into zbiór danych, który jest następnie wysyłany do użytkownika.
Alternatywnie tylko pierwszy pasujący adres e-mail można wyodrębnić za pomocą Utility.Text.extractAddress
Metoda.
Data.save(Utility.Text.extractAddresses(Page.getHtml()));
Dokumenty PDF można również zeskrobać dla adresów e-mail w podobny sposób, jak strony internetowe są zeskrobane powyżej. Jak widać w poniższym przykładzie, proces jest dokładnie taki sam, z wyjątkiem tego, że PDF.getText()
zamiast metody używana jest metoda Page.getHtml()
Metoda.
Data.save(Utility.Text.extractAddresses(PDF.getText()));
GrabzIt ma zdolność do wyodrębnij tekst z obrazów oznacza to, że tę zdolność można również wykorzystać do wyodrębnienia adresów e-mail z obrazów. Poniższy przykład wyodrębnia adresy e-mail ze wszystkich obrazów na stronie internetowej.
Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}))));
Podczas gdy poniższe instrukcje zdrapywania wyodrębniają adresy e-mail z obrazów znalezionych w dokumentach PDF.
Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(PDF.getValue({"type":"image"}))));