Często ważne informacje tekstowe mogą być przechowywane w obrazach. jednak Skrobak internetowy GrabzIt zapewnia możliwość automatycznego wyodrębnienia tych informacji za pomocą optycznego rozpoznawania znaków. Chociaż jako jest to forma sztuczna intelligencja wyniki nie zawsze są idealne.
Aby wyodrębnić tekst z obrazów, należy użyć Utility.Image.extractText
metoda, jak pokazano poniżej.
var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));
Przykłady te pobierają wszystkie adresy URL obrazów ze strony internetowej, a następnie przekazują adresy URL do metody extractText, która próbuje wyodrębnić dane tekstowe z każdego obrazu i przekazuje wszelkie dopasowania jako tablicę strings.
Jeśli tekst na obrazie jest w innym języku, musisz określić poprawny kod języka, używając dwuliterowego formatu (ISO 639-1), jak pokazano poniżej.
var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');