Narzędzia do przechwytywania i konwertowania Internetu

Wyodrębnij tekst z obrazów

Często ważne informacje tekstowe mogą być przechowywane w obrazach. jednak Skrobak internetowy GrabzIt zapewnia możliwość automatycznego wyodrębnienia tych informacji za pomocą optycznego rozpoznawania znaków. Chociaż jako jest to forma sztuczna intelligencja wyniki nie zawsze są idealne.

Aby wyodrębnić tekst z obrazów, należy użyć Utility.Image.extractText metoda, jak pokazano poniżej.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));

Przykłady te pobierają wszystkie adresy URL obrazów ze strony internetowej, a następnie przekazują adresy URL do metody extractText, która próbuje wyodrębnić dane tekstowe z każdego obrazu i przekazuje wszelkie dopasowania jako tablicę strings.

Jeśli tekst na obrazie jest w innym języku, musisz określić poprawny kod języka, używając dwuliterowego formatu (ISO 639-1), jak pokazano poniżej.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');