Narzędzia do przechwytywania i konwertowania Internetu

Konwertuj strony internetowe i HTML na PDF

API Pythona

Podczas konwersji stron internetowych i HTML na PDF GrabzIt's API Python zapewnia następujące funkcje, które pomagają integrate GrabzIt into twój system tak łatwo, jak to możliwe. Jednak zanim zaczniesz, pamiętaj, że po wywołaniu URLToPDF, HTMLToPDF or FileToPDF metody Save or SaveTo należy wykonać metodę, aby wykonać zrzut ekranu PDF.

Podstawowe opcje

Często podczas konwersji strony internetowej into W dokumencie PDF powstanie wiele stron w celu przedstawienia całej strony. Do konwersji strony internetowej wymagany jest tylko jeden parametr into dokument PDF lub do konwertuj HTML na PDF jak pokazano w poniższych przykładach.

grabzIt.URLToPDF("https://www.tesla.com")
# Then call the Save or SaveTo method
grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>")
# Then call the Save or SaveTo method
grabzIt.FileToPDF("example.html")
# Then call the Save or SaveTo method

Niestandardowy identyfikator

Możesz przekazać niestandardowy identyfikator do PDF metody, jak pokazano poniżej, ta wartość jest następnie zwracana do programu obsługi GrabzIt Python. Na przykład ten niestandardowy identyfikator może być identyfikatorem bazy danych, umożliwiając skojarzenie zrzutu ekranu z określonym rekordem bazy danych.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.URLToPDF("https://www.tesla.com", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.FileToPDF("example.html", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")

Nagłówki i stopki

Podczas tworzenia zrzutu ekranu w formacie PDF możesz poprosić o zastosowanie określonego szablon do wygenerowanego pliku PDF. Ten szablon musi być saved z góry i określi zawartość nagłówka i stopki wraz ze specjalnymi zmiennymi. W przykładowym kodzie poniżej użytkownik używa swojego szablonu o nazwie „mój szablon”.

Jeśli nie ma wystarczająco dużego górnego lub dolnego marginesu odpowiednio dla nagłówka lub stopki, nie pojawi się on w pliku PDF. W poniższym przykładzie ustawiliśmy górny i dolny margines na 20, aby zapewnić dużo miejsca.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.marginTop = 20
options.marginBottom = 20
options.templateId = "my template"

grabzIt.FileToPDF("example.html", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

Konwertuj element HTML na PDF

Jeśli chcesz bezpośrednio przekonwertować element HTML, taki jak div lub span, bezpośrednio into dokument PDF, który możesz z biblioteką Python GrabzIt. Musisz zdać Selektor CSS elementu HTML, który chcesz przekonwertować na targetElement parametr.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

W tym przykładzie chcemy uchwycić całą zawartość w zakresie, który ma identyfikator Article, dlatego przekazujemy to do GrabzIt, jak pokazano poniżej.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.targetElement = "#Article"

grabzIt.URLToPDF("http://www.bbc.co.uk/news", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

Sposób przycinania pliku PDF podczas kierowania elementu HTML może być kontrolowane przy użyciu tych technik.