Narzędzia do przechwytywania i konwertowania Internetu

W jaki sposób GrabzIt konwertuje HTML na DOCX

HTML może reprezentować wiele skomplikowanych struktur, takich jak wbudowane elementy DIV lub SPAN umieszczone obok siebie. Elementy HTML nakładające się i obramowania stosowane do różnych elementów HTML. W przeważającej części nie byłoby to rozsądne podejście w DOCX, chociaż możliwe byłoby utworzenie floatJeśli połączymy elementy HTML z polami tekstowymi, prawie cała treść będzie zawarta w polach tekstowych, co spowoduje powstanie bardzo brzydkiego i zaśmieconego dokumentu programu Word.

Właśnie z powodu tego problemu ignorujemy floating elementów HTML i obramowań większości elementów HTML. Jednakże szanujemy granice niektórych elementów HTML, takich jak na przykład komórki tabeli i wyrównanie elementów obrazu.

Czy to oznacza, że ​​nie można umieszczać treści obok siebie? Nie. Jest to nadal możliwe przy użyciu atrybuty CSS kolumny, tabele HTML i tabulatory, jak opisano poniżej.

Jeśli chcesz, aby dokument HTML był przechwytywany dokładnie tak, jak pokazano na ekranie, byłoby lepiej przekonwertować HTML na PDF ponieważ format pliku PDF wykorzystuje pozycjonowanie bezwzględne.

Tabulatory

Tabulatory to specjalna funkcja DOCX, która jest aktywowana, jeśli floatElementy HTML z wyrównaniem tekstu są zawarte w elemencie HTML o szerokości 100%, który sam nie ma określonego wyrównania tekstu. Jest to ważne, ponieważ oznacza, że ​​do elementów podrzędnych nie należy stosować normalnego wyrównania. Odbywa się to za pomocą text-align:start. Pamiętaj, że tabulatory nie działają w tabeli ani na liście.

Przykład tego pokazano poniżej.

<div style="width:100%;text-align:start">
   <div style="width:50%;text-align:left;float:left">Aligned One</div>
   <div style="width:50%;text-align:left;float:left">Aligned Two</div>
</div>

Język tekstu

Aby tekst w dokumencie DOCX miał określony język. The HTML element tag dokumentu HTML musi mieć lang atrybut. Lub inny element HTML w dokumencie HTML, taki jak P tag musi mieć określony język.

Jeśli podrzędny element HTML nie ma określonego znacznika języka, język powraca do domyślnego języka dokumentu. Jeżeli nie określono żadnego z nich, używany jest język angielski.