Поиск по сайту:

Wkhtmltopdf — умный инструмент для преобразования HTML-страницы веб-сайта в PDF в Linux


Wkhtmltopdf — это простая и очень эффективная утилита командной строки с открытым исходным кодом, которая позволяет пользователю конвертировать любой заданный HTML (веб-страницу) в . >PDF документ или изображение (jpg, png и т. д.).

Wkhtmltopdf написан на языке программирования C++ и распространяется под лицензией GNU/GPL (General Public License). Он использует механизм рендеринга макета WebKit для преобразования страниц HTML в документ PDF без потери качества страниц. Это действительно очень полезное и надежное решение для создания и хранения снимков веб-страниц в режиме реального времени.

Возможности Wkhtmltopdf

  1. Открытый исходный код и кроссплатформенность.
  2. Преобразуйте любые веб-страницы HTML в файлы PDF с помощью механизма WebKit.
  3. Варианты добавления верхних и нижних колонтитулов
  4. Опция создания таблицы содержания (TOC).
  5. Обеспечивает преобразование в пакетном режиме.
  6. Поддержка PHP или Python через привязки к libwkhtmltox.

В этой статье мы покажем вам, как установить программу Wkhtmltopdf в системах Linux, используя исходные файлы tarball.

Установите Evince (просмотр PDF-файлов)

Давайте установим программу evince (программу для чтения PDF) для просмотра файлов PDF в системах Linux.

sudo yum install evince             [RHEL/CentOS and Fedora]
sudo dnf install evince             [On Fedora 22+ versions]
sudo apt-get install evince         [On Debian/Ubuntu systems]

Загрузить исходный файл Wkhtmltopdf

Загрузите исходные файлы wkhtmltopdf для вашей архитектуры Linux с помощью команды Wget или вы также можете загрузить последние версии (текущая стабильная серия — 0.12.4) по адресу страница загрузки wkhtmltopdf.

В 64-битной ОС Linux
wget https://github.com/wkhtmltopdf/wkhtmltopdf/releases/download/0.12.4/wkhtmltox-0.12.4_linux-generic-amd64.tar.xz
В 32-битной ОС Linux
wget https://github.com/wkhtmltopdf/wkhtmltopdf/releases/download/0.12.4/wkhtmltox-0.12.4_linux-generic-i386.tar.xz

Установите Wkhtmltopdf в Linux

Извлеките файлы в текущий рабочий каталог, используя следующую команду tar.

------ On 64-bit Linux OS ------
sudo tar -xvf wkhtmltox-0.12.4_linux-generic-amd64.tar.xz 

------ On 32-bit Linux OS ------
sudo tar -xvzf wkhtmltox-0.12.4_linux-generic-i386.tar.xz 

Установите wkhtmltopdf в каталоге /usr/bin, чтобы упростить выполнение программы из любого пути.

sudo cp wkhtmltox/bin/wkhtmltopdf /usr/bin/

Как использовать Wkhtmltopdf?

Здесь мы увидим, как конвертировать удаленные страницы HTML в файлы PDF, проверять информацию, просматривать созданные файлы с помощью программы evince из GNOME. Рабочий стол.

Конвертировать HTML-страницу веб-сайта в PDF-файл

Чтобы преобразовать веб-страницу HTML любого веб-сайта в PDF, выполните следующий пример команды. Он преобразует данную веб-страницу в 10-Sudo-Configurations.pdf в текущем рабочем каталоге.

wkhtmltopdf https://linux-console.net/sudoers-configurations-for-setting-sudo-in-linux/ 10-Sudo-Configurations.pdf
Пример вывода:
Loading pages (1/6)
Counting pages (2/6)
Resolving links (4/6)
Loading headers and footers (5/6)
Printing pages (6/6)
Done

Просмотр созданного PDF-файла

Чтобы убедиться, что файл создан, используйте следующую команду.

file 10-Sudo-Configurations.pdf
Пример вывода:
10-Sudo-Configurations.pdf: PDF document, version 1.4

Просмотр информации о созданном PDF-файле

Чтобы просмотреть информацию о сгенерированном файле, введите следующую команду.

pdfinfo 10-Sudo-Configurations.pdf
Пример вывода:
Title:          10 Useful Sudoers Configurations for Setting 'sudo' in Linux
Creator:        wkhtmltopdf 0.12.4
Producer:       Qt 4.8.7
CreationDate:   Sat Jan 28 13:02:58 2017
Tagged:         no
UserProperties: no
Suspects:       no
Form:           none
JavaScript:     no
Pages:          13
Encrypted:      no
Page size:      595 x 842 pts (A4)
Page rot:       0
File size:      697827 bytes
Optimized:      no
PDF version:    1.4

Просмотр созданного PDF-файла

Взгляните на только что созданный файл PDF с помощью программы evince на рабочем столе.

evince 10-Sudo-Configurations.pdf
Пример скриншота:

Выглядит довольно красиво под моей коробкой с Linux Mint 17.

Создать TOC (оглавление) страницы в PDF

Чтобы создать оглавление для файла PDF, используйте параметр toc.

wkhtmltopdf toc https://linux-console.net/sudoers-configurations-for-setting-sudo-in-linux/ 10-Sudo-Configurations.pdf
Пример вывода:
Loading pages (1/6)
Counting pages (2/6)
Loading TOC (3/6)
Resolving links (4/6)
Loading headers and footers (5/6)
Printing pages (6/6)
Done

Чтобы проверить TOC созданного файла, снова используйте программу evince.

evince 10-Sudo-Configurations.pdf
Пример скриншота:

Посмотрите на картинку ниже. выглядит даже лучше, чем вышеописанное.

Параметры и использование Wkhtmltopdf

Чтобы узнать больше об использовании и параметрах Wkhtmltopdf, используйте следующую команду справки. Он отобразит список всех доступных опций, которые вы можете использовать с ним.

wkhtmltopdf --help