Перемещение и преобразование каталога документации на основе HTML в TEXT или PDF

Документация для стандартного системного пакета содержится в:

 /usr/share/doc/rsyslog-5.8.10 (distros: RHEL 6/Centos 6)

, однако это все * .html. Я хотел бы просмотреть все файлы в правильном порядке и либо создать ОДИН файл PDF, либо ОДИН файл TXT, чтобы документацию можно было распечатать и прочитать в автономном режиме, не переходя вручную от страницы к странице.

Как мне это сделать?

0
07.02.2017, 00:11
2 ответа
(find /usr/share/doc/rsyslog-5.8.10/ -type f -name \*.html -exec w3m -dump {} \; ) > /path/to/mydocs.txt

Если порядок, в котором поиск перечисляет файлы, соответствует вашей организации, вы можете использовать его, чтобы использовать w3m (консольный HTTP-клиент) для визуализации HTML-кода для вас, и скатать их все в один файл.

Если вам не нравится порядок, вы можете отказаться от параметра -exec , чтобы получить список файлов, а затем изменить их порядок, прежде чем пережевывать этот сгенерированный и отсортированный список с помощью w3m .

1
28.01.2020, 02:46

Поскольку я не нашел w3m из предыдущего ответа в моей системе, я бы установил html2text и запустил:

find /usr/share/doc/rsyslog-5.8.10/ -type f -name \*.html -exec html2text {} >> all_docs.txt \;
0
28.01.2020, 02:46

Теги

Похожие вопросы