Как извлечь закладки из файла PDF

Таким образом, Вы попробовали четыре OSs, включая Windows, и это не работало ни с одним из них? Затем это, очень вероятно, будет аппаратная проблема. Данные в aplay-L не устраняют аппаратную проблему, потому что та информация прибывает из Вашего аудио чипсета, не фактического порта HDMI. Если это все еще находится под гарантией, свяжитесь с производителем.

5
11.07.2014, 02:02
3 ответа
[

] Вы можете использовать CLI []jpdftweak[] для извлечения закладок в формате CSV:[

] [
java -jar -Xmx512M jpdftweak.jar "file.pdf" -savebookmarks "bmarks.csv" /dev/null
] [

] После проверки и возможного изменения данных закладок вы можете загрузить их обратно в PDF-файл с помощью следующей команды:[

] [
java -jar -Xmx512M jpdftweak.jar "file.pdf" -loadbookmarks "bmarks.csv" "file_updated.pdf"
] [

]Параметр Java []-Xmx512M[] является необязательным, но может помочь при обработке больших PDF-файлов, которые требуют больше памяти. [

] [

]Вы также можете захотеть прочитать [] этот связанный вопрос и ответ [].[

].
2
27.01.2020, 20:40
[

]Вы можете использовать []pdftk[] для извлечения данных (в частности, закладок) из PDF-файлов. [

] [

][]Пример:[] с pdftk 2.02,[

] [
pdftk file.pdf dump_data_utf8 | grep '^Bookmark'
] [

]выводит список закладок, 4 строки для каждой закладки, под формой:[

] [
BookmarkBegin
BookmarkTitle: <title in UTF8>
BookmarkLevel: <number>
BookmarkPageNumber: <number>
] [

]где, например, уровень 1 соответствует разделам, уровень 2 - подразделам и так далее. Вместо []dump_data_utf8[] можно использовать []dump_data[], что даст вам цифровые сущности HTML/XML для не-ASCII символов (например, []è[] для "и"). [

] [

]Примечание: Без []grep[] можно получить другие интересные данные, такие как метаданные (дата создания, автор, ключевые слова, заголовок и т.д.), количество страниц и размеры каждой страницы. Эта утилита pdftk может делать и другие вещи в PDF файле(ах); подробное описание см. в ее []man page[].[

].
2
27.01.2020, 20:40

с qpdf

Это поможет вам начать:

qpdf --json your.pdf | jq '.objects' | grep -Po 'Title": \K.*'

Эта команда также выдаст заголовок PDF-файла.

Ознакомьтесь с руководством по qpdf относительно вывода JSON.

Я почти уверен, что команду можно упростить, избавившись от grepс помощью подстановочных знаков jq .

1
29.06.2020, 15:26

Теги

Похожие вопросы