Попробуйте так:
LANG=iso-8859-1 sed -i -e"s/'//g" -e's/'//g' -e's/[\d128-\d255]//g' -e's/\x0//g'
или вы можете найти это полезным (заменит непечатаемые и одинарные кавычки):
sed -i 's/[^[:print:]]//;s/'\''//g;s/'//g' filename
Вы можете попробовать pdfjam
, который принимает такие параметры, как--trim '1cm 2cm 1cm 2cm' --clip true
(и другие параметры пакета LaTeX 'pdfpages', )"для обрезки этих сумм слева, снизу, справа и сверху, соответственно, входных данных. страницы», например, вывод «--help» для состояний программы.
Я часто использую фрагменты документов, но я не встречал графического интерфейса для непосредственного извлечения фрагментов PDF.
Тем не менее, точный выбор фрагмента можно сделать с помощью Okular
или с помощью Spectacle
, а результат сохранить в формате png, который, как я знаю, вы сказали, что не хотите, но..... вы можете вернуться к pdf, если запустите это в каталоге, в котором вы сохранили фрагменты
for i in *.png; do convert $i ${i%.*}.pdf; done
Вопрос, о котором вы упомянули, связан не столько с тем, чтобы просто «взять часть документа», сколько с обратным проектированием кривых без наличия данных базовой точки/графика. Другое животное на вопрос, который вы сформулировали.