Можно использовать GLOBIGNORE
переменная для сокрытия .
и ..
каталоги. Это действительно автоматически также устанавливает dotglob
опция, таким образом, *
теперь соответствия и скрытые и нескрытые файлы. Можно снова вручную сбросить dotglob
, Тем не менее, это затем дает поведение, которое Вы хотите.
Посмотрите этот пример:
$ ls -a
. .. a .a ..a
$ GLOBIGNORE=".:.."
$ shopt -u dotglob
$ echo * # all (only non-hidden)
a
$ echo .* # all (only hidden)
.a ..a
короче говоря:
Чтобы знать, сжато ли это уже:
strings your.pdf | grep /Filter
К (ООН) сжимают PDF, используют QPDF
qpdf --stream-data=compress your.pdf compressed.pdf
qpdf --stream-data=uncompress compressed.pdf uncompressed.pdf
объяснение:
Ключевое слово "Фильтра" в файле PDF является индикатором используемого метода сжатия. Некоторые из них:
CCITT G3/G4 – используемый для монохромных изображений
JPEG – алгоритм с потерями, который используется для изображений
JPEG2000 – более современная альтернатива JPEG, который также используется для сжатия изображений
Flate – используемый для сжатия текста, а также изображений
JBIG2 – альтернатива сжатию CCITT для монохромных изображений
LZW – используемый для сжатия текста, а также изображений, но быть замененным Flate
RLE – используемый для монохромных изображений
ZIP – используемый для полутоновых или цветных изображений
(скопированный отсюда).
Однако, учитывая файловую структуру комплекса PDF, большую часть времени некоторая часть (или "поток") PDF будет сжата уже в некотором роде (и обнаружится при захвате / Фильтра), в то время как некоторая другая часть не будет, таким образом, будет не ДА / НИКАКОЙ ответ на вопрос, сжат ли PDF.
один способ преодолеть это состоял бы в том, чтобы добавить -c
опция к grep, который возвращает количество случаев, таким образом, Вы видели относительно, как хорошо это сжато. например, если strings
"large
.pdf" | grep -c /Filter
возвраты менее затем 10 это довольно не сжато.
Другое свойство, касающееся размера в PDFs, были ли они оптимизированы для быстрого доступа, с "оптимизированным" PDFs тем, чтобы быть больше в размере, для заключения в кавычки из Википедии:
Существует две разметки в файлы PDF — нелинейны (не "оптимизированный") и линейный ("оптимизированный"). Нелинейные файлы PDF используют меньше дискового пространства, чем их линейные дубликаты, хотя они медленнее к доступу, потому что части данных, необходимых для сборки страниц документа, рассеиваются всюду по файлу PDF. Линейные файлы PDF (также названный "оптимизированной" или "сетью оптимизировал" файлы PDF) создаются способом, который позволяет им быть считанными в плагине веб-браузера, не ожидая всего файла для загрузки, так как они записаны в диск в линейном (как в порядке страницы) вид. Файлы PDF могут быть оптимизированы с помощью программного обеспечения Adobe Acrobat или QPDF.
Можно проверить, оптимизирован ли PDF с помощью pdfinfo your.pdf
.
pdftk является инструментом для выполнения некоторых операций на файлах PDF, как сжатие/распаковка:
$ pdftk test.pdf output compressed_test.pdf compress
pdfinfo file.pdf
говорит Вам, если PDF оптимизирован. Однако я не уверен, означает ли это сжатый или нет.
– nico
30.07.2011, 17:58
Просто проверьте его свойства; это скажет, сжат ли файл или нет.
Я нашел метод сжатия в файле PDF. Откройте PDF с текстовым редактором. Запустите Поиск или Найдите - вводят CCITT, если не найденный, введите JPEG, то Flate, то JBIG2, то LZW, то RLE и затем ZIP.
Звучит хуже, чем это! Очень легкий найти метод сжатия потока данных.
qpdf
иpdftk
сделайте более или менее то же самое относительно сжатия, ноqpdf
может оптимизировать также (плюс намного больше вещей). спасибо – Philomath 07.08.2011, 17:10