методы сжатия PDF

Для установкиlibkrb5-dev:

Предварительно -Реквизиты:

yum -y install ntp
ntpdate 0.rhel.pool.ntp.org
systemctl start  ntpd.service
systemctl enable ntpd.service

Установка:

yum -y install krb5-server krb5-libs

Источник

-121 ---179543 ​​-

Как сказал @Kusalananda, useradd -m rahulсоздаст нового пользователя rahul и настроит его домашний каталог. Содержащиеся там файлы определены в каталоге скелета /etc/skel. Например, в моей системе этот каталог содержит:

[dr01@centos7 ~]$ ls -lap /etc/skel
total 28
drwxr-xr-x.   3 root root   92 May 16 10:17./
drwxr-xr-x. 143 root root 8192 Sep 21 09:46../
-rw-r--r--.   1 root root   18 Apr 11 02:53.bash_logout
-rw-r--r--.   1 root root  193 Apr 11 02:53.bash_profile
-rw-r--r--.   1 root root  231 Apr 11 02:53.bashrc
drwxr-xr-x.   4 root root   39 Mar 19  2018.mozilla/
-rw-r--r--.   1 root root  658 Aug  2  2017.zshrc

Этот каталог упоминается на справочной странице useradd.

0
03.01.2021, 12:05
1 ответ

I assume that the size difference is related to ABBY using some commercial magic to be smart about image compression

Не предполагай, исследуй. Формат PDF хорошо -документирован , читайте подробности. Откройте файлы PDF в редакторе (или просто используйтеless)и посмотрите, как на самом деле закодированы страницы, и найдите разницу. Или установите пакет, например mutools, с инструментами командной строки, которые могут извлекать части файла PDF.

Изображение в PDF-файле будет занимать разный объем памяти в зависимости от разрешения, с которым оно сохранено (, которое может совпадать или не совпадать с разрешением, с которым оно было отсканировано ), и алгоритма сжатия..

Стандартное сжатие в соответствии со стандартными методами

  • ASCIIHexDecode
  • Декодирование ASCII85
  • LZWDDecode (Лемпель -Зив -Уэлч ).
  • FlateDecode (zlib/deflate)
  • RunLengthDecode

и некоторые, которые, вероятно, не применимы.

Так что узнайте, какое разрешение и метод сжатия использовала ABBY, а затем попытайтесь найти инструменты для воспроизведения этого (и, возможно, вам придется модифицировать существующие инструменты, если они не делают этого из коробки ).


From what I understand, this means that ABBY uses the JPXDecode filter with the Mask feature to encode the image, which means that I'd be looking for a linux/FOSS alternative that can do JPXDecode (JPG2000?) compression.

Точно. Обратите внимание, что JPG может не быть лучшим методом сжатия текста, потому что он ориентирован на фотографии, а это означает, что он не может очень хорошо отображать резкие переходы, характерные для текста. С другой стороны, поскольку это сканы, переходы уже могут быть изначально размыты при сканировании.

Также обратите внимание, что JPG имеет довольно много параметров, влияющих на степень сжатия и качество.

Таким образом, в этом случае используйте mutoolsдля извлечения нескольких изображений, используйте другой инструмент (, например. mediainfoили identify -verboseиз ImageMagick/GraphicsMagick ), чтобы узнать параметры изображений JPG.

Кроме того, очень внимательно изучите распакованное изображение JPG при большом увеличении и решите, достаточно ли хорошее качество.

Должно быть множество инструментов с открытым -исходным кодом для создания файла JPG из ваших отсканированных изображений в нужном разрешении и качестве, но я не знаю ни одного инструмента, который мог бы упаковать их в PDF.

1
18.03.2021, 22:38

Теги

Похожие вопросы