Все приложения PDF смешивают ширину и высоту файла PDF

[1123325] Я удивлен, что никто больше не нашел этого, но есть [1123890] страница Википедии [1123891], посвящённая архитектурам, поддерживаемым Linux. Их слишком много, чтобы здесь перечислить, но я перечислю архитектуры Linux [1123892], официально поддерживаемые Debian[1123893], так как это хороший показатель того, что обычно используется:

i386[1124251]: x86 архитектура, разработанная для 32-битных ПК на базе Intel/AMD. Также совместима, но не рекомендована к использованию на 64-битных ПК Intel/AMD

amd64[1124253]: архитектура x86-64, предназначенная для 64-битных ПК AMD/Intel

armel[1124255]: архитектура ARM little-endian (набор инструкций ARMv4) на RiscPC и различных встраиваемых системах (EABI)

ia64[1124257]: архитектура Intel Itanium (IA-64)

-p-     Do not query password

mips[1124259], [1124260]mipsel[1124261]: Архитектура MIPS (big-endian и little-endian)

powerpc[1124263]: PowerPC architecture

s390[1124265]: архитектура IBM ESA/390 и z/Architecture

Range(Cells(1,ActiveCell.Column),Cells(WorksheetFunction.CountA(Columns(ActiveCell.Column)),ActiveCell.Column)).Select

sparc[1124267]: Архитектура Sun SPARC на системах Sun4u/v

armhf[1124269]: ARM (набор инструкций ARMv7) жесткийархитектура float, требующая аппаратного обеспечения с плавающей запятой (FPU)

s390x[1124271]: Архитектура IBM ESA/390 и z/Architecture с 64-битным пользовательским пространством

2
13.04.2017, 15:34
1 ответ

0.

Вот PNG, сделанный из вашего одностраничного образца PDF-файла:

test.png (converted from test.pdf)

1.

При просмотре в любом средстве просмотра PDF ширина страницы больше высоты.

Это именно то, что должно быть.

2.

[...] похоже, что все приложения PDF, которые я пробовал, ошибочно принимают ширину за высоту и высоту за высоту ширина этого PDF-файла.

Как вы сказали, это только кажется таким.

3.

Файл PDF поврежден?

Нет, не работает.

4.

Вы пропустили одну информацию, которую вам дала ваша первая команда ( pdfinfo ):

Page rot:       90

Это означает, что исходный код PDF внутри файла PDF говорит зрителю принять это «Это действительно выше чем широкая " -страница и отображать ее с поворотом на 90 градусов.

Таким образом, «при просмотре в любом средстве просмотра PDF ширина страницы больше, чем высота» . Как и положено. См. Мой Нет. 1 выше. А мой Нет. 2 выше.

5.

Вы можете использовать pdfimages для извлечения всех изображений, а затем ImageMagick convert , чтобы преобразовать их, которые выходят как PNM или PBM, в JPEG:

 pdfimages -j test.pdf test-

 for i in *.pbm ; do            \
    convert $i ${i/.pbm/.jpg} ; \
 done

Это приводит к восьми различным images, те, которые имеют нумерацию 0-7 в вашей команде pdfimages -list из вашего вопроса ( '2.' ).

Вот эти изображения. Все они масштабируются до 25% от исходного размера, поэтому не тратится слишком много места.Все они отображаются в «естественной» ориентации, так как извлечены из изображений в формате pdf . Вот первый номер 0 в вашем списке:

Это изображение было извлечено в его «естественной» ориентации. Он явно выше ширины.

Все следующие пары изображений масштабированы на 25%. Они представляют изображения типа маски в списке ваших pdfimages , выводимых выше:

Ваш сканер (с его встроенное ПО) более "умный". Он не просто создает один TIFF из страницы, а затем вставляет его в оболочку PDF, но пытается оптимизировать различные части, используя изображения «маски» (с альфа-каналами - отображаются черным цветом в файлах JPEG, которые я создал) для частей, содержащих текст.

К счастью, программное обеспечение вашего сканера не было "более" интеллектуальным, когда оно применяло сжатие для текста и использовало JPEG2000 вместо JBIG2. Так что вы не попались на печально известную « ошибку сканирования ксерокопирования » .

1
27.01.2020, 22:21

Теги

Похожие вопросы