Можно использовать напр.mutool clean -d
из пакета mupdf
для распаковки потоков в файле PDF, после чего вы можете просмотреть его (или grep
напрямую).
К сожалению, текст в PDF-файлах визуализируется путем размещения глифов (или последовательностей глифов) в заранее рассчитанных координатах. Таким образом, $2^n$
и $$2^n$$
будут состоять из двух глифов для 2
и n
в разных позициях, и это действительно сложно сопоставить с регулярным выражением.
Я предлагаю вам распаковать ваш PDF-документ и посмотреть, как на самом деле выглядит рендеринг текста.
Более простым решением, чем повторная -установка ОС с другим расположением разделов или загрузка с загрузочного диска и изменение размеров существующих разделов, может быть использование привязки.
Здесь есть отличный ответ о монтировании привязки:
Скажем ради обсуждения, что ваш сервер Apache занимал все пространство и был внедрен в /var/www
.
Используя связанное монтирование, вы можете создать каталог в /home
, где смонтировано /dev/sda2
, например /home/www
, переместить все из /var/www
в /home/www
, а затем связать /home/www
в /var/www
.
bash-# mkdir /home/www
bash-# mv /var/www/* /home/www/
bash-# chown -R $owner:$group /home/www <-- this step may be optional
bash-# mount --bind /home/www /var/www
Это позволит вам использовать пространство из /dev/sda
, как если бы оно было частью /
, без необходимости изменять размер каких-либо разделов или даже перезагружать сервер.
Это также означает, что вам не нужно настраивать ничего, что ожидает вещей в /var/www
, чтобы искать их в/home/www
(сценариях запуска, приложениях, использующих веб-сервер, заданиях cron и т. д. ).
Только не забудьте добавить в/etc/fstab
:
/home/www /var/www none defaults,bind 0 0
В противном случае он не сохранится после перезагрузки.