Найти слово или набор слов в наборе файлов PDF

В VLC вы можете щелкнуть правой кнопкой мыши, видео, сделать снимок

1
29.10.2020, 20:01
2 ответа

Вместо

for i in 1 2 3 4 5 6 7 8; do  find Semaine_$i -iname '*.pdf' -exec pdfgrep "taux" {} +; done

если вы хотите напечатать имя файла, используйте -print on find (для печати имени после совпадений )или -l для grep (для печати имени вместо спички):

find Semaine_[1-8] -iname '*.pdf' -exec pdfgrep "taux" {} \; -print

или

find Semaine_[1-8] -iname '*.pdf' -exec pdfgrep -l "taux" {} \;

Кроме того, pdfgrepимеет встроенную -рекурсивную функциональность с помощью флага -r, так что вы можете просто выполнить:

pdfgrep -r -l "taux" Semaine_[1-8]

0
18.03.2021, 22:53

Вы не получите результатов при непосредственном использовании команды grep. Потому что приложения, включенные в минимальный пакет Linux, могут обрабатывать только те файлы, которые могут быть прочитаны vi и nano. (grep, awk и т. д. )Существует множество инструментов и альтернатив для специальных форматов файлов, таких как PDF. Установив программное обеспечение для архивирования с открытым исходным кодом, такое как Dspace, вы можете искать и каталогизировать все свои PDF-файлы в браузере. Добавляя модули, вы можете усилить работу с PDF. Или вы можете использовать приложения на основе командной строки -, которые конвертируют PDF-файлы в обычные текстовые файлы, такие как pdftotext. Пример команды поиска для pdftotext:

pdftotext /file/semaine.pdf - | grep -n -i "Semaine"

-n:Печать номеров строк.-i:Не различает прописные и строчные буквы.

Добавив wc -lв конце команды, вы можете узнать, сколько раз встречается искомый термин.

Вы можете получить более эффективные результаты с параметрами awk и производными, которые вы добавляете после конвейеров.

Как я упоминал выше, существует более одного пути. Я могу предложить эти две разные альтернативы.

0
18.03.2021, 22:53

Теги

Похожие вопросы