Usaría un ciclo de lectura while, esto manejaría archivos con espacios.
ls 2*.txt | tail -5 | while read loop
do
cat "$loop"
done
Si siempre quiere los 5 más recientes, puede cambiarlos als -tr | tail -5
Проверьте это:
pdftotext -raw "filename.pdf" && file=`ls -tr | tail -1`; grep -E "https?://.*" "${file}" && rm "${file}"
Вы можете попытаться извлечь директивы /URI(...)
PDF вручную, возможно, после удаления сжатия, если таковые имеются, используяpdftk
:
pdftk file.pdf output - uncompress | grep -aPo '/URI *\(\K[^)]*'
Вы можете использовать pdftohtml, а затем использовать lynx для извлечения ссылок из html.