Сделайте WGET создать пустой файл для всего, что он загружает?

Идея о том, как получить простую версию страниц руководства, можно найти в man man :

man foo | col -b

Исходя из этого, вы можете получить только один раздел, например, с помощью pcregrep :

man man | col -b | pcregrep -Mo '^SEE ALSO(.|\n)*?^[^ ]'

Вы можете немного отрегулировать его и ввести в действие g rep в любом s действиях любого человека ual легко:

gsman () { man $1 | col -b | pcregrep -iMo "^$2(.|\n)*?(?=\n[A-Z])" ; }

и использование будет

gsman grep options | grep invert
2
27.07.2018, 09:12
4 ответа

Я решил эту проблему с помощью обходного пути. Загружено с помощью wget с использованием зеркала в одном терминале, а затем во втором терминале я запускаю этот oneliner

while true ; do date; time find /tmp/test/ -type f -exec cp /dev/null {} \; ; sleep 36000; done

Это очищает все существующие файлы, затем приостанавливается на десять часов и запускается снова. "Достаточно хорошо" для моих целей.

1
27.01.2020, 23:10

у меня была такая же проблема, используйте wget -O - 'URL'он автоматически удалит пустой файл, и ваша проблема будет решена

wget -O - 'http://www.google.com'
  • -Oдля загрузки выходного файла
  • -чтобы удалить этот файл
-2
27.01.2020, 23:10

Согласно справочной странице wget--зеркало — это то, что вам нужно:

--mirror
       Turn on options suitable for mirroring.  This option turns on
       recursion and time-stamping, sets infinite recursion depth and
       keeps FTP directory listings.  It is currently equivalent to -r -N
       -l inf --no-remove-listing.
-1
27.01.2020, 23:10

Подойдет ли вам что-то подобное?

wget --spider -r --no-parent http://your.url.com/
-1
27.01.2020, 23:10

Теги

Похожие вопросы