Один из способов сделать это - использовать флаг -u
в sort
, хотя это может не сохранить исходный порядок файлов:
sort -k1,1 -k2,2 -u file
Если вам нужно, чтобы удаление было сделано с сохранением порядка файлов
awk '!a[$1, $2]++' file
AFAIK, no hay un interruptor wget para hacerlo directamente desde wget
, así que:
Lo que haría yo:
#!/bin/bash
num=10
mech-dump --links http://domain.tld/path |
grep -i '\.pdf' |
while read url; do
if ((++c <= num)); then
wget "$url"
fi
done
mech-dump
es el paquete debianlibwww-mechanize-perl