Как я заставляю wget загружать cgi файл позади robots.txt?

Да извините об этом.:)

Это возможно, но только легко, если Вы заставили / домой быть отдельным разделом. Несмотря на мои максимальные усилия, это не значение по умолчанию.

У Вас нет большого количества файлов, уже, тем не менее, делают Вас? Я думаю, что лучший выбор состоит в том, чтобы загрузиться в однопользовательский режим и скопировать содержание в карту памяти USB. Это должно быть легко.

Необходимо будет смонтировать, что это вручную - включает его, ожидает несколько секунд и затем вводит dmesg и отметьте устройство, которое, как оно говорит, было вставлено. Затем смонтируйте что с:

mount /dev/sdc /mnt

замена sdc с любым сказанным dmesg. (Вам, возможно, понадобится sdc1, в зависимости от того, как устройство было форматировано).

Затем изменение в корневом каталоге (cd /) и выполненный

tar cJvf/mnt/mattdm-is-sorry.tar.xz / домой

и когда это завершается, выполненный

синхронизация; сон 3; umount/mnt

(Сон для суеверия.)

Причина tar вместо просто копирования состоит в том, чтобы сохранить метаданные Unix, потому что Картой памяти будет FAT, отформатированный, и мы не хотим смешивать с этим прямо сейчас.

Затем после того как у Вас есть своя восстановленная система (я все еще рекомендую альфу F15!), можно извлечь его с tar xf /mnt/mattdm-is-sorry.tar.xz. Если Вы выполняете в этом / как корень, это перезапишет все в Вашем новом /home, таким образом, вероятно, лучшая вещь сделать загрузить новую систему в однопользовательский режим и сделать ту первую вещь.


О, и на этот раз, в то время как Вы устанавливаете, делают /home его собственный раздел.:)

2
20.07.2012, 03:18
3 ответа
wget --user-agent=Mozilla \
  "http://aok.heavengames.com/cgi-bin/aokcgi/display.cgi?action=t&fn=22"
2
27.01.2020, 22:07

Из wget руководства по gnu.org

Если Вы знаете то, что Вы делаете и действительно действительно хотите выключить исключение робота, установить переменную роботов на 'прочь' в Вашем .wgetrc. Можно достигнуть того же эффекта из командной строки с помощью переключателя-e, например, ‘wget-e robots=off URL...’.

1
27.01.2020, 22:07
  • 1
    На самом деле после фактической попытки этого теперь, решение Ulrich Dangel работает отлично, потому что веб-сайт 403 на агенте неизвестного пользователя, которым это кажется. –  Anthony Hatzopoulos 20.07.2012, 05:31

После нескольких попыток использования: --user-agent | robots = off без вывода и проверкой шестнадцатеричного дампа вывода.

Я добился успеха - отправив вывод файла в формат HTML, используя приведенный ниже пример

Попробуйте следующее:

wget --user-agent=Mozilla \ -e robots=off "http://aok.heavengames.com/cgi-bin/aokcgi/display.cgi?action=t&fn=22" -O -O cgi-converted-to-htmlfile.html

FYI the - user-agent = Mozilla \ -e robots = off все в той же строке

option -e robots = off отключит учет серверов robots.txt

option -O cgi-convert-to -htmlfile.html выведет файл в формате html на имя файла

cgi-convert-to-htmlfile.html

Удачи, Надеюсь, что это вы ищете.

0
27.01.2020, 22:07

Теги

Похожие вопросы