Как выбрать и вывести URL-адреса из любого файла?

Я хотел бы знать, какая команда:

  1. выбирает все URL в файле (т.е. распознает все адреса, начинающиеся с http или www от начала до конца, и отделяет их от текста или других данных)

  2. вывести их в файл .txt.

Идея состоит в том, чтобы выполнить команду wget -i для файла .txt. Мне нужно правильно выбрать и вывести этот URL-адрес в файле .txt, поскольку wget пытается напрямую идентифицировать все URL-адреса в необработанном файле.

0
16.12.2018, 06:02
1 ответ

Большое спасибо, я выполнил инструкции из приведенной выше ссылки ( 1 ), и в моем случае это сработало отлично (поскольку URL-адреса находятся между во входном файле):

grep -Po '(?<=href=")[^"]*(?=")' INPUT_FILE > OUTPUT_FILE.txt

Вопрос решен, еще раз спасибо!

1
28.01.2020, 02:46

Теги

Похожие вопросы