wget на терминале Centos 7 как загрузить только текст без кода стиля веб-сайта

Ваши настройки локали отличаются в вашей оболочке и в вашем cronjob. Вы можете проверить это, выполнив locale в обеих установках, и вы можете изменить настройки локали вашего cronjob, установив соответствующие переменные (LC_ALL - это молоток, если вам не нужно быть тонким; смотрите locale(7) для деталей).

1
16.09.2017, 21:26
1 ответ

Для загрузки с удаленным html используйтеlinks(илиlynx)с опцией -dump:

links -dump http://website.web

Или:

lynx -dump http://website.web

Они отличаются стилем вывода. Во-первых, lynxбудет форматировать гиперссылки, а linksих игнорировать.

Установка

В системе, подобной debian/ubuntu -, любая программа может быть установлена ​​с помощьюapt-get:

apt-get install links

apt-get install lynx
1
27.01.2020, 23:44

Теги

Похожие вопросы