wget не получает все содержимое страницы

С ssh >= 7.3 (требуется только на машине _A ), эти два шага можно выполнить скрыто с помощью опции -J/ ProxyJump, упрощая то, что вам нужно делать (и фактически повышая безопасность этого конкретного примера):

ssh -L 5904:localhost:5904 -J myusername@Machine_B myusername@Machine_C

Таким образом, помимо простоты, доступ к VNC также не осуществляется на машине _B, как вы делали, поэтому другие пользователи машины _B не могут использовать ваш VNC.

Для объяснения это будет традиционный (безопасный )способ сделать то же самое:

ssh -L 2222:Machine_C:22 myusername@Machine_B

на другом терминале, все еще включенном Машине _A:

ssh -L 5904:localhost:5904 myusername@localhost:2222

Обратите внимание, что на машине _B нет точки входа в туннель.ProxyJump(-J)внутри делает примерно то же самое, за исключением того, что использует каналы между двумя процессами ssh вместо порта 2222.

Теперь из-за возможности вообще не подключаться по ssh к машине _C, скорее всего, это проблема доступа/настройки VNC, а не проблема ssh. Вы уверены, что VNC не ограничен локальным хостом? Либо конфигурацией, либо локальным брандмауэром?

0
04.01.2020, 13:12
2 ответа

попробуй так:

wget -q -O - "https://api.northside.dk/wp-json/wp/v2/cpt-artist/?orderby=menu_order&order=asc&per_page=100" | grep -oP '"raw":.*?[^\\]"'
"raw":"Clara"
"raw":"Folkeklubben"
"raw":"Franc Moody"
"raw":"Green Day"
"raw":"Hans Philip"
"raw":"Johnny Marr"
"raw":"Jung"
"raw":"Kashmir"
"raw":"Lukas Graham"
"raw":"Mags"
"raw":"Mekdes"
"raw":"Mew"
"raw":"Robyn"
"raw":"Spleen United"
"raw":"Weezer"
"raw":"White Lies"

обновление #1

в браузере вы запускаете инструменты разработчика, в chrome вы можете сделать это через F12 затем выберите закладку сети и введите адрес веб-сайта

в этот момент вы должны увидеть все запросы, которые браузер отправляет на сервер, и их ответы

когда вы хорошо следите за сетевым трафиком, вы увидите запрос, отвечающий за загрузку необходимых данных

вы можете выбрать каждый запрос, чтобы проверить его параметры запроса, ответ, статус и т. д.

enter image description here

1
28.01.2020, 02:38

как сказал @nobody:

wget can only get elements that are included directly on the page. Obviously, this page loads a javascript, which loads additional content and puts it into the page dynamically. wget cannot run javascript code, and therefore cannot determine, which elements are loaded from javascript after a page is loaded. – nobody yesterday

Этот материал можно успешно извлечь с помощью селена в питоне.

0
28.01.2020, 02:38

Теги

Похожие вопросы