Что означает [преобразовано] в нижней части vim?

Приведенное ниже решение будет работать только для не форматированного, стандартного apache2 сгенерированного индекса каталога. Вы можете wget файл индекса и разобрать его с помощью grep и cut, например :

#this will download the directory listing index.html file for /folder/
wget the.server.ip.address/folder/   

#this will grep for the table of the files, remove the top line (parent folder) and cut out
#the necessary fields
grep '' index.html | tail -n +2 | cut -d'>' -f7 | cut -d'<' -f1

Обратите внимание, как упоминалось выше, это будет работать, только если листинг каталога сгенерирован сервером apache2 с базовыми опциями, настроенными как :


 Options +Indexes 
 AllowOverride None
 Allow from all

В этой конфигурации wget вернет index.html без какого-либо специфического форматирования, но, конечно, список каталогов может быть настроен также, с опциями :

IndexOptions +option1 -option2 ...

Чтобы предложить более точный ответ, который подходит для вашего случая, если он специфичен, нам понадобится пример index.html файла.

А вот также версия на Python :

from bs4 import BeautifulSoup
import requests

def get_listing() :
  dir='http://cdimage.debian.org/debian-cd/8.4.0-live/amd64/iso-hybrid/'
  for file in listFD(dir):
    print file.split("//")[2]

def listFD(url, ext=''):    
  page = requests.get(url).text
  print page
  soup = BeautifulSoup(page, 'html.parser')
  return [url + '/' + node.get('href') for node in soup.find_all('a') if node.get('href').endswith(ext)]

def main() :
  get_listing()


if __name__=='__main__' : 
  main()

Используется как руководство на этой странице.

40
24.04.2014, 06:49
0 ответов

Теги

Похожие вопросы