Я читал stackexchange уже много лет, и мне всегда удавалось найти ответ на проблемы, с которыми мне приходилось иметь дело. с участием. Однако на этот раз я задам вопрос, так как не смог найти решения проблемы, с которой столкнулся сейчас.
В настоящее время я работаю над исследовательским проектом, и мне нужно создать карту сайта для веб-сайта. У меня более 10 ГБ файлов php, загруженных с онлайн-форума (ныне умерших). Все файлы находятся в одной папке, поэтому я не могу восстановить исходную структуру на основе папок.
Мне было интересно, есть ли там инструмент / скрипт (меня действительно не волнует язык, на котором он написан) для анализа файлов php и вывода какой-то карты сайта / структуры (XML, HTML или еще )
Файлы были созданы с помощью phpBB; Я использую Debian и Ubuntu (два разных компьютера). Любые предложения приветствуются. Заранее большое спасибо
Пакет: webcheck
Description-ru: проверка ссылок и структуры веб-сайтов
webcheck - это инструмент проверки веб-сайтов для веб-мастеров. Он сканирует указанный веб-сайт и создает ряд отчетов в виде HTML-страниц. Он прост в использовании и создает простые, понятные и читаемые отчеты.
Возможности webcheck: * поддержка http, https, ftp и файловых схем * просмотр структуры сайта * отслеживание битых ссылок {{1} } * найти потенциально устаревшие и новые страницы * список ссылок, указывающих на внешние сайты * может работать без вмешательства пользователя
Домашняя страница: http: // arthurdejong. org / webcheck /
Один из создаваемых им отчетов - это карта сайта.