Как я могу удалить теги HTML из файла с помощью sed?

Вы можете установить ISO на Windows (например, инструменты демона , а кажется, что Windows 8.1 имеет собственную функцию монтажа ISO), но даже тогда это бесполезно, так как Linux / Двоичный Unix не будет работать в Windows - кроме, конечно, если вы устанавливаете Linux на виртуальной машине.

0
19.04.2017, 19:49
3 ответа

До тех пор, пока ваши HTML теги ограничены одной строкой, будет работать ниже:

sed 's/<[^>]*>//g'
2
28.01.2020, 02:13

Пока теги HTML ограничены одной строкой, будут работать следующие действия:

sed 's/<[^>]*>//g'
-121--198566-

Такая ошибка обычно вызывается отсутствующей кавычкой или отсутствием fi , done и т. д.

Поскольку вы не показываете весь сценарий, невозможно сказать, что именно неправильно. Показанный фрагмент в основном в порядке (помимо проблем форматирования). Я бы добавил двойные кавычки " вокруг $ final однако это может пойти не так, если есть пробелы в $ final .

-121--230035-

Если вы не настаиваете на sed , лучше всего было бы сделать это lynx .

lynx --dump < имя _ файла > .html

Содержимое HTML-файла будет выведено в формате, который должен был отобразить HTML-код. Единственное условие - имя файла должно иметь расширение .html или .htm .

7
28.01.2020, 02:13

Можно использовать -exec для создания новой оболочки bash, а затем управлять {} внутри оболочки, передавая ее в качестве параметра (доступ к ней можно получить как к $0 в новой оболочке). Можно удалить тип файла .md , заканчивающийся расширением параметров:

find . -name '*.md' -type f -exec bash -c 'pandoc --filter ./filter1.py -o ${0%md}html' {} \;
-121--161318-

Попробуйте не использовать/dev/sdX для идентификации устройств, вместо этого используйте его UUID, и вы всегда должны быть в безопасности.

Используйте команду blkid для идентификации UUID устройства и изменения fstab с помощью UUID = YureDevices UUID замены/dev/sdX. Также потребуется изменить файл/etc/grub/grub.cfg, чтобы установить корневое устройство в качестве UUID диска, с которого вы хотите загрузиться.

-121--229956-

Я настоятельно рекомендую использовать вместо этого любую из программ с именем html2text ( 1 ) ( 2 ). Анализ HTML намного сложнее, чем кажется.

3
28.01.2020, 02:13

Теги

Похожие вопросы