Если в начале диска достаточно места для установки GRUB (или любого другого загрузчика на самом деле), и LiveCD поддерживает ISO с циклическим монтированием, вы можете создать файловую систему, в которой будут отображены плохие блоки, или вы можете разделить это во-первых, чтобы избежать плохих блоков.
Пример grub.cfg
загрузочная запись для Ubuntu Live CD:
menuentry "Ubuntu 15.04 Desktop amd64" {
set isofile="ubuntu-15.04-desktop-amd64.iso"
loopback loop (hd0,msdos3)/$isofile
linux (loop)/casper/vmlinuz.efi boot=casper iso-scan/filename=/$isofile noprompt noeject
initrd (loop)/casper/initrd.lz
}
Итак, GRUB2 очень наворочен тем, что извлекает даже ядро и initramfs непосредственно из файла ISO. Но эта функция будет совершенно излишней, если, помимо ISO, вы смонтируете ее самостоятельно и скопируете файлы ядра и initramfs отдельно, так что у вас есть три файла в вашем / boot
: ядро, initramfs, и файл iso.
Таким образом, вы можете использовать любой загрузчик по вашему выбору, поэтому в другом загрузчике это может выглядеть так:
linux vmlinuz.efi boot=casper iso-scan/filename=ubuntu-15.04-desktop-amd64.iso noprompt noeject
initrd initrd.lz
Параметры различны для каждого типа компакт-диска, так как цикл монтирования и поиск файлов iso обрабатываются Live CD сам initramfs.
Обычно этот метод используется для размещения большого количества Live CD на одном USB-накопителе. Это просто помогает избежать областей плохих блоков (если они правильно разделены / отформатированы).
Удовлетворяет ли это вашим требованиям? (Изhttps://stackoverflow.com/questions/12422289/bash-command-to-convert-html-page-to-a-text-file)
lynx --dump www.google.com > file.txt
Комментарий о «навигационном контенте» рассматривается с помощью опции -nolist
, например,
lynx -nolist -dump www.google.com > file.txt
который не показывает ссылок и т.д.:
$ lynx -nolist -dump www.google.com > file.txt
$ cat file.txt
Search Images Maps Play YouTube News Gmail Drive More »
Web History | Settings | Sign in
Google
_______________________________________________________
Google Search I'm Feeling Lucky Advanced search
Language tools
Advertising Programs Business Solutions +Google About
Google
© 2019 - Privacy - Terms
w3m
дает что-то подобное, но без опции:
$ w3m -dump https://www.google.com
Search Images Maps Play YouTube News Gmail Drive More >>
Web History | Settings | Sign in
Google
[ ] Advanced
searchLanguage
[Google Search][I'm Feeling Lucky] tools
Advertising ProgramsBusiness Solutions+GoogleAbout Google
(C) 2019 - Privacy - Terms
Выводlinks2
очень похож наw3m
(с отсутствующим пробелом передО):
$ links2 -dump www.google.com
Search Images Maps Play YouTube News Gmail Drive More >>========(97,1) 31% ==
Web History | Settings | Sign in
Google
__________________________________________________________ Advanced
[ Google Search ] [ I'm Feeling Lucky ] searchLanguage
tools
Advertising ProgramsBusiness Solutions+GoogleAbout Google
(c) 2019 - Privacy - Terms
$ links2 -dump www.google.com >file.txt
$ cat file.txt
Search Images Maps Play YouTube News Gmail Drive More >>
Web History | Settings | Sign in
Google
__________________________________________________________ Advanced
[ Google Search ] [ I'm Feeling Lucky ] searchLanguage
tools
Advertising ProgramsBusiness Solutions+GoogleAbout Google
(c) 2019 - Privacy - Terms
(как ни странно, он также печатает прогресс, если дамп идет прямо на терминал — не очень хорошая функция )иelinks
по-видимому, выгружает только формат с «содержимым навигации»(ymmv).
Из дальнейших комментариев выясняется, что OP заинтересован в чем-то, что могло бы отображать содержимое данного раздела на странице. Сравнение размеров источника и дампа для этой страницы дает некоторые подсказки:
Size Buffer name Contents ------- -------------------- ---------------------------------------------------------------------------------------- 0# 267624 [!lynx -source ht-1] !lynx -source https://www.nytimes.com/2019/01/30/reader-center/polar-vortex-tips.html 1 5475 [!lynx -dump -nolis] !lynx -dump -nolist https://www.nytimes.com/2019/01/30/reader-center/polar-vortex-tips.html
показывает, что дамп составляет около 2% от размера источника. Большая часть страницы не -информационная, и текстовые -браузеры отображают информацию. Но запрошенное деление состоит из двух -строк, которые выглядят так (только в начале :первая строка фактически содержит62265символов):
<div id="app"><div class="css-v89234 e3w10z60"><div><div><div class="css-13lpfd6 e1nre7570"><header class="css-1bymuyk e1>
<script>window.__preloadedData = {"initialState":{"Article:QXJ0aWNsZTpueXQ6Ly9hcnRpY2xlLzBhODc0MTcxLWM0MjEtNWRjOS1hN2IzLW>
Первая строка содержит текст статьи (плюс много разметки ), и навскидку, глядя на вторую строку, это, вероятно, сценарий, который браузеры с графическим интерфейсом обнаруживают для отображения статьи. Ни один из вышеупомянутых -текстовых -браузеров не имеет возможности просто отображать данный <div>...</div>
или интерпретировать скрипт таким образом.В этих статьях упоминается отсутствие стандартного URI для режима чтения в некоторых браузерах с графическим интерфейсом :
Я экспериментировал с удобочитаемостью -cli(https://gitlab.com/gardenappl/readability-cli)в сочетании с pandoc(https://pandoc.org/). Например
% readable https://www.nytimes.com/2019/01/30/reader-center/polar-vortex-tips.html | pandoc -f html - -t plain
Send Us Your Ideas for What to Do During the Polar Vortex. We Want to Hear From You.
It’s so cold in much of the Midwest today that you could get frostbite
within five minutes once you step outside. If you’re living through it
indoors, give us your tips.
[Credit...Scott Olson/Getty Images]
Across the Midwest, where wind chills were minus 51 in Minneapolis and
minus 45 in Chicago, the risks of going outside on Wednesday were dire.
So, many people simply didn’t bother, while others took a chance to
и так далее. Это проект Node, поэтому можно задаться вопросом об уязвимостях в зависимостях, так что используйте свое суждение. (Как ни странно, это не очень хорошо работает со ссылками stackexchange.com, такими как эта страница:-)