Как удалить символ новой строки между двумя строками \n в unix?

Question

Как удалить символ новой строки между двумя строками \n в unix?

$ rmlint --types duplicatedirs

Это выведет список дублирующихся каталогов и создаст сценарий оболочки (rmlint.sh), который вы можете запустить для их удаления.

Инструкции по установке и т. д. см. в руководстве пользователя.

0

html newlines sed text-processing

Serge 05.09.2016, 08:04

Ссылка

2 ответа

Похожие вопросы

1
Sed and BBedit Html 14.12.2016
У меня есть проблема, которую я не могу решить даже после сканирования Интернета. Я верю в вашу помощь. У меня есть текстовый файл, содержащий несколько строк разной длины. https: //insidemiamitatto.com / ...
7
Используйте awk или sed для удаления всего между < > 04.06.2021
В текстовом файле есть следующее :
1. Mark Yato ft. MarkAm & 0
сравните два файла и получите данные 14.05.2015
У меня есть два файла: Файл A sample >> AT5G46880.1 | PACid: 19669936 # score bias c-Evalue i-Evalue hmmfrom hmm to alifrom ali to envfrom env to acc --- ------ ----- ------- - -...

-1
Grep только 3 символа рядом с открывающей скобкой 20.08.2021
У меня есть такой текст, я хочу найти только 3 символа рядом с открывающей скобкой. Пожалуйста помоги. условие :s (XXX _ygh _ghj _jui,00.05 )| s (DFG _GHH _CN _GJ _YUI _UYT _UIJ,00.05 )условие :s (GYZ _ygh _ghj _jui,00.05 )| s (TYU _GHH _CN _GJ _YUI _UYT

8
удаление первого и последнего знака каждой строки из командной строки 11.01.2013
Я пытаюсь удалить первое и последние знаки everyline в текстовом файле и сохранить получающуюся усеченную версию в новом файле. Делает у любого есть идея о том, как сделать это эффективно...

0
Команда Linux для поиска и удаления текста сразу из нескольких файлов 03.06.2019
Мой сайт заражен вирусом. Этот вирус добавил эту строку в несколько файлов на моем сайте. Моя идея состоит в том, чтобы удалить эту строку текста с помощью уникальной команды из терминала. Допустим, у меня есть папка...

-1
CUPS + Canon MG5650: страница обрезана при печати дуплекса 19.09.2018
Я пытаюсь напечатать на моем Canon MG5650 через CUPS. У меня был выбран водитель «Canon MG5600 series - CUPS + Gutenprint v5.2.11». Я выполнил следующую команду, чтобы напечатать «односторонний». результаты кажутся...

Serge · Answer 1 · 28.01.2020, 02:27

Эта команда sed должна помочь вам:

sed -e ':1;/<font>[[:space:]]*$/{N;s#<font>[[:space:]]\+</font>#<font></font>#g;b1}' file

Команда ищет тег , который до конца строки следует пробел. Затем в пространство шаблона втягивается следующая линия; затем выполняется замена возможно существующей последовательности [[: space:]] \ + и сценарий перезапускается с начала. Если пространство шаблонов не соответствует адресу / [[: space:]] * $ / , то есть после тега присутствует некоторый непространственный контент , затем пространство шаблонов распечатывается и очищается концом сценария sed , и процесс перезапускается.

Изменить : Измерение производительности.

Я заполнил файл следующим содержанием, повторенным 10k раз:

<font>
dejidewji
</font>
<font>



</font><font>





</font>

всего, 620Kb. Время выполнения сценария выше на 1.4Gz A8-4500M:

real    0m0.361s
user    0m0.356s
sys 0m0.005s

Edit2 :

Последнее обновление вашего вопроса намного проще решить с помощью perl , а производительность в 10 раз лучше, как показал другой ответ:

perl -0777 -pe 's|<font>\s+|<font>|g;s|\s+</font>|</font>|g' file

Благодарности за @spasic

Sundeep · Answer 2 · 28.01.2020, 02:27

$ cat ip.html
<font>
This is a text
</font>

123

<font>
</font>

xyz

<font>

</font>

ijk

<font>





</font>

789

perl решение, -0777 отбрасывает весь файл

$ perl -0777 -pe 's|<font>\n*([^\n]*)\n*</font>|<font>$1</font>|g' ip.html
<font>This is a text</font>

123

<font></font>

xyz

<font></font>

ijk

<font></font>

789

Как удалить символ новой строки между двумя строками \n в unix?

Теги

Похожие вопросы