Поиск нескольких экземпляров строки с контекстом из файла

Question

Поиск нескольких экземпляров строки с контекстом из файла

Я бы запустил chkdisk в Windows на этом жестком диске, прежде чем пытаться смонтируйте его в Linux. Похоже, что таблица разделов или разделы не были должным образом размонтированы в какой-то момент жизни этого жесткого диска.

1

text-processing grep

user394 14.05.2015, 22:23

Ссылка

1 ответ

Жадность

Обратите внимание, это победило Это не полный список, так как некоторые копии слова «медиа» могут быть слишком близки к тому, что уже записано. Например:

$ echo 123 media 12345 media 123456789 media 12 |grep -Eo '.{0,10}media.{0,10}'
123 media 12345 med
234567890 media 123

Вы получаете части всех трех экземпляров «media», но поскольку один из них частично находится в пределах десяти символов от другого, была представлена только его часть.

Если GNU grep скомпилирован с libpcre , вы можете указать этим подстановочным знакам ленивыми, а не жадными :

$ echo 123 media 12345 media 123456789 media 12 |grep -Po '.{0,10}?media.{0,10}?'
123 media
 12345 media
234567890 media

Флаг -P включает Оценка Perl-совместимого регулярного выражения (PCRE).

Ленивая оценка (также называемая «нежадной оценкой») направлена на то, чтобы одно совпадение не мешало другому, а не потребляло как можно больше из десяти символов, что ограничивает дальнейшие совпадения.

Если ваша версия grep не поддерживает -P или -o , вы можете использовать perl :

$ echo 123 media 123 media 123456789 media 12 |perl -ne \
    'while (/(.{0,10}?media.{0,10}?)/g) { print "$1\n"; }'
123 media
 12345 media
234567890 media

Это немного изменяет регулярное выражение, чтобы включить соответствующую группу, чтобы мы могли ссылаться на согласованный текст позже. В противном случае это просто цикл для каждого совпадения ( g соответствует глобально, а не только в первый раз), который затем печатает совпадение с новой строкой.

GNU vs POSIX grep

GNU grep добавляет множество функций поверх стандартного grep POSIX . Конкретно для этого ответа: -A LINES (строки контекста a fter), -B LINES (строки контекста b efore) , -C LINES (строки c в тексте до и после), -o (показать o только совпадение) и -P (используйте P CRE) все доступны в GNU grep, но не могут использоваться для других реализаций grep. BSD grep поддерживает все из них, кроме -P , но GNU grep часто предпочитается пользователями BSD из-за оптимизации производительности GNU .

Команды GNU и BSD grep также поддерживают - color , который можно использовать как альтернативу -o . Это приведет к отображению целых строк с соответствующим цветом текста («медиа» плюс его 0–10 символов контекста).

Последнее замечание: в комментарии к вопросу использовался синтаксис . {, 5} , который работает в grep -E , но почти нигде больше (конечно, ни grep -P или perl ). Плохая привычка использовать этот формат вместо того, чтобы явно указывать ноль в . {0,5} .

Поиск нескольких экземпляров строки с контекстом из файла

Жадность

GNU vs POSIX grep

Теги

Похожие вопросы