Получение вывода egrep -o в одной строке

В оболочке с массивами используйте их. Произнесите с помощью Bash:

$ touch {01..53}
$ files=(*)
$ echo "${files[@]:0:10}"       
01 02 03 04 05 06 07 08 09 10

$ for ((i = 0 ; i < ${#files[@]} ; i += 10 )) ; do
     echo "${files[@]:i:10}" ; 
     # or
     # cat "${files[@]:i:10}" > set-$(( i / 10 ))
  done
01 02 03 04 05 06 07 08 09 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
41 42 43 44 45 46 47 48 49 50
51 52 53

Расширение подстроки (срез массива) "${files[@]:i:10}" расширяется до списка слов, а не до одной строки , поэтому вы можете перебрать его:

for f in "${files[@]:i:10}" ; do
    somecmd "$f"
done

Don't do files=$(ls *.txt), ls здесь полностью избыточен, это оболочка который в любом случае оценивает подстановочный знак. Обычно вы просто сохраняете подстановочный шаблон в переменной (pat=*.txt) и используете его (без кавычек) там, где это необходимо, или, если вы хотите расширить его до фактических имен файлов, используйте echo *.txt вместо ls. Для обработки списков имен файлов лучше подходят массивы, если вы не ограничены простой оболочкой POSIX.


Что касается разделения списка на head и tail, вам нужно сделать что-то вроде | голова -20 | tail -10 для получения строк с 11 по 20. Или используйте sed: | сед -н 11,20р.

0
16.06.2017, 11:50
2 ответа

Похоже, вы хотите получить все значения после : и соединить их с помощью пробела или табуляции

perl — это один из вариантов

$ perl -lne 'print join "\t",/:\h*\K[^ ]+/g' output
44.75TB 0.44TB  42.04TB 6.07%
  • /:\h*\K[^ ]+/g получит непробельные символы, которые присутствуют после : и необязательных горизонтальных пробелов.
    • используйте \H вместо [^ ], если разделение полей может содержать символы табуляции
  • join "\t", объединит совпавшие строки с табуляцией в качестве разделителя


Чтобы получить только числа

$ perl -lne 'print join "\t",/:\h*\K[\d.]+/g' output
44.75   0.44    42.04   6.07
  • предполагает, что числа состоят только из цифр и десятичной точки и не проверяют правильность, он будет соответствовать даже 1.324.4, ... etc, который следует после : и необязательных пробелов
2
28.01.2020, 02:25

Мы можем рассматривать строку ввода как несколько записей, каждая из которых разделена двумя или более пробелами. Каждая запись может быть разделена на два поля на основе двоеточий и любого одиночного пробела после него. Нам нужно второе поле в каждой такой записи.

С GNUawk(или mawk, но не nawk, который не любит регулярные выражения в качестве разделителей записей):

$ awk -vRS="   *|\n" -vFS=": ?" -vORS=" " '{ print $2 } END { printf("\n") }' data.in
44.75TB 0.44TB 42.04TB 6.07%
  • RS=" *|\n"устанавливает в качестве разделителя записей два или более пробела или новую строку. Это разбивает Total: 44.75TB Used: 0.44TBна две записи: Total: 44.75TBи Used: 0.44TB.
  • FS=": ?"устанавливает в качестве разделителя полей двоеточие, за которым может следовать пробел. Это разбивает Used: 0.44TBна два поля: Usedи 0.44TB.
  • ORS=" "устанавливает разделитель записей вывода на пробел.

Код awkпросто печатает второе поле каждой записи, разделенное символом ORS, и заканчивает выводом новой строки.

Если вы хотите удалить из этого все, что не является числом, просто пропустите его черезtr -dc '0-9. \n':

$ awk -vRS="   *|\n" -vFS=": ?" -vORS=" " '{ print $2 } END { printf("\n") }' data.in | tr -dc '0-9. \n'
44.75 0.44 42.04 6.07

tr -dc '0-9. \n'удалит все, что не является цифрой, точкой, пробелом или новой строкой.

1
28.01.2020, 02:25

Теги

Похожие вопросы