Разбор данных на основе количества цифр в кавычках

Question

Разбор данных на основе количества цифр в кавычках

У меня есть большой объем данных в текущем формате:

a:7:{i:0;s:4:"9999";i:1;s:4:"10000";i:2;s:4:"10001";i:3;s:4:"10002";i:4;s:4:"10003";i:5;s:4:"10004";i:6;s:4:"989";}

Числа внутри "" перед ними имеют s:4. Для чисел, которые имеют длину 3 цифры, это должно быть изменено на s:3, а цифры длиной 5 должны быть s:5 и т. д.

Преобразованные данные должны выглядеть следующим образом:

a:7:{i:0;s:4:"9999";i:1;s:5:"10000";i:2;s:5:"10001";i:3;s:5:"10002";i:4;s:5:"10003";i:5;s:5:"10004";i:6;s:3:"989";}

Каждая строка данных {} находится на отдельной строке в data.txt

-1

text-processing

Teddy291 29.05.2019, 01:51

Ссылка

2 ответа

Похожие вопросы

0
разбор пар значений, разделенных двоеточием, с символами двоеточия в поле(ях) [закрыто] 12.05.2019
Я пытаюсь обработать вывод команды nmcli (значения, разделенные двоеточием), но не удается обработать / игнорировать двоеточия в MAC или BSSID. Я пробовал awk, jq, sed, regex, но просто не получается... ...
2
условное выражение, раскрашивающее grep 26.05.2014
У меня есть простой сценарий удара. Одна строка моего сценария соответствует "шаблону" grep и окрашивает соответствие grep-i - color=always - "1$", я должен изменить его, так, чтобы это только окрасило соответствие, если...

Jim L. · Answer 1 · 28.01.2020, 05:09

#!/usr/bin/env bash

IFS=';'

while read LINE
do

        set -- $LINE

        while [ "$1" ]
        do
                if [[ $1 =~ ^s:[0-9]+:\".*\"$ ]]; then
                        s=${1##*:}
                        printf 's:%d:%s%s' $((${#s}-2)) "$s" "$IFS"
                else
                        printf '%s%s' "$1" "$IFS"
                fi
                shift

        done
        printf '\n'

done < data.txt

Этот скрипт устанавливает в качестве разделителя полей точку с запятой, а затем перебирает строки data.txt, разбивая каждую строку на отдельные поля по разделителю с запятой. Для полей, начинающихся сs:###:"..."(для произвольных значений ###и ...), сценарий вычисляет длину строки в кавычках и переформатирует поле, используя это значение длины и добавляя разделитель полей в конце. Поля, не соответствующие форме s:###:"...", выводятся дословно, снова добавляя разделитель завершающих полей.

a:7:{i:0;s:4:"9999";i:1;s:5:"10000";i:2;s:5:"10001";i:3;s:5:"10002";i:4;s:5:"10003";i:5;s:5:"10004";i:6;s:3:"989";};

steeldriver · Answer 2 · 28.01.2020, 05:09

Как насчет

perl -pe 's/s:\d+:"(.*?)"/sprintf("s:%d:\"%s\"",length($1),$1)/ge'

Пр.

$ echo 'a:7:{i:0;s:4:"9999";i:1;s:4:"10000";i:2;s:4:"10001";i:3;s:4:"10002";i:4;s:4:"10003";i:5;s:4:"10004";i:6;s:4:"989";}' | 
    perl -pe 's/s:\d+:"(.*?)"/sprintf("s:%d:\"%s\"",length($1),$1)/ge'
a:7:{i:0;s:4:"9999";i:1;s:5:"10000";i:2;s:5:"10001";i:3;s:5:"10002";i:4;s:5:"10003";i:5;s:5:"10004";i:6;s:3:"989";}

Вы можете добавить -iдля выполнения замены файла в месте -.

Разбор данных на основе количества цифр в кавычках

Теги

Похожие вопросы