Переформатирование столбцов CSV с помощью SED (или любого другого coreutil)

Question

Переформатирование столбцов CSV с помощью SED (или любого другого coreutil)

Если столбцы разделены табуляцией (похоже, что они это делают), то это должно работать:

$awk -F "[\t]*" '{print $1", "$2", "$3", "$4", "}' b.txt
smmsp, Purpose - Service account for Sendmail; Owner - sysadmin; SERVICE ACCOUNT, n, Account expires : never,

Если столбцы разделены не табуляциями, а пробелами , то использование пробела в качестве разделителя немного сбивает с толку, поскольку пробел существует даже между данными.

Я бы прочитал файл и сохранил его в таком массиве:

$while IFS=" " read -a line;do for i in {0,11,12,16};do line[$i]+=",";done;echo "${line[@]}";done <b.txt
smmsp, Purpose - Service account for Sendmail; Owner - sysadmin; SERVICE ACCOUNT, n, Account expires : never,
smmsp, Purpose - Service account for Sendmail; Owner - sysadmin; SERVICE ACCOUNT, n, Account expires : never,
smmsp, Purpose - Service account for Sendmail; Owner - sysadmin; SERVICE ACCOUNT, n, Account expires : never,
smmsp, Purpose - Service account for Sendmail; Owner - sysadmin; SERVICE ACCOUNT, n, Account expires : never,
smmsp, Purpose - Service account for Sendmail; Owner - sysadmin; SERVICE ACCOUNT, n, Account expires : never,

Я заметил, что с точки зрения разделения пробелов мне нужно добавить запятую в элементы массива: строка [0], строка [11], строка [ 12] и строка [16].

Этот трюк требует, чтобы все строки имели одинаковый формат.
Если нет, вам нужно прочитать каждый элемент массива и вставить запятую в нужное место.

Если у вас много строк и вы заботитесь о производительности, вы можете создать сценарий awk для обработки всех переменных (от $ 1 до $ NF) аналогичным образом, но внутри сценария awk (я плохо разбираюсь в awk ..)

6

sed text-processing

chaos 06.01.2016, 09:40

Ссылка

3 ответа



                
                
                    
                        
                            
                                 Без использования  sed . Я скопировал ваш ввод и вставил его в Libreofffice Calc, выбрал опцию «разделить запятыми» в «Специальная вставка» и поместил каждый тип данных в отдельные столбцы, как показано ниже. 

 Думаю, очень простое решение. 

7241    11111111111111100000000000000000    \01-data\file1 

1237241 22222222222222200000000000000000    \01-data\file2

41      33333333333333300000000000000000    \01-data\file3
                            
                            

                                0
                                
                            
                            
                            
                                Jakuje
                                27.01.2020, 20:22 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                        
                Теги
                
                    sed text-processing                

                Похожие вопросы
                
                    
                                                    
                                1 
                                 Как работать со всеми столбцами с кешем данных?  22.02.2018 
                                 Предположим, у меня есть следующий файл данных: 111 222 333
444 555 666
777 888 999 Я могу вычислить сумму для каждого столбца с помощью GNU Datamash следующим образом: cat foo |  datamash -t \ сумма 1 сумма 2 сумма 3
1332 1665 ... 
                            

                                                        
                                2 
                                Как мне обработать весь файл в одном буфере в sed без опции GNU -z? 03.08.2019 
                                Для некоторых проблем, таких как сопоставление шаблона с неизвестным количеством строк или «заменить последнее вхождение ...", опция -z GNU sed действительно полезна. Как я могу добиться того же переносимого? ...
                            

                                                        
                                0 
                                извлечь определенную подстроку  21.08.2021 
                                У меня есть такой файл 
                            

                                                        
                                -1 
                                как извлечь строку с помощью регулярного выражения с помощью grep?  12.03.2020 
                                скажем, у меня есть SQL.txt select *из table1; выберите a,b,c из таблицы2, где a=1; Как я могу отфильтровать имя таблицы с помощью команды cat SQL.txt|grep? Мой ожидаемый результат: :table1 table2 я новичок... 
                            

                                                        
                                1 
                                Использование команды sed для печати с четвертой до предпоследней строки? 12.03.2020 
                                Как я могу печатать с четвертой по предпоследнюю строку с помощью команды sed?
                            

                                                        
                                0 
                                команда sed для удаления строки, содержащей символы /,\  03.12.2020 
                                У меня есть строка /abc/gef \ *(cse,fff )для удаления из файла,должны совпадать с шаблоном полной строки,пробовал с sed -i '//abc/gef \ *(cse,fff )/d' имя файла, но это заканчивается ошибкой :sed:-... 
                            

                                                        
                                12 
                                Вставка текста в определенный номер строки 22.03.2016 
                                Я работаю над сценарием bash, который будет разбивать содержимое текстового документа в зависимости от данных в строке. Если содержимое исходного файла было таким: 01 строка
01 строка
02 строка
...

mikeserv · Answer 1 · 27.01.2020, 20:22

sed -e:, -e's/^[^,]\{0,6\},/ &/;t,'

Он просто делает небольшой цикл, пока в начале строки не будет по крайней мере 7 незапятых. Однако он вообще ничего не делает, только если там уже есть менее 7 не-запятых, за которыми сразу следует запятая. Поэтому он не влияет на пустые строки или строки, в которых нет запятой, или те, в которых она есть, но уже начинается с 7 или более не-запятых.

Цикл также очень дешев - автомату нужно учитывать только два типа символов - те, которые являются или не являются запятыми - и только 7 из них максимум в любой момент времени.

   7241,11111111111111111111111111111111,\01-data\file1
1237241,22222222222222222222222222222222,\01-data\file2
     41,33333333333333333333333333333333,\01-data\file3

chaos · Answer 2 · 27.01.2020, 20:22

С awk:

awk -v l="$(wc -L <file)" '{printf "%"l"s\n", $0}' file

-v присваивает внешнее значение переменной awk l.
- wc -L найти длину самой длинной строки в файле.


printf "%"l "s\n", $0 печатает каждый пробел строки, заполненный l пробелами. Для 10 пробелов это будет выглядеть, например, так: printf "%10s\n", $0.





The output:

   7241,11111111111111111111111111111111,\01-data\file1
1237241,22222222222222222222222222222222,\01-data\file2
     41,33333333333333333333333333333333,\01-data\file3

Jakuje · Answer 3 · 27.01.2020, 20:22

Без использования sed . Я скопировал ваш ввод и вставил его в Libreofffice Calc, выбрал опцию «разделить запятыми» в «Специальная вставка» и поместил каждый тип данных в отдельные столбцы, как показано ниже.

Думаю, очень простое решение.

7241    11111111111111100000000000000000    \01-data\file1 

1237241 22222222222222200000000000000000    \01-data\file2

41      33333333333333300000000000000000    \01-data\file3