Можно ли объединять строки на основе составных уникальных значений двух столбцов

Question

Можно ли объединять строки на основе составных уникальных значений двух столбцов

Используйте в своем пути $HOME, а не тильду (~), особенно если вы заключаете новый PATHв двойные кавычки. Тильда не расширяется, когда встречается в кавычках.

Тестирование:

$ mkdir "$HOME/t"

$ cat >"$HOME/t/foo" <

См. также:Почему тильда (~)не раскрывается внутри двойных кавычек?


                    
                        0
                        
                    
                    
                        command-line text-processing                    
                    
                    
                        404
                        23.03.2020, 10:54 
                    

                    Ссылка


            2 ответа


        
                    
        

            

            
                
                                    
            

            
                
                    
                        
                            
                                С помощью GNU datamashвы можете сделать:
datamash -t'|' groupby 1,3 collapse 2 < <(tail -n+3 file)
Выход:
Category code invalid|merchanta|03077,09877
Invalid ID|merchanta|12345
Invalid ID|merchantc|07323,03523
No valid reason|merchnatb|78653
Это группирует по первому и третьему полю и сворачивает значения второго поля. tail -n+3используется для пропуска двух строк заголовка. 
Вы можете использовать awk, чтобы поменять местами второй и третий столбец вывода, и head, чтобы добавить строки заголовка:
{
  head -n2 file
  datamash -t'|' groupby 1,3 collapse 2 < <(tail -n+3 file) | 
    awk 'BEGIN{OFS=FS="|"}{print $1,$3,$2}'
}
Выход:
Error Desc|RefNo|Merchant
===================================
Category code invalid|03077,09877|merchanta
Invalid ID|12345|merchanta
Invalid ID|07323,03523|merchantc
No valid reason|78653|merchnatb
                            
                            

                                0
                                
                            
                            
                            
                                Freddy
                                28.04.2021, 23:19 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                    
                        
                            
                                

                                                                    
                            
                        
                    
                    
                
                    
                        
                            
                                Наверное, я что-то упускаю — возможно, это можно сделать короче — но это работает:
awk '
    BEGIN   {   FS="|"; OFS="|" }
    NR <= 2
    NR > 2  {
                seen_desc[$1]++
                seen_merc[$3]++
                if (ref[$1,$3] == "")
                        ref[$1,$3] = $2
                else
                        ref[$1,$3] = ref[$1,$3] "," $2
            }
    END     {
                for (desc in seen_desc) {
                        for (merc in seen_merc) {
                                if (ref[desc,merc] != "") {
                                        print desc, ref[desc,merc], merc
                                }
                        }
                }
            }'
                            
                            

                                0
                                
                            
                            
                            
                                G-Man Says 'Reinstate Monica'
                                28.04.2021, 23:19 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                        
                Теги
                
                    command-line text-processing                

                Похожие вопросы
                
                    
                                                    
                                12 
                                 bash: безопасное для пробелов процедурное использование find в select  13.07.2017 
                                 Учитывая эти имена файлов: $ ls -1
файл
имя файла
otherfile Сам bash отлично справляется со встроенными пробелами: $ for file in *; сделать echo "$ file"; Выполнено
файл
имя файла
другой файл
$ select file in *; ... 
                            

                                                        
                                0 
                                Установите несколько переменных в разные поля вывода awk  09.12.2020 
                                У меня есть большой набор инициализаций переменных, которые, я думаю, можно было бы значительно сократить. Анализируемый файл ниже:--------------------Статистика ACL на интерфейс ----------------------... 
                            

                                                        
                                1 
                                Сочетания клавиш в CLI в качестве псевдонимов или сценариев 06.11.2019 
                                Можно ли взять сочетание клавиш/сочетание клавиш и превратить его в команду CLI или интегрировать это сочетание клавиш/сочетание клавиш в сценарий, который затем можно выполнить в BASH? Я знаю, что это было бы...
                            

                                                        
                                0 
                                 Печатайте максимум n символов в строке, но без вырезания  27.03.2017 
                                 У меня проблема: у меня есть текстовый файл, в котором в каждой строке разное количество символов, например: aaaa
bbbbbbbbb
cc Теперь я хочу сгенерировать новый текстовый файл, в котором строка содержит максимум N ... 
                            

                                                        
                                -1 
                                Как получить быстрый результат для 10 крупнейших каталогов  03.02.2021 
                                У меня есть каталог (точка монтирования )размером 9T, и я хотел бы получить каждый размер каталога, особенно тот, который занимает больше места. Для этого я использую команду ниже и помещаю результат в... 
                            

                                                        
                                0 
                                Найти в заданном каталоге, если существуют 2 файла с одинаковым содержимым независимо от их имен  28.01.2019 
                                , если проблема может быть решена с помощью ряда команд в командной строке, для меня было бы лучше, чем писать скрипт 
                            

                                                        
                                24 
                                Как я добавляю текст к началу и концу нескольких текстовых файлов в Bash? 15.10.2016 
                                У меня есть каталог, полный текстовых файлов. Моя цель состоит в том, чтобы добавить текст к началу и концу всех их. Текст, который идет вначале и конец, является тем же для каждого файла. На основе кода я добрался...

Freddy · Answer 1 · 28.04.2021, 23:19

С помощью GNU datamashвы можете сделать:

datamash -t'|' groupby 1,3 collapse 2 < <(tail -n+3 file)

Выход:

Category code invalid|merchanta|03077,09877
Invalid ID|merchanta|12345
Invalid ID|merchantc|07323,03523
No valid reason|merchnatb|78653

Это группирует по первому и третьему полю и сворачивает значения второго поля. tail -n+3используется для пропуска двух строк заголовка.

Вы можете использовать awk, чтобы поменять местами второй и третий столбец вывода, и head, чтобы добавить строки заголовка:

{
  head -n2 file
  datamash -t'|' groupby 1,3 collapse 2 < <(tail -n+3 file) | 
    awk 'BEGIN{OFS=FS="|"}{print $1,$3,$2}'
}

Выход:

Error Desc|RefNo|Merchant
===================================
Category code invalid|03077,09877|merchanta
Invalid ID|12345|merchanta
Invalid ID|07323,03523|merchantc
No valid reason|78653|merchnatb

G-Man Says 'Reinstate Monica' · Answer 2 · 28.04.2021, 23:19

Наверное, я что-то упускаю — возможно, это можно сделать короче — но это работает:

awk '
    BEGIN   {   FS="|"; OFS="|" }
    NR <= 2
    NR > 2  {
                seen_desc[$1]++
                seen_merc[$3]++
                if (ref[$1,$3] == "")
                        ref[$1,$3] = $2
                else
                        ref[$1,$3] = ref[$1,$3] "," $2
            }
    END     {
                for (desc in seen_desc) {
                        for (merc in seen_merc) {
                                if (ref[desc,merc] != "") {
                                        print desc, ref[desc,merc], merc
                                }
                        }
                }
            }'