Замените первый столбец файла на вывод команды

Question

Замените первый столбец файла на вывод команды

Это полезно, когда используются неанглийские (неascii) символы. Пример ch, который вы упомянули, является диграфом, т.е. некоторые языки имеют в своем алфавите букву, которая представлена/может быть представлена двумя буквами английского алфавита.

Когда вы используете [.ch.] в регексп, вы, по сути, говорите: "Я ожидаю неанглийскую входную последовательность с диграфом ch. Я хочу, чтобы мой регексп соответствовал единственному символу ch". Мой язык программирования/движок регекса/клавиатура не позволяют мне написать знак этого диграфа, поэтому я набираю [.ch.]. Я не имею в виду c, за которым следует h. Пожалуйста, найдите только те случаи, когда диграф встречается в виде одного символа"

.

[[.ch.]] означает, что диграф является частью набора символов. В данном случае фактически только один символ. Просто стандартная нотация regexp.

5

awk sed text-processing

Community 13.04.2017, 15:36

Ссылка

6 ответов



                                    
                        
                            
                                

                                                                    
                            
                        
                    
                    
                
                    
                        
                            
                                 Если у вас есть GNU awk ( gawk ), вы можете заменить столбец, используя вывод команды, используя форму  getline / variable / pipe  из  getline  для вывода функции  date : 

gawk '{"date +%d/%m/%Y -d" $1 | getline $1} 1' file


 Однако, если вы просто хотите изменить формат даты столбца, вы можете сделать это изначально, используя внутренний  Функции mktime  и  strftime : 

gawk '{
  d = sprintf("%d %02d %02d 0 0 0", substr($1,1,4), substr($1,5,2), substr($1,7,2));
  t = mktime(d);
  $1 = strftime("%d/%m/%Y", t);
  } 1' file


 хотя в этом случае вы можете выполнить необходимое преобразование, используя простые манипуляции со строками (которые должны работать в любом варианте  awk ): 

$ mawk '{$1 = sprintf("%02d/%02d/%02d", substr($1,7,2), substr($1,5,2), substr($1,1,4))} 1' file
01/01/2007 10.2317 79.1638 6.0 26.7 20.9 0.8 14.0 98.6
02/01/2007 10.2317 79.1638 5.6 26.5 20.8 1.9 13.6 98.0
03/01/2007 10.2317 79.1638 7.5 27.7 20.8 0.1 15.8 96.4
04/01/2007 10.2317 79.1638 8.1 26.0 19.6 0.0 15.5 94.1
                            
                            

                                2
                                
                            
                            
                            
                                steeldriver
                                27.01.2020, 20:34 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                
                
                    
                        
                            
                                sed 's| *\(....\)\(..\)\(..\)|\2/\3/\1|' < in > out
                            
                            

                                2
                                
                            
                            
                            
                                mikeserv
                                27.01.2020, 20:34 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                
                
                    
                        
                            
                                 Модификатор GNU sed  e  val для команды  s  позволит вам использовать  date  для преобразования дат по мере необходимости: 

sed -r 's|(\S+)(.*)|date -d \1 "+%d/%m/%y \2"|e'


 Подставляемое выражение правильно сформированная команда даты. Модификатор  e  заставляет это выполняться для каждой строки, и буфер шаблона (и, следовательно, вывод) заменяется выводом каждой команды даты. 
                            
                            

                                2
                                
                            
                            
                            
                                Digital Trauma
                                27.01.2020, 20:34 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                
                
                    
                        
                            
                                 Хотя это может показаться не лучшим решением, я бы выбрал другое решение, например, используя такую обработку параметров bash: 

gv@debi64:$ a="20070101"; b="${a: -2:2}/${a: -4:2}/${a: 0:4}";echo $b
01/01/2007


 Затем я мог бы прочитать файл и используя что-то вроде  sed -i "s / $ a / $ b / g" , я могу добиться того, что вам нужно: 

gv@debi64:$ cat a.txt
20070101 10.2317  79.1638   6.0  26.7  20.9   0.8  14.0  98.6
20070102 10.2317  79.1638   5.6  26.5  20.8   1.9  13.6  98.0
20070103 10.2317  79.1638   7.5  27.7  20.8   0.1  15.8  96.4
20070104 10.2317  79.1638   8.1  26.0  19.6   0.0  15.5  94.1

gv@debi64:$ while IFS=" " read -r df rest;do ndf="${df: -2:2}/${df: -4:2}/${df: 0:4} "; sed -i "s#$df#$ndf#g" a.txt;done <a.txt

gv@debi64:$ cat a.txt
01/01/2007  10.2317  79.1638   6.0  26.7  20.9   0.8  14.0  98.6
02/01/2007  10.2317  79.1638   5.6  26.5  20.8   1.9  13.6  98.0
03/01/2007  10.2317  79.1638   7.5  27.7  20.8   0.1  15.8  96.4
04/01/2007  10.2317  79.1638   8.1  26.0  19.6   0.0  15.5  94.1
                            
                            

                                1
                                
                            
                            
                            
                                George Vasiliou
                                27.01.2020, 20:34 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                
                
                    
                        
                            
                                 Если желаемое преобразование - это просто переупорядочивание существующей информации, почему бы не сделать 

awk '{ $1=sprintf("%02i/%02i/%04i",
     substr($1, 7, 2), substr($1, 5, 2), substr($1, 1, 4)) }1' file


 Мы поднимаем подстроки из первого поля и повторно собираем их в новое значение для первого поля, а затем печатаем всю строку ввода как обычный. (Одиночный  1  после закрывающей фигурной скобки является стандартной идиомой Awk для безусловной печати.) 

 Вы, вероятно, пожалеете о преобразовании идеально хороших машиночитаемых дат в  "удобочитаемых человеком"  правда, очень скоро. 
                            
                            

                                2
                                
                            
                            
                            
                                Ḿád Ḿőíśéĺĺé
                                27.01.2020, 20:34 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                        
                Теги
                
                    awk sed text-processing                

                Похожие вопросы
                
                    
                                                    
                                2 
                                sed :Замена текстового шаблона, содержащего обратную косую черту  09.11.2020 
                                У меня возникла проблема с sed, которую мне удалось воссоздать с помощью следующего простого примера. Рассмотрим следующий входной файл (input.txt ):C :\A\quick\brown\fox\ перепрыгивает через ленивую собаку C :\A\быстро\... 
                            

                                                        
                                3 
                                Печать в awk до определенной строки и еще 5 результатов 19.04.2014 
                                Я пытаюсь распечатать все строки до появления конкретной песни и еще 5 песен с этим. Проблема я плохо знаком с оболочкой, что я должен зафиксировать в командах рева? ИМЯ РАЗРЯДА...
                            

                                                        
                                4 
                                 Вставить несколько строк перед определенной строкой с помощью команды sed 25.02.2018 
                                У меня следующий файл 

 /usr/local/texlive/2017/texmf-dist/fonts/opentype <... 
                            

                                                        
                                0 
                                Как указать путь с подстановочным знаком  26.08.2020 
                                Мой путь содержит /home/user/data/foo/test _foo.gz /home/user/data/bar/test _bar.gz /home/user/data/fub/test _fub.gz и так далее... Я пытаюсь напечатать 3-ю строку всех файлов.gz zcat /дом/пользователь/... 
                            

                                                        
                                1 
                                Заменить строку после определенной строки 22.08.2019 
                                Я хочу заменить строку «редактировать ПОПЫТКИ 2» на «редактировать ПОПЫТКИ 3» после строки, содержащей строку «задача Слушать» задача Слушать редактировать ПОПЫТКИ 2 Как я могу сделать это с sed? Строка "edit ...
                            

                                                        
                                0 
                                Авк, если ошибка условия  22.12.2020 
                                Я написал awk-команду, которая фильтрует по условию. awk '{if(((substr ($0,9,3 )== "TGO" )&& ((substr ($0,1,4 )== "9123" || (substr ($0,1,4 )== "9704" ))... 
                            

                                                        
                                1 
                                Как выбрать только информацию, начинающуюся с шаблона в столбце, и печатать в другом  23.06.2021 
                                У меня есть файл данных A.tsv (разделитель полей = \t):мутация клады id 243 40A S :ojo,L :juju,S :lili 254 267 40B J :jijy,S :asel,M :ase А я хочу напечатать в другом столбце (в новом файле B.tsv )...

Kusalananda · Accepted Answer · 27.01.2020, 20:34

Давайте воспользуемся уже существующим циклом (на который я еще не смотрел, но который, похоже, выполняет свою работу):

for i in $(awk '{print $1}' filedate.txt); do date -d "$i"  +%d/%m/%Y; done

А затем заправьте мой ответ на этот другой вопрос с небольшими изменениями:

for i in $(awk '{print $1}' filedate.txt); do date -d "$i"  +%d/%m/%Y; done |
paste - <( cut -d ' ' -f 2- filedate.txt )

Результат:

01/01/2007      10.2317  79.1638   6.0  26.7  20.9   0.8  14.0  98.6
02/01/2007      10.2317  79.1638   5.6  26.5  20.8   1.9  13.6  98.0
03/01/2007      10.2317  79.1638   7.5  27.7  20.8   0.1  15.8  96.4
04/01/2007      10.2317  79.1638   8.1  26.0  19.6   0.0  15.5  94.1

Короче, без цикла:

date -f <( cut -d ' ' -f 1 filedate.txt ) +"%d/%m/%Y" |
paste - <( cut -d ' ' -f 2- filedate.txt )

Без трубы:

paste <( date -f <( cut -d ' ' -f 1 filedate.txt ) +"%d/%m/%Y" ) \
      <( cut -d ' ' -f 2- filedate.txt )

Все эти примеры, очевидно, требуют либо ] bash или ksh или любая другая оболочка, которая понимает подстановки процессов. Также требуется дата GNU .



 См.  мой ответ на этот другой вопрос  для объяснения того, как это работает.