удалить повторяющиеся строки

Question

удалить повторяющиеся строки

Un documento aquí -es una redirección a la entrada estándar de un comando, al igual que <. Esto significa que en cualquier lugar donde pueda usar <para redirigir el contenido de un archivo, puede redirigir el contenido de un documento aquí -. El estándar POSIX enumera aquí -documentos junto con los otros operadores de redirección .

En su ejemplo de Ansible, ansible-playbookno lee de forma predeterminada su flujo de entrada estándar, ya que espera un nombre de archivo. Al darle /dev/stdincomo nombre de archivo y luego proporcionar el documento aquí -en la entrada estándar, elude esta restricción en la utilidad. El "archivo" /dev/stdinsiempre contendrá el flujo de datos de entrada estándar del proceso actual.

rubyy awk, así como muchas otras utilidades, leerán la entrada estándar a menos que se proporcione un nombre de archivo en la línea de comando.

Entonces, está técnicamente equivocado cuando dice "Parece que el shell piensa que el heredoc es un archivo con un contenido igual al valor del heredoc". No actúa como un archivo (con respecto a tener un nombre de archivo y ser buscable ), sino como un flujo de datos en la entrada estándar. Al menos desde el punto de vista de la utilidad.

La diferencia es la misma que entre

cat file

y

cat

En la primera instancia, catabre el archivo file, pero en la segunda (que es también lo que sucede con un documento here -), ya que no se dio ningún nombre de archivo como argumento para cat, catsimplemente lee su flujo de entrada estándar (y shell abre el archivo, o proporciona el documento aquí -, en la entrada estándar a la utilidad ). La utilidad no necesita saber si los datos proporcionados provienen de un archivo, una canalización, un documento aquí -o alguna otra fuente de datos.

Cómo aquí -los documentos son implementados por el shell es de alguna manera poco importante, pero puede ser a través del uso de un FIFO o incluso con un archivo temporal.


                    
                        0
                        
                    
                    
                                            
                    
                    
                        Anna1364
                        01.04.2019, 18:28 
                    

                    Ссылка


            3 ответа


        
                    
        

            

            
                
                                    
            

            
                
                    
                        
                            
                                Вы можете попробовать:
awk '{key = $4 < $7 ? $4 SUBSEP $7 : $7 SUBSEP $4} !seen[key]++' file
В нем хранится минимум, необходимый для удаления повторяющихся записей. 
!seen[key]++— «известная» идиома awk для печати записи только в первый раз, когда «ключ» виден. 
                            
                            

                                2
                                
                            
                            
                            
                                glenn jackman
                                28.04.2021, 23:35 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                    
                        
                            
                                

                                                                    
                            
                        
                    
                    
                
                    
                        
                            
                                Вы можете упорядочить тройки столбцов 2 -3 -4 и 5 -6 -7 по значению в первом столбце:
perl -lane '@F[1,2,3,4,5,6] = @F[4,5,6,1,2,3] if $F[1] > $F[4]; print "@F"'
Затем вы можете просто запустить sort -uдля удаления дубликатов (, но вам нужно указать особый регистр имен столбцов ). 
                            
                            

                                0
                                
                            
                            
                            
                                choroba
                                28.04.2021, 23:35 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                
                
                    
                        
                            
                                Уверенность в каждой строчке:
нет места до первого поля 
1 пробел между полями 
нет пробела в последнем поле 
от gnu sed, ваши данные в файле 'data'; 
sed -nE ':s G;/(\w+\s)(\w+\s)(\w+\s)(\S+\s)(\w+\s)(\w+\s)(\S+\s)(\w+)\n(.+\n)*\1\w+\s\6\7\w+\s\3\4\8/b; h;P' data
                            
                            

                                0
                                
                            
                            
                            
                                phx
                                28.04.2021, 23:35 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                        
                Теги
                
                                    

                Похожие вопросы
                
                    
                                                    
                                4 
                                Командная строка глобальная программа прокси? 21.05.2013 
                                Я живу в Китае, и большой веб-сервис не доступен или стабилен здесь как Github/Bitbucket/Imgur, Когда я использую wget, мерзавца или некоторые другие инструменты командной строки, мне нужно использование прокси. Есть ли любой...
                            

                                                        
                                11 
                                Как скопировать все мои настройки XFCE между настольной машиной и ноутбуком? 13.04.2017 
                                Кто-нибудь знает, как я могу скопировать мои настройки параметров XFCE плюс его внешний вид на другую машину? Настроек внешнего вида/дизайна, панелей, сочетаний клавиш и geany пока нет,... 
                            

                                                        
                                9 
                                Приоритет && по сравнению с и в ударе и zsh 13.04.2017 
                                При ответе на этот вопрос я обнаружил очень забавное (и тонкий) различие между поведением в ударе и zsh: В ударе: $ pwd/home/romano romano@RRyS:~ $ romano@RRyS:~ искажают x = "CD / мусорное ведро &&./...
                            

                                                        
                                4 
                                 Почему вам следует избегать «строго столбчатых» форматов ввода?  26.06.2015 
                                 Дуг Макилрой, изобретатель Unix-каналов и один из основателей традиции Unix в то время сказал следующее [McIlroy78]: (ii) Ожидайте, что выходные данные каждой программы станут исходными данными для ... 
                            

                                                        
                                1 
                                несколько обман преобразования к кровати с помощью bedtools 06.02.2014 
                                У меня есть десять .bam файлов (биоинформатический формат), и я хотел бы преобразовать его в 10 .bed файлов, но для этого преобразования я должен использовать специальный bedtools bamTobed-i команды (входной файл)> выходной файл....
                            

                                                        
                                6 
                                Не может создать “Привет Мировой” модуль (и NVIDIA и VirtualBox) 27.02.2019 
                                Прежде всего, детали. ПРЕЖДЕ: ядро: 3.2.0-2-amd64, драйвер Nvidia: 295.59 ПОСЛЕ: ядро: 3.2.0-3-amd64, драйвер Nvidia: 302.17-3 Мое хрипящее Debian сохранено недавним в любом случае. На самом деле, выполнение...
                            

                                                        
                                0 
                                 rsync --link-dest не работает должным образом с символическими ссылками  17.06.2016 
                                 Я использую rsync для резервного копирования некоторых моих файлов: rsync -aEN --delete --link- dest = "$ CURR /" "$ SOURCE /" "$ NEW /" Параметр --link-dest отлично работает с большинством файлов, но не с символическими ссылками.
Когда я писал ... 
                            

                                                        
                                0 
                                Поиск файла по алфавиту 11.06.2019 
                                Используя bash, мне в состоянии найти файл в определенной позиции при перечислении в алфавитном порядке. Например, если бы у меня были файлы a, b, c, d, e в каталоге, и я хотел бы найти третий файл, я...
                            

                                                        
                                1 
                                 Искать файлы в текущем каталоге, которые не соответствуют шаблону  11.09.2016 
                                 Как я могу изменить шаблон во второй инструкции, чтобы исключить вложенные каталоги? (так что ls возвращает только foo.mp4, а не содержимое bar :). $ ls *
foo.mp4 foo.ogg bar:
bar.ogg
$ shopt ... 
                            

                                                        
                                3 
                                Удалите файлы в каталоге, которые соответствуют regexp, с помощью терминала Mac 17.05.2011 
                                Как я удаляю файлы в каталоге, которые соответствуют данному regexp или аналогичному решению, с помощью терминала Mac?

glenn jackman · Accepted Answer · 28.04.2021, 23:35

Вы можете попробовать:

awk '{key = $4 < $7 ? $4 SUBSEP $7 : $7 SUBSEP $4} !seen[key]++' file

В нем хранится минимум, необходимый для удаления повторяющихся записей.

!seen[key]++— «известная» идиома awk для печати записи только в первый раз, когда «ключ» виден.