Удалить столбцы с разделителями табуляции, соответствующие подстроке в первой строке

Question

Удалить столбцы с разделителями табуляции, соответствующие подстроке в первой строке

Вы не можете ссылаться на переменную awk внутри регулярного выражения /regex/.

Если вы хотите проверить наличие префикса POSIXly, используйте вместо этого функцию index():

FN="fileA_someprefix_20160101.txt" awk 'index(ENVIRON["FN"], $1) == 1'

Из POSIX specs для awk:

index(s, t) Возвращает позицию, в символах, нумерация от 1, в строке s, где впервые встречается строка t, или ноль, если она не встречается вообще.


                    
                        0
                        
                    
                    
                                            
                    
                    
                        Inian
                        27.05.2019, 15:52 
                    

                    Ссылка


            2 ответа


        
                    
        

            

            
                
                                    
            

            
                
                    
                        
                            
                                awk -F '\t' -f script.awk file
где script.awkэто 
BEGIN { OFS = FS }

FNR == 1 {
    for (i = 1; i <= NF; ++i)
        if ($i !~ /_HET/)
            keep[i] = 1
}

{
    nf = split($0, fields, FS)
    $0 = ""
    j = 0

    for (i = 1; i <= nf; ++i)
        if (i in keep)
            $(++j) = fields[i]

    print
}
Это сначала анализирует заголовки в первой строке и запоминает, какие из них мы хотим сохранить в ассоциативном массиве keep. 
Затем для каждой строки он повторно -создает текущую запись (строку )только из тех полей, которые мы хотим сохранить, и распечатывает ее. 
Это делается с помощью (re -)разделения строки текущего разделителя полей на массив fields, затем очистки всех полей (с помощью $0 = ""; это сбрасываетNF)и, наконец, назначает только поля из fields, которые являются ключами в массиве keep. 
Некоторым нравится один -вкладыш:
awk -F '\t' -v OFS='\t' 'FNR==1{for(i=1;i<=NF;++i)if($i!~/_HET/)k[i]=1}{n=split($0,f,FS);$0=j="";for(i=1;i<=n;++i)if(i in k)$(++j)=f[i]}1' file
Я не полностью следовал вашему коду, но $i=="_HET"сравнит i:-е поле со строкой _HET. Этот тест завершится ошибкой, если значение поля не равно точно _HET(, а ни одно из ваших полей заголовка не равно ).
Совершенно другой подход:
cut -f "$( awk -F '\t' -v OFS="," '{for(i=1;i<=NF;++i)if($i!~/_HET/)k[i]=1;$0="";for(i in k)$(++j)=i;print;exit}' file )" file
Здесь используется программа awk
BEGIN { OFS = "," }

{
    for (i = 1; i <= NF; ++i)
        if ($i !~ /_HET/)
            keep[i] = 1

    $0 = ""

    for (i in keep)
        $(++j) = i

    print
    exit
}
не выводить содержимое требуемых столбцов, а выводить их номера столбцов в виде строки, -разделенной запятыми. Затем эта строка используется cutдля вырезания столбцов из данных. 
                            
                            

                                2
                                
                            
                            
                            
                                Kusalananda
                                28.01.2020, 02:30 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                    
                        
                            
                                

                                                                    
                            
                        
                    
                    
                
                    
                        
                            
                                Вы можете сделать это с помощью Perl, как показано:
$ perl -F'/\t/' -pale '$"="\t";
    $. == 1 and @A = grep { $F[$_] !~ /_HET/ } 0.. $#F;
    $_ = "@F[@A]";
' input.tsv
                            
                            

                                0
                                
                            
                            
                            
                                Rakesh Sharma
                                28.01.2020, 02:30 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                        
                Теги
                
                                    

                Похожие вопросы
                
                    
                                                    
                                1 
                                 Визуализация необработанных битов  disk  05.03.2018 
                                 Есть ли команда, которая позволяет мне "видеть" необработанные биты диска?  Другими словами, игнорировать файловую систему и выводить «общую картину» буквальных нулей и единиц на диске.  (В идеале нет ... 
                            

                                                        
                                33 
                                Как часто proc файловая система обновляется на Linux? 05.05.2013 
                                Как часто proc файловая система обновляется на Linux? Это - 20 миллисекунд (квант времени)?
                            

                                                        
                                2 
                                Выделение памяти для разреженного массива в awk 03.10.2016 
                                Я искал, но не достиг ни к какому заключению, которое, когда я определил разреженный массив, делает он резервирует всю непрерывную память до максимального индекса, или он выделяет память в том конкретном индексе...
                            

                                                        
                                0 
                                 Проблема crontab в ubuntu 1804  15.02.2019 
                                 У меня проблема с тем, чтобы мой crontab работал на моем сервере ubuntu 18.04, работающем как экземпляр amazon ec2. В моем файле / etc / crontab есть следующая строка: * / 15 * * * * root / bin / bash / home / ... 
                            

                                                        
                                0 
                                 Короткий путь к `cd` во 2-ю папку в каталоге  11.02.2019 
                                CONTEXT Я нахожусь в каталоге с 3-мя папками.
После выполнения ls -1 они упорядочены так: folder1
папка2
папка3 Я хочу быстро cd в папку2. Я смог написать функцию для быстрого cd ... 
                            

                                                        
                                2 
                                Как найти и подсчитать совпадающие данные для столбца ID в двух файлах? 01.02.2020 
                                У меня есть два набора генетических данных с совпадающими идентификаторами положения хромосом. Я хочу подсчитать, сколько раз идентификаторы положения хромосомы файла 1 появляются в файле 2. Например, мои данные выглядят так: Файл 1 (...
                            

                                                        
                                5 
                                 Тачпад не работает в Debian 9  01.04.2019 
                                 Я только что установил Debian 9 на Lenovo S130-14IGM, но тачпад вообще не работает. 
В Ubuntu с этим нет проблем. Вот результаты для двух операционных систем: Ubuntu # egrep -... 
                            

                                                        
                                1 
                                Почему я не получаю Gnome GUI, когда я устанавливаю Red Hat? 25.12.2013 
                                Я пытаюсь установить Red Hat в своей системе Windows, но я сталкиваюсь с проблемой. Я получаю только одну опцию во время установки, которая "Минимальна" и даже если я регистрирую рабочий стол Gnome, настраивают опции, я только...
                            

                                                        
                                2 
                                Как запустить процесс sudo с помощью nohup?  10.05.2021 
                                Как выполнить команду sudo с помощью nohup? Я хочу выполнить команду sudo, а затем завершить сеанс ssh, но не прерывая и не останавливая процесс. Я пробовал это, но это не работает судо... 
                            

                                                        
                                1 
                                Как инструменты графического пользовательского интерфейса и оконные менеджеры используют сервер отображения?  25.07.2020 
                                Я пытаюсь понять, как различные компоненты системы Linux взаимодействуют со службами, предлагаемыми сервером отображения. Прежде чем усложнять вопрос с серверами отображения на базе Wayland -, позвольте мне….

Kusalananda · Accepted Answer · 28.01.2020, 02:30

awk -F '\t' -f script.awk file

где script.awkэто

BEGIN { OFS = FS }

FNR == 1 {
    for (i = 1; i <= NF; ++i)
        if ($i !~ /_HET/)
            keep[i] = 1
}

{
    nf = split($0, fields, FS)
    $0 = ""
    j = 0

    for (i = 1; i <= nf; ++i)
        if (i in keep)
            $(++j) = fields[i]

    print
}

Это сначала анализирует заголовки в первой строке и запоминает, какие из них мы хотим сохранить в ассоциативном массиве keep.

Затем для каждой строки он повторно -создает текущую запись (строку )только из тех полей, которые мы хотим сохранить, и распечатывает ее.

Это делается с помощью (re -)разделения строки текущего разделителя полей на массив fields, затем очистки всех полей (с помощью $0 = ""; это сбрасываетNF)и, наконец, назначает только поля из fields, которые являются ключами в массиве keep.

Некоторым нравится один -вкладыш:

awk -F '\t' -v OFS='\t' 'FNR==1{for(i=1;i<=NF;++i)if($i!~/_HET/)k[i]=1}{n=split($0,f,FS);$0=j="";for(i=1;i<=n;++i)if(i in k)$(++j)=f[i]}1' file

Я не полностью следовал вашему коду, но $i=="_HET"сравнит i:-е поле со строкой _HET. Этот тест завершится ошибкой, если значение поля не равно точно _HET(, а ни одно из ваших полей заголовка не равно ).

Совершенно другой подход:

cut -f "$( awk -F '\t' -v OFS="," '{for(i=1;i<=NF;++i)if($i!~/_HET/)k[i]=1;$0="";for(i in k)$(++j)=i;print;exit}' file )" file

Здесь используется программа awk

BEGIN { OFS = "," }

{
    for (i = 1; i <= NF; ++i)
        if ($i !~ /_HET/)
            keep[i] = 1

    $0 = ""

    for (i in keep)
        $(++j) = i

    print
    exit
}

не выводить содержимое требуемых столбцов, а выводить их номера столбцов в виде строки, -разделенной запятыми. Затем эта строка используется cutдля вырезания столбцов из данных.