Фильтрация.CSV файла на основе последовательных чисел в строке

Question

Фильтрация.CSV файла на основе последовательных чисел в строке

Вы можете использовать функцию командной строки Bash .

$ ls -l [a-k]*

[A-K] относится к алфавитам из A к K .
* относится к любому характеру любое количество раз.

Так что теперь Bash ищет файлы, начиная с буквы A - k и с последующим любым символом любое количество раз.

-1

text-processing sed awk

G-Man Says 'Reinstate Monica' 14.10.2014, 23:12

Ссылка

3 ответа

Если вы можете использовать Perl :

$ perl -F, -anle '
    map { s/\D//g } @F;
    print if ++$F[2] == $F[4] and ++$F[6] == $F[8];
' file
RZ_AUTO_1, 1cx0, C118, B, C119, B, A165, B, A166, B, CC/AA Canonical ribose-zipper
RZ_AUTO_2, 1drz, C118, B, C119, B, A165, B, A166, B, CC/AA Canonical ribose-zipper
RZ_AUTO_3, 1ffk, C208, 0, G209, 0, A665, 0, A666, 0, CG/AA Canonical ribose-zipper

1

28.01.2020, 05:09

Ссылка

Этот скрипт Bash делает то, что вы хотите, но не используете только SED и awk . Я уверен, что было бы потрачено больше времени в разработке этого, это может быть дополнительно уточнено, но он, примерно, делает то, что вы хотите.

$ more cmd.bash 
#!/bin/bash

while read line; do 
    f1=$(echo "$line" | awk -F", " '{print $3}')
    f2=$(echo "$line" | awk -F", " '{print $7}')
    echo "$line" | grep  "${f1}.*$(expr ${f1:2} + 1).*${f2}.*$(expr ${f2:2} + 1)"
done <file

Пример пробега

$ ./cmd.bash 
RZ_AUTO_1, 1cx0, C118, B, C119, B, A165, B, A166, B, CC/AA Canonical ribose-zipper
RZ_AUTO_2, 1drz, C118, B, C119, B, A165, B, A166, B, CC/AA Canonical ribose-zipper
RZ_AUTO_3, 1ffk, C208, 0, G209, 0, A665, 0, A666, 0, CG/AA Canonical ribose-zipper

Слабые стороны

Одна область, где она должна быть дополнительно расширена, находится в выборе совпадений в GREP . Это может привести к ложным позитикам в его текущей форме. Это может быть сделано лучше, используя инструмент такого awk или путем повышения структуры, который GREP использует для соответствия строкам.

0

28.01.2020, 05:09

Ссылка

Похожие вопросы

1
Обновить строки, ссылаясь на другой файл 15.05.2019
У меня есть два файла, разделенных запятыми, как указано ниже, cat source.txt A, 1000 B , 3000 C, 2500 D, 5000 E, 4000 F, 3000 cat test.txt A, 1000 {{1} } C D, 5000 B E Как мне обновить файл test.txt, указав файл ...
0
Как добавить новую строку после выражения 03.08.2017
У меня есть файл, который выглядит примерно так: random_string 83: несколько слов 45: большой отчет об ошибке 326: отправить электронное письмо определенным людям случайная_строка 34: несколько слов 143: успех в работе Я хочу нацелиться на ...
0
форматирование файла с использованием awk 24.04.2019
Мой входной файл содержит данные в следующем формате: 1503668542862176 manager = 10001 | Bounced = 999 | Analyst = 10004 | Business Analyst = 10005 | Programmer = 10003 1552024948590636 manager = 10001 | Bounced = 999 | ...
7
Используйте awk или sed для удаления всего между < > 04.06.2021
В текстовом файле есть следующее :
1. Mark Yato ft. MarkAm & -1
Как я могу вывести следующую команду grep в файл? 05.04.2017
Я использую crudini для добавления и удаления разделов и параметров в ini-файле. После запуска crudini в файле остаются лишние пустые строки, которые я хочу очистить, чтобы каждый раздел был разделен ...

10
Пропустите первые 3 байта файла 04.02.2017
Я использую оболочку AIX 6.1 ksh. Я хочу использовать один лайнер, чтобы сделать что-то вроде этого: кошка A_FILE | skip-first-3-bytes-of-the-file я хочу пропустить первые 3 байта первой строки; есть ли способ сделать...

3
Удаление строки, содержащей строку в двух столбцах 06.09.2019
У меня есть файл с разделителями табуляцией: TRINITY_DN42298_c0_g1_i1.p1 NA NA TRINITY_DN12995_c0_g1_i1.p1 PF06799 Н/П TRINITY_DN2326_c0_g1_i4.p3 Н/П Н/П TRINITY_DN6047_c0_g1_i1.p1 PF10585 GO:0008641 ...

score 1 · Accepted Answer · 28.01.2020, 05:09

Если каждая из полей для сравнения имеет один символ нечислового префикса ( C или A в вашем примере), Тогда вы должны быть в состоянии извлечь и сравнить числовые подстроки напрямую в awk, например,

$ awk -F"[ \t,]+" 'substr($5,2)+0==substr($3,2)+1 && substr($9,2)+0==substr($7,2)+1' file.csv
RZ_AUTO_1, 1cx0, C118, B, C119, B, A165, B, A166, B, CC/AA Canonical ribose-zipper 
RZ_AUTO_2, 1drz, C118, B, C119, B, A165, B, A166, B, CC/AA Canonical ribose-zipper 
RZ_AUTO_3, 1ffk, C208, 0, G209, 0, A665, 0, A666, 0, CG/AA Canonical ribose-zipper

Фильтрация.CSV файла на основе последовательных чисел в строке

Пример пробега

Слабые стороны

Теги

Похожие вопросы