Чтобы извлечь все данные для хромосомы 5, вы можете использовать простую команду awk
:
awk -F '\t' '$1 == "5"' file.gff3 >chr5.gff3
Чтобы также включить заголовки GFF:
awk -F '\t' '/^#/ || $1 == "5"' file.gff3 >chr5.gff5
Любая из этих команд будет читать из file.gff3
и записывать извлеченные данные в новый файл chr5.gff3
.
Вы можете легко расширить это, например, включив только экзоны:
awk -F '\t' '/^#/ || ($1 == "5" && $3 == "exon")' file.gff3 >chr5.gff5