Это более или менее тот же тип ответов, что и некоторые, которые вы уже получили на подобные вопросы. :Сначала прочитайте один файл (позиции ), затем проанализируйте другие файлы и извлеките данные.
awk 'NR == FNR { pos[$1]=1; next } $2 in pos { f="desired_pos" $2; print >>f; close(f) }' positions NA*.bam_dp
Если в вопросе указаны два отдельных файла и если positions
включает 142535975, то будет создан desired_pos142535975
со следующим содержимым:
1 142535975 79 NA20507
1 142535975 135 NA20901
Это будет работать, если предположить, что все позиции относятся к хромосоме 1 (или, по крайней мере, к той же той же хромосоме, что и в отдельных файлах ), поскольку нет информации об имени хромосомы, кроме местоположения в файле positions
.