У меня есть 2 файла, файл 1 и файл 2 с одинаковыми номерами столбцов. В первом столбце указан номер хромосомы, во втором столбце указан стартовый сайт промотора, а в третьем столбце указан сайт остановки промотора.
Я хочу сопоставить оба файла, если совпадение по всем трем столбцам в файле 1 обнаружено в файле 2. Я хочу сгенерировать выходной файл, показывающий три точных столбца с четвертым. Четвертый будет показывать совпадение с оценкой 1 и несоответствие с оценкой 0.
Файл 1:
chr1 899 1098
chr3 677 900
chr3 844 1045
Файл 2:
chr3 844 1045
chr1 899 1098
chr4 500 789
Выходной файл:
chr1 899 1098 1
chr3 677 900 0
chr3 844 1045 1
chr4 500 789 0
Я нашел ответ, соответствующий файлам и выведите новый файл на том же форуме:
awk 'FNR == NR {a [$ 1, $ 2, $ 3] = $ 0; next} {if (b = a [$ 1, $ 2, $ 3]) {print b }} 'file1 file2
Но я хочу также включить в выходной файл столбец оценки совпадения и несоответствия.