Итак, у меня есть большое количество файлов, каждый из которых имеет 8 столбцов и множество строк. Вот голова от одного из них для примера. ID Ct 1 2 3 4 5 ...
Я изучаю биоинформатику, но у меня нет большого опыта работы с awk, и теперь я застрял. У меня есть таблица с 13 столбцами. В столбце 9 у меня есть много вариантов строк, таких как ELL1-XXXXXXXXX (например, ...
Я хочу извлечь идентификаторы совпадений и отсутствия совпадений из результатов моего взрыва. например, мой взрывной вывод содержит: > Query= TRINITY_DN109574_c0_g1_i1 Length=277
***** Хиты не найдены *****
Lambda K ...
Итак, в основном, у вас есть последовательность, скажем, AAAGCATATGCTAGCCCGTATAGCGATACTAGCTATACGATATATATGATCAATGCCCGTATAG. Вам нужно найти все ORF в последовательности, ORF это любая область, начинающаяся с ATG...
Допустим, у меня есть переменная, последовательность, которая является строкой. > sequence="AAAGCATATGCTAGCCCGTATAGCGATACTAGCTATACGATATATATGATCAATGCCCGTATAG" Я хочу создать массив, скажем, seq, в котором каждый элемент представляет собой 3...
У меня есть два файла, состоящих из блоков по 4 строки, начинающихся с @. Они совпадают и по порядку. Файлы слишком большие (> 10 ГБ), поэтому я помещаю сюда первые 3 блока каждого (12 строк). 1-й: ...
У меня есть файл с табличным форматом, который выглядит примерно так: abc00000000 1 643301 643374 Ile AAT 0 0 80.6 abc00000000 2 1278112 1278193 Ser GCT 0 0 86.2 abc00000000 ...
В настоящее время у меня есть следующий сценарий для использования программы HaploTypeCaller в моей системе Unix в созданной мной воспроизводимой среде: #!/bin/bash
#параллельный вызов SNP с хромосомами по GATK
for i in ...
. У меня есть набор данных, с которым я работаю, состоящий из файлов phylip, которые я редактировал. Формат Phylip - это биоинформатический формат, который содержит в качестве заголовка количество образцов и последовательность ...
У меня есть два файла: file1 (поиск): 1 GACGGAGGATGCAAGTGTTATCCGGAATCACTGGGCGTAAAGTGATTTTTTGATGATGATGACGACGACTGACTGACGACGACGACTGACTGACGACGACTGACTGACGACGACCC ...
У меня есть огромный файл, который содержит 80 геномов и пять хромосом. Я задавался вопросом, существует простой способ выбрать только строки из ОДНОЙ хромосомы (например, 1), но только при показе положения...
Я работаю с файлами fastq из данных секвенирования следующего поколения, которые организованы следующим образом: Строка 1 информация о машине для секвенирования, полоса, "плитки" и номер чтения Строка 2 ...
Файл A содержит ряды генов: A,B,C,D,E P,Q,R G,D,V,K L,Q,X,I,U,G и так далее. Рассматривая каждый ряд по очереди, как можно получить следующий вид вывода: Для первого ряда: A,B,C B,C,D ...
Думаю, это будет более наглядным примером. У меня есть такая структура матрицы (файла): Файл1
____ snp1 snp2 snp3 snp4
snp1 1 0.3 0.4 0.5
snp2 0.3 1 0.4 0.5
snp3 0.4 0.4 ...
Если у меня есть два файла file1: Исходное положение 905894 1197693 3703749 92108275 114940633 114 940 633 file2: Отображение Ссылочной Связи Аллели Длины Типа Исходного положения количество Zygosity...
У меня есть файл fasta, а именно test.fasta, pas.fasta, cel.fasta, как показано ниже. тест.фаста >плитка АТГТС >259 ТГАТ пас.фаста >та АТГКТ чел.фаста >787 ТГТАГ >йог ТГТАТ >
Извините, если этот вопрос уже задавали. Я новичок во всем этом. Я хотел бы объединить все файлы из разных папок, которые содержат R1 в определенной позиции в своих именах файлов. Мой...
У меня есть две последовательности ДНК: ATGCATGC и TACGTTGC. Я хочу написать программу, которая дает «+», если при сравнении A выравнивается с T и G с C, иначе печатает «-» Нравится АТГКАТГК TACGTTGC ++++...
У меня есть следующие файлы :ФК _014 _6361.bam ФК _014 _6462.бам FC _014 _6183.bam В настоящее время я запускаю следующие команды отдельно для каждого файла. Например, для FC _014 _6361.bam команды :$...
У меня есть файл (fileA ), который выглядит так :>ENST00000614578.1 ген=WASP12 CDS=1 -526 >ENST00000581055.1 ген=PTP2 CDS=138 -579 >ENST00000577541.1 ген=PTP2 CDS=1 -81 >ENST00000423485.5 ген=...
У меня есть код, который я обычно запускаю в R, но файл слишком большой, поэтому я пытаюсь запустить те же команды в awk. Я пытаюсь сгруппировать значения в столбцах по столбцу ID (или столбцу Gene в моем случае ). Мои данные...
У меня следующая проблема :Мой техпаспорт выглядит так АААГГГТТ АААГГГ AAAGGGCCC GGGCCC, и я хочу отобразить разницу между двумя последовательностями в третьей строке, как это ААААГГТТТ...
У меня есть файлы gtf более чем в 100 каталогах. Ниже я показываю, как они выглядят. ОбразецА | ___________ОбразецA.GRCh38.gtf ОбразецB | ___________SampleB.GRCh38.gtf Здесь я показываю только два gtf...