У меня есть файл, который выглядит примерно так, как показано ниже. SNP Бета A1 A2 P
рс124 -0,5 Т С 0,11
rs534 0,22 А Г 0,245
rs199 1,32 Г С 0,345
рс947 -0,07 ТГ 0,00002
рс667 0,37 С Т 0,04
.... Есть 23640021 ...
У меня есть 2 набора генетических данных. Я фильтрую файл1 на основе столбца в файле2. Однако мне также нужно учитывать второй столбец в файле2, и я не знаю, как это сделать. Условие для файла 1 строка...
У меня есть входной файл с этими полями: ENST00000456328.2 1657 1350.015 0 0 Я пытаюсь awk удалить число после запятой и распечатать остальное как это awk -F[.] '{print $1"\t"$2"\...
У меня есть два файла: 1_file.txt:
ChrX 129759713 А Г
ЧрХ 129760010 С Т
ChrX 129762238 C G
ChrX 129762448 А Г
ChrX 129762803 А С
ChrX 129763441 C А
ChrX 129764931 Т С
ChrX 129767696 C T
ChrX 129818213 C ...
Итак, я пытаюсь запустить программу iRep, и обычно она работает как iRep -f Bins/10000A-01-01_bin.* -s sam/10000A- 01-01.sam.sorted.sam --sort -o 10000A-01-01_iRep_output в папке sam - 10000A-01-01.sam....
У меня есть файл fasta, который выглядит следующим образом: >ENST00000632684.1 кДНК хромосома:GRCh38:7:142786213:142786224:1 ген:ENSG00000282431.1 ген_биотип:TR_D_ген транскрипт_биотип:TR_D_ген ген_символ :...
По сути, мне нужно сделать копию и подстановку $1 (после катинга файла) в переменную примера, чтобы заменить ее по адресу /disk1/ ngsep/"$sample"/"$1"_bowtie2_readpos.stats. Это мой...
Я пытаюсь извлечь некоторые данные из файла с помощью grep. Это файл ДНК fasta, содержащий такие строки, как: ATCGTAGCTAGCATCGTATCGATGCTGCTATGCTAGATGCTAGT Мне нужно найти каждую TA и 20 ...
У меня есть файл со многими столбцами, например: ID1 XP_026389348.1_стеароил-[ацил-носитель-белок]_9-десатураза,_хлоропласт_[Papaver_somniferum]
ID2 XP_026389348.1_stearoyl-[ацил-носитель-белок]_9-...
Я хотел бы сравнить столбцы из первого и второго файлов. Где столбец 2 файла1 должен не соответствовать столбцу 1 или 2 из файла2 и печатать вывод из файла 1. файл1. cat test.head20.R2.fastq.tab @...
Я хочу удалить все, что не в скобках, включая скобки, только в строках, начинающихся с ">". Есть ли альтернатива sed? Кроме того, хотелось бы отсортировать строки в алфавитном порядке по...
У меня есть файл со следующей структурой: >Кластер 0
0 51aa, >MG00HS05:520:C8M1TACXX:3:1101:1428:2080/1... *
1 51aa, >MG00HS05:520:C8M1TACXX:3:1101:1658:2480/1... в 3:51:1:49/96,08%
2 ...
В каталоге, над которым я работаю, у меня есть два файла с расширением .sam: PD180425_aligned_minimap.sam
PD180793_aligned_minimap.sam Для каждого из этих двух файлов мне нужно применить команду, которая выглядит...
У меня есть 1775 файлов .txt, и каждый файл .txt содержит 3023 строки, которые выглядят так: RIBBY_g_5ZCV995_BI_SNP_D04_38774.CEL
FQC-10090295 0,007813
FQC-10119363 0,023438
FQC-10132112 ...
У меня есть несколько файлов для разбора и использования вывода в качестве аргумента второй программы, которую я использую: for file in ./*.vcf.gz; do echo "gunzip -c ${file} | awk 'BEGIN{FS=OFS=\"\t\"} NR == FNR{key[\$1]=\$...
У меня есть несколько (22) файлов с такими именами: chr1.out, chr2.out...,chr22.out каждый из этих файлов имеет 46 столбцов и несколько строк. Первые 6 столбцов и 6 строк в одном из этих файлов выглядят...
У меня есть два файла, файл1 является подмножеством файла2, что означает, что все строки в файле1 можно найти в файле2, но некоторые строки в файле2 отсутствуют в файле1. Теперь я хочу найти разные строки (или дополнительные строки)...
У меня есть файл строк заголовков (файл 1), а другой файл содержит последовательности в формате fasta (файл 2). Мне нужны последовательности grep fasta, если строка заголовка из файла 1 совпадает с файлом 2.
Пример:
Файл 1: >sp|...
У меня есть один файл: comb.txt, например: GO_GLUTAMINE_FAMILY_AMINO_ACID_METABOLIC_PROCESS
REACTOME_APC_CDC20_MEDIATED_DEGRADATION_PROCESS_A_DEGRADATION_PROCESS_A_MEDIATED_DEGRADATION_OF } RB_DN.V1_UP
...
. Назначение состоит в том, чтобы написать скрипт Bash с именем «Countmatches», которые отображают количество раз определенной последовательности, такую как AAC, появляется в указанном файл. Сценарий должен ожидать, по крайней мере, два ...
У меня есть эта база данных генов, которая полностью запутана дополнительными неинтекторными значениями. Это произошло как своего рода шифрование к данным, которые были сделаны неправильно, и я не знаю, как убирать ...
У меня есть файл, содержащий список имен последовательностей ДНК, а другой файл содержит последовательности ДНК. Они выглядят так: $ cat list.txt
seq1
seq3 $ cat sequence.txt
> seq1
AAAAA
AAAAA
> seq2
CCCCCC
...
У меня есть очень большие файлы RNA-seq, сгенерированные на разных дорожках. Я извлек несколько имен файлов, как показано ниже. MC9_FNEN_638A_S19_L008_R1_001.fastq.gz
MC9_FNEN_638A_S19_L008_R2_001.fastq.gz
...
У меня проблема с печатью комплементарной цепи ДНК также с обратной
Я хочу получить такой результат. Введите последовательность ДНК цепи шаблона:
GTAAGCCGGAAGG
Последовательность ДНК антисмысловой цепи ...
Я хочу извлечь все строки в файле, содержащие эти шаблоны: «# 1:» и «длина дерева для». Вход: # 1: nexus0002_Pseudomonas_10M branch t N S dN / dS dN ...
У меня есть файл с разделителями табуляции, в котором содержится информация о генетическом материале. Часть информации вырезается в меньший файл tab с извлечением некоторых столбцов, и используется uniq, чтобы убедиться, что в нем нет...
Мне нужно запустить программу, используя 2 файла в качестве входных данных, ожидая, что 1 выход будет иметь 6000 файлов в диапазоне от abc0000.faa / abc0000. fna на abc6000.faa / abc6000.fna. Мне также нужно, чтобы в выходном файле был такой же файл ...