2
ответа

Match File1 with File 2

У меня есть два файла, в File1 есть генные взаимодействия (символ гена), а в другом File2 есть символ гена и его соответствующий Ensembl ID. Файл1 GeneA GeneB GeneA GeneD GeneC GeneB File2 GeneA ...
01.07.2017
2
ответа

Для циклов в Bash

Я использую инструмент биоинформатики hmmer, и я хотел бы запустить его для более чем 7000 запросов тестовой последовательности. После запуска каждого из них я хотел бы, чтобы он сохранял вывод в текстовом файле, что он делает вполне ...
20.06.2017
2
ответа

Найти и заменить строки в текстовом файле выводом из другого файла

У меня есть два файла A и B. Файл A > Узел1 ... > Узел 2 ... Файл B > gb | KY551314.1 | Вирус гриппа A (A / mallard / Idaho / AH0011522 / 2015 (H7N7)) сегмент 2 полимеразы PB1 (PB1) и ...
15.05.2017
2
ответа

Извлечение цитируемых и помеченных данных из заданного столбца

У меня есть большой файл GTF, как показано ниже: # ./stringtie -p 4 -G /home/humangenome_hg19/homo_gtf_file.gtf -o strAD1_as / transcripts.gtf - l strAD1 /home/software/star-2.5.2b/bin/Linux_x86_64/mapA1Aligned ....
13.05.2017
2
ответа

Деконструкция одной строки на две строки на основе определенных столбцов

У меня есть .tsv файл (batch_1.catalog.tags.tsv), состоящий из 1,965,056 строк с 14 столбцами. Я хочу разбить некоторые из них на две строки. Первая строка: начинается со знака "больше чем" (>) ...
07.05.2017
2
ответа

Сопоставление значений в полях и присвоение им идентификатора на основе сопоставления

chr: pos1: pos2 Sun NC S1 S2 S3 S4 S9 S11 S14 S15 S16 S17 S18 S19 S28 S29 S30 S33 S34 S35 S36 S37 S38 .. .
05.05.2017
2
ответа

Как разделить имена генов, соединенные знаком подчеркивания?

Я хотел бы разделять имена генов, соединенные тире. Хочу заменить на вкладки. Мой входной файл: Cedr3g0570.1_XP_019283.1 Cedr4g7930.2_XP_019241.1 Cedr5g005170.1_C0LGS3.1 Cedr7g0290 ....
16.02.2017
2
ответа

Извлечение начальных и конечных координат в соответствии с определенной длиной нефиксированного интервала [закрыто]

У меня есть файл с интервалами, начинающимися в колонке "начало" и заканчивающимися в колонке "конец". Мне нужно извлечь начало и конец этих интервалов в соответствии с определенной длиной, которая записана ...
28.01.2017
2
ответа

Получить строки только с определенными полями

#CHROM POS T1 T10 T11 T12 T13 T2 T3 T4 T5 T6 T106 T107 T108 T109 T110 T112 T114 T116 T120 T122 T125 T128 T129 ...
06.01.2017
2
ответа

Организация трехмерных данных с помощью awk / sed / perl

У меня есть этот файл (разреженная матрица): PC.354 OTU1 6 ПК.354 ОТУ2 1 ПК.356 ОТУ0 4 ПК.356 ОТУ2 7 PC.356 OTU3 3 Мне нужен такой вывод (плотная матрица - классическая таблица .biom): OTU_ID PC.354 PC.355 PC ....
25.05.2016
2
ответа

Вложенные 'awk' в, 'в то время как' цикл, проанализируйте два файла линию за линией и сравните значения столбцов

Я нуждаюсь в некоторой помощи с комбинацией awk и цикла с условием продолжения. У меня есть два простых файла со столбцами (нормальные являются очень большими), представляющие простые интервалы для ID=10 (кодирования регионов (экзоны)...
23.03.2015
1
ответ

Объяснение команды sed

Я нашел эту интересную команду :grep -v '^>' test.fasta | tr -d '\n' | sed -e 's/\ (.\ )/\1\n/g' | сортировать | уникальный -c | сортировать -р-н Я немного понимаю, что это значит (он считает буквы из текстового файла ), но мой вопрос об этом :sed -e 's/\
21.10.2021
1
ответ

команда grep для поиска списка генов в первом файле, присутствующем в файле gff

Я использую эту команду для поиска списка генов в первом файле, присутствующем в файле gff. grep -w -f активировал _гены _в _BEg GCA _900659725.1 _ASM90065972v1 _genomic.gff это не сработало для меня.. пожалуйста, любое предложение. Список генов в первом
04.10.2021
1
ответ

Как свернуть последовательные числа в диапазоны и получить среднее значение

У меня есть много файлов.txt со следующей информацией в 4 столбцах и тысячах строк :chr10 73121691 18 SLC29A3 chr10 73121692 14 SLC29A3 chr10 73121693 10 SLC29A3 чр10 73120590 15 SLC29A3 чр10...
04.02.2021
1
ответ

Сравнение N одинаковых непрерывных символов из набора двух файлов с последовательностями

У меня есть два файла по 3 последовательности (по 200 каждый )с таким заголовком :#Файл1 >1...
12.12.2020
1
ответ

Как разобрать и вставить в ту же строку в awk

У меня есть такой файл A.txt (разделитель полей =,):Пакетный экспорт комплекта Версия ПО = НЕТ _v1 Дата и время экспорта = Название эксперимента = Версия программного обеспечения прибора = Тип инструмента = Cji...
06.10.2020
1
ответ

Как создать новый файл на основе результатов из нескольких файлов и сохранить имена файлов в качестве первого столбца?

Я хотел извлечь определенные строки из нескольких файлов bam (в формате двоичного файла ). Я могу выбрать строки из одного файла bam с помощью этой команды :samtools view -c TCGA -BH -A0BW -11A.sorted.bam "...
03.08.2020
1
ответ

Как проанализировать и вставить в другой файл

У меня есть такой файл A.txt (разделитель полей = ;) : Комплект;;;;;;; Версия ПО = cti;;;;;;; Дата и время экспорта = 02.06.20 14:14:11;;;;;;; Название эксперимента = taqpath-AB17500-plate7587;;;;;;; ...
16.06.2020
1
ответ

Извлечение строк с разным расположением внутри файла

Я пытаюсь проанализировать несколько файлов, чтобы извлечь определенные строки и вывести их в другой файл. Однако расположение этой информации в моих файлах может меняться в зависимости от определенного параметра....
09.06.2020
1
ответ

Использование Grep для поиска в списке и возврата совпадений

У меня есть краткий список из 1000 имен генов и полный список из 20000 имен генов с идентификационными номерами. Я попытался настроить цикл for для поиска более короткого списка в полном списке, чтобы вернуть числа. ...
12.05.2020
1
ответ

Как получить частоту минорного аллеля?

На моем Linux-компьютере есть такой :ниже. AF.Cases AF.Контроли 0,0044 0,00159 0,0018 0,00315 0,3920 0,38898 Теперь я хочу получить частоту минорного аллеля (maf ). Итак, если AF.Cases больше 0....
06.05.2020
1
ответ

Как заменить совпадающую строку в одном файле совпадающей строкой в ​​другом файле?

У меня есть такой файл: head cleandata.map 1 1:775852:Т:К 0 775852 1 1:1120590:А:С 0 1120590 1 1:1145994:Т:К 0 1145994 1 1:1148494:А:Г 0 1148494 ... И еще один файл: head ...
02.04.2020
1
ответ

Сортировка строк файла по хромосоме?

У меня есть данные о генетических вариантах с несколькими столбцами, в настоящее время мои варианты/линии расположены в неправильном порядке и должны быть отсортированы по хромосомам. Я попробовал несколько способов сделать это, используя ответы из похожи
12.03.2020
1
ответ

Как выбрать строки из файла на основе условий другого файла?

У меня есть 2 набора генетических данных, в обоих есть столбец для положения хромосомы. Я пытаюсь отфильтровать файл 1 на основе положения хромосом каждой строки по сравнению с положениями хромосом в файле 2. ...
05.02.2020
1
ответ

Как выбрать уникальные строки на основе столбца другого файла?

У меня есть 2 набора генетических данных. Файл 1 представляет собой текстовый файл и содержит идентификаторы хромосом, которые также присутствуют в файле 2. Файл 2 представляет собой файл csv, он больше, чем файл 1, и имеет более уникальные идентификаторы
31.01.2020
1
ответ

Объединение двух таблиц .csv, одной с заголовком, другой — нет

Мне нужно объединить две таблицы .csv, одна из которых содержит следующую информацию без заголовка: ген0 ABCD ген1 xyz Gene2 1234 ..etc Другая таблица имеет заголовок и такую ​​информацию: gene_id ...
02.12.2019
1
ответ

bash-скрипт для поиска результатов из нескольких входных файлов, использующих samtools, в новый выходной CSV-файл

У меня есть запрос, связанный с биоинформатикой. У меня есть несколько bam-файлов, из каждого bam-файла я должен узнать количество сопоставленных чтений из каждого bam-файла с идентификатором, для этого у меня есть команда $ ...
16.10.2019
1
ответ

сохранить вывод `cat` в качестве заполнителя

Я использую программу под названием minimap для выравнивания прочтений с эталонным геномом (задача вычислительной биологии). Эта программа требует в качестве входных данных два файла в качестве позиционных аргументов: первый ссылка в ....
02.10.2019
1
ответ

awk для замены столбца

Мне нужно заменить столбец 1 файла 1 столбцом 1 файла 2, когда столбец 1 файла 1 совпадает с столбцом 5 файла 2. файл 1 ENSG00000237491 1 714150 745440 2 1 143562 ...
18.09.2019