У меня есть два файла, в File1 есть генные взаимодействия (символ гена), а в другом File2 есть символ гена и его соответствующий Ensembl ID. Файл1 GeneA GeneB
GeneA GeneD
GeneC GeneB File2 GeneA ...
Я использую инструмент биоинформатики hmmer, и я хотел бы запустить его для более чем 7000 запросов тестовой последовательности. После запуска каждого из них я хотел бы, чтобы он сохранял вывод в текстовом файле, что он делает вполне ...
У меня есть два файла A и B. Файл A
> Узел1 ...
> Узел 2
... Файл B
> gb | KY551314.1 | Вирус гриппа A (A / mallard / Idaho / AH0011522 / 2015 (H7N7)) сегмент 2 полимеразы PB1 (PB1) и ...
У меня есть большой файл GTF, как показано ниже: # ./stringtie -p 4 -G /home/humangenome_hg19/homo_gtf_file.gtf -o strAD1_as / transcripts.gtf - l strAD1 /home/software/star-2.5.2b/bin/Linux_x86_64/mapA1Aligned ....
У меня есть .tsv файл (batch_1.catalog.tags.tsv), состоящий из 1,965,056 строк с 14 столбцами. Я хочу разбить некоторые из них на две строки. Первая строка: начинается со знака "больше чем" (>) ...
Я хотел бы разделять имена генов, соединенные тире. Хочу заменить на вкладки. Мой входной файл: Cedr3g0570.1_XP_019283.1
Cedr4g7930.2_XP_019241.1
Cedr5g005170.1_C0LGS3.1
Cedr7g0290 ....
У меня есть файл с интервалами, начинающимися в колонке "начало" и заканчивающимися в колонке "конец". Мне нужно извлечь начало и конец этих интервалов в соответствии с определенной длиной, которая записана ...
Я нуждаюсь в некоторой помощи с комбинацией awk и цикла с условием продолжения. У меня есть два простых файла со столбцами (нормальные являются очень большими), представляющие простые интервалы для ID=10 (кодирования регионов (экзоны)...
Я нашел эту интересную команду :grep -v '^>' test.fasta | tr -d '\n' | sed -e 's/\ (.\ )/\1\n/g' | сортировать | уникальный -c | сортировать -р-н Я немного понимаю, что это значит (он считает буквы из текстового файла ), но мой вопрос об этом :sed -e 's/\
Я использую эту команду для поиска списка генов в первом файле, присутствующем в файле gff. grep -w -f активировал _гены _в _BEg GCA _900659725.1 _ASM90065972v1 _genomic.gff это не сработало для меня.. пожалуйста, любое предложение. Список генов в первом
У меня есть много файлов.txt со следующей информацией в 4 столбцах и тысячах строк :chr10 73121691 18 SLC29A3 chr10 73121692 14 SLC29A3 chr10 73121693 10 SLC29A3 чр10 73120590 15 SLC29A3 чр10...
У меня есть такой файл A.txt (разделитель полей =,):Пакетный экспорт комплекта Версия ПО = НЕТ _v1 Дата и время экспорта = Название эксперимента = Версия программного обеспечения прибора = Тип инструмента = Cji...
Я хотел извлечь определенные строки из нескольких файлов bam (в формате двоичного файла ). Я могу выбрать строки из одного файла bam с помощью этой команды :samtools view -c TCGA -BH -A0BW -11A.sorted.bam "...
У меня есть такой файл A.txt (разделитель полей = ;) :
Комплект;;;;;;;
Версия ПО = cti;;;;;;;
Дата и время экспорта = 02.06.20 14:14:11;;;;;;;
Название эксперимента = taqpath-AB17500-plate7587;;;;;;;
...
Я пытаюсь проанализировать несколько файлов, чтобы извлечь определенные строки и вывести их в другой файл. Однако расположение этой информации в моих файлах может меняться в зависимости от определенного параметра....
У меня есть краткий список из 1000 имен генов и полный список из 20000 имен генов с идентификационными номерами. Я попытался настроить цикл for для поиска более короткого списка в полном списке, чтобы вернуть числа. ...
На моем Linux-компьютере есть такой :ниже. AF.Cases AF.Контроли 0,0044 0,00159 0,0018 0,00315 0,3920 0,38898 Теперь я хочу получить частоту минорного аллеля (maf ). Итак, если AF.Cases больше 0....
У меня есть такой файл: head cleandata.map
1 1:775852:Т:К 0 775852
1 1:1120590:А:С 0 1120590
1 1:1145994:Т:К 0 1145994
1 1:1148494:А:Г 0 1148494
... И еще один файл: head ...
У меня есть данные о генетических вариантах с несколькими столбцами, в настоящее время мои варианты/линии расположены в неправильном порядке и должны быть отсортированы по хромосомам. Я попробовал несколько способов сделать это, используя ответы из похожи
У меня есть 2 набора генетических данных, в обоих есть столбец для положения хромосомы. Я пытаюсь отфильтровать файл 1 на основе положения хромосом каждой строки по сравнению с положениями хромосом в файле 2. ...
У меня есть 2 набора генетических данных. Файл 1 представляет собой текстовый файл и содержит идентификаторы хромосом, которые также присутствуют в файле 2. Файл 2 представляет собой файл csv, он больше, чем файл 1, и имеет более уникальные идентификаторы
Мне нужно объединить две таблицы .csv, одна из которых содержит следующую информацию без заголовка: ген0 ABCD
ген1 xyz
Gene2 1234 ..etc Другая таблица имеет заголовок и такую информацию: gene_id ...
У меня есть запрос, связанный с биоинформатикой. У меня есть несколько bam-файлов, из каждого bam-файла я должен узнать количество сопоставленных чтений из каждого bam-файла с идентификатором, для этого у меня есть команда $ ...
Я использую программу под названием minimap для выравнивания прочтений с эталонным геномом (задача вычислительной биологии). Эта программа требует в качестве входных данных два файла в качестве позиционных аргументов: первый ссылка в ....