bioinformatics - лучшие вопросы о Unix / linux операционная система (юникс)

2

ответа

Match File1 with File 2

У меня есть два файла, в File1 есть генные взаимодействия (символ гена), а в другом File2 есть символ гена и его соответствующий Ensembl ID. Файл1 GeneA GeneB GeneA GeneD GeneC GeneB File2 GeneA ...

text-processing bioinformatics

01.07.2017

2

ответа

Я использую инструмент биоинформатики hmmer, и я хотел бы запустить его для более чем 7000 запросов тестовой последовательности. После запуска каждого из них я хотел бы, чтобы он сохранял вывод в текстовом файле, что он делает вполне ...

bash bioinformatics

20.06.2017

2

ответа

Найти и заменить строки в текстовом файле выводом из другого файла

У меня есть два файла A и B. Файл A > Узел1 ... > Узел 2 ... Файл B > gb | KY551314.1 | Вирус гриппа A (A / mallard / Idaho / AH0011522 / 2015 (H7N7)) сегмент 2 полимеразы PB1 (PB1) и ...

awk bioinformatics grep sed text-processing

15.05.2017

2

ответа

Извлечение цитируемых и помеченных данных из заданного столбца

У меня есть большой файл GTF, как показано ниже: # ./stringtie -p 4 -G /home/humangenome_hg19/homo_gtf_file.gtf -o strAD1_as / transcripts.gtf - l strAD1 /home/software/star-2.5.2b/bin/Linux_x86_64/mapA1Aligned ....

bioinformatics table text-processing

13.05.2017

2

ответа

Деконструкция одной строки на две строки на основе определенных столбцов

У меня есть .tsv файл (batch_1.catalog.tags.tsv), состоящий из 1,965,056 строк с 14 столбцами. Я хочу разбить некоторые из них на две строки. Первая строка: начинается со знака "больше чем" (>) ...

awk bioinformatics grep sed text-processing

07.05.2017

2

ответа

Сопоставление значений в полях и присвоение им идентификатора на основе сопоставления

chr: pos1: pos2 Sun NC S1 S2 S3 S4 S9 S11 S14 S15 S16 S17 S18 S19 S28 S29 S30 S33 S34 S35 S36 S37 S38 .. .

awk bioinformatics

05.05.2017

2

ответа

Как разделить имена генов, соединенные знаком подчеркивания?

Я хотел бы разделять имена генов, соединенные тире. Хочу заменить на вкладки. Мой входной файл: Cedr3g0570.1_XP_019283.1 Cedr4g7930.2_XP_019241.1 Cedr5g005170.1_C0LGS3.1 Cedr7g0290 ....

bioinformatics replace sed text-formatting

16.02.2017

2

ответа

Извлечение начальных и конечных координат в соответствии с определенной длиной нефиксированного интервала [закрыто]

У меня есть файл с интервалами, начинающимися в колонке "начало" и заканчивающимися в колонке "конец". Мне нужно извлечь начало и конец этих интервалов в соответствии с определенной длиной, которая записана ...

awk bioinformatics shell text-processing

28.01.2017

2

ответа

Получить строки только с определенными полями

#CHROM POS T1 T10 T11 T12 T13 T2 T3 T4 T5 T6 T106 T107 T108 T109 T110 T112 T114 T116 T120 T122 T125 T128 T129 ...

awk bioinformatics

06.01.2017

2

ответа

Организация трехмерных данных с помощью awk / sed / perl

У меня есть этот файл (разреженная матрица): PC.354 OTU1 6 ПК.354 ОТУ2 1 ПК.356 ОТУ0 4 ПК.356 ОТУ2 7 PC.356 OTU3 3 Мне нужен такой вывод (плотная матрица - классическая таблица .biom): OTU_ID PC.354 PC.355 PC ....

awk bioinformatics perl sed text-processing

25.05.2016

2

ответа

Вложенные 'awk' в, 'в то время как' цикл, проанализируйте два файла линию за линией и сравните значения столбцов

Я нуждаюсь в некоторой помощи с комбинацией awk и цикла с условием продолжения. У меня есть два простых файла со столбцами (нормальные являются очень большими), представляющие простые интервалы для ID=10 (кодирования регионов (экзоны)...

shell-script text-processing awk bioinformatics

23.03.2015

1

ответ

Печатать подмножество строк из файла на основе столбца, попадающего в диапазоны второго файла

У меня есть файл с 4 столбцами (file1.txt)

awk bioinformatics text-processing

03.12.2021

1

ответ

Объяснение команды sed

bioinformatics sed

21.10.2021

1

ответ

команда grep для поиска списка генов в первом файле, присутствующем в файле gff

Я использую эту команду для поиска списка генов в первом файле, присутствующем в файле gff. grep -w -f активировал _гены _в _BEg GCA _900659725.1 _ASM90065972v1 _genomic.gff это не сработало для меня.. пожалуйста, любое предложение. Список генов в первом

bioinformatics grep

04.10.2021

1

ответ

Как свернуть последовательные числа в диапазоны и получить среднее значение

У меня есть много файлов.txt со следующей информацией в 4 столбцах и тысячах строк :chr10 73121691 18 SLC29A3 chr10 73121692 14 SLC29A3 chr10 73121693 10 SLC29A3 чр10 73120590 15 SLC29A3 чр10...

awk bioinformatics shell-script

04.02.2021

1

ответ

Сравнение N одинаковых непрерывных символов из набора двух файлов с последовательностями

У меня есть два файла по 3 последовательности (по 200 каждый )с таким заголовком :#Файл1 >1...

awk bioinformatics file-comparison linux text-processing

12.12.2020

1

ответ

Как разобрать и вставить в ту же строку в awk

У меня есть такой файл A.txt (разделитель полей =,):Пакетный экспорт комплекта Версия ПО = НЕТ _v1 Дата и время экспорта = Название эксперимента = Версия программного обеспечения прибора = Тип инструмента = Cji...

awk bioinformatics text-processing

06.10.2020

1

ответ

Как создать новый файл на основе результатов из нескольких файлов и сохранить имена файлов в качестве первого столбца?

Я хотел извлечь определенные строки из нескольких файлов bam (в формате двоичного файла ). Я могу выбрать строки из одного файла bam с помощью этой команды :samtools view -c TCGA -BH -A0BW -11A.sorted.bam "...

bash bioinformatics for

03.08.2020

1

ответ

Как проанализировать и вставить в другой файл

У меня есть такой файл A.txt (разделитель полей = ;) : Комплект;;;;;;; Версия ПО = cti;;;;;;; Дата и время экспорта = 02.06.20 14:14:11;;;;;;; Название эксперимента = taqpath-AB17500-plate7587;;;;;;; ...

awk bioinformatics text-processing

16.06.2020

1

ответ

Извлечение строк с разным расположением внутри файла

Я пытаюсь проанализировать несколько файлов, чтобы извлечь определенные строки и вывести их в другой файл. Однако расположение этой информации в моих файлах может меняться в зависимости от определенного параметра....

bash bioinformatics text-processing

09.06.2020

1

ответ

Использование Grep для поиска в списке и возврата совпадений

У меня есть краткий список из 1000 имен генов и полный список из 20000 имен генов с идентификационными номерами. Я попытался настроить цикл for для поиска более короткого списка в полном списке, чтобы вернуть числа. ...

bash bioinformatics for grep linux

12.05.2020

1

ответ

Как получить частоту минорного аллеля?

На моем Linux-компьютере есть такой :ниже. AF.Cases AF.Контроли 0,0044 0,00159 0,0018 0,00315 0,3920 0,38898 Теперь я хочу получить частоту минорного аллеля (maf ). Итак, если AF.Cases больше 0....

bioinformatics text-processing

06.05.2020

1

ответ

Как заменить совпадающую строку в одном файле совпадающей строкой в другом файле?

У меня есть такой файл: head cleandata.map 1 1:775852:Т:К 0 775852 1 1:1120590:А:С 0 1120590 1 1:1145994:Т:К 0 1145994 1 1:1148494:А:Г 0 1148494 ... И еще один файл: head ...

awk bioinformatics text-processing

02.04.2020

1

ответ

Сортировка строк файла по хромосоме?

У меня есть данные о генетических вариантах с несколькими столбцами, в настоящее время мои варианты/линии расположены в неправильном порядке и должны быть отсортированы по хромосомам. Я попробовал несколько способов сделать это, используя ответы из похожи

bioinformatics linux sort

12.03.2020

1

ответ

Как выбрать строки из файла на основе условий другого файла?

У меня есть 2 набора генетических данных, в обоих есть столбец для положения хромосомы. Я пытаюсь отфильтровать файл 1 на основе положения хромосом каждой строки по сравнению с положениями хромосом в файле 2. ...

awk bioinformatics linux

05.02.2020

1

ответ

Как выбрать уникальные строки на основе столбца другого файла?

У меня есть 2 набора генетических данных. Файл 1 представляет собой текстовый файл и содержит идентификаторы хромосом, которые также присутствуют в файле 2. Файл 2 представляет собой файл csv, он больше, чем файл 1, и имеет более уникальные идентификаторы

bioinformatics linux text-processing

31.01.2020

1

ответ

Объединение двух таблиц .csv, одной с заголовком, другой — нет

Мне нужно объединить две таблицы .csv, одна из которых содержит следующую информацию без заголовка: ген0 ABCD ген1 xyz Gene2 1234 ..etc Другая таблица имеет заголовок и такую информацию: gene_id ...

bioinformatics columns csv linux table

02.12.2019

1

ответ

bash-скрипт для поиска результатов из нескольких входных файлов, использующих samtools, в новый выходной CSV-файл

У меня есть запрос, связанный с биоинформатикой. У меня есть несколько bam-файлов, из каждого bam-файла я должен узнать количество сопоставленных чтений из каждого bam-файла с идентификатором, для этого у меня есть команда $ ...

bash bioinformatics shell-script spreadsheet

16.10.2019

1

ответ

сохранить вывод `cat` в качестве заполнителя

Я использую программу под названием minimap для выравнивания прочтений с эталонным геномом (задача вычислительной биологии). Эта программа требует в качестве входных данных два файла в качестве позиционных аргументов: первый ссылка в ....

bash bioinformatics cat pipe

02.10.2019

1

ответ

awk для замены столбца

Мне нужно заменить столбец 1 файла 1 столбцом 1 файла 2, когда столбец 1 файла 1 совпадает с столбцом 5 файла 2. файл 1 ENSG00000237491 1 714150 745440 2 1 143562 ...

awk bioinformatics text-processing

18.09.2019