0
ответов

имитация пользовательского ввода в сценарии bash на slurm

Я считаю, что моя проблема аналогична описанной здесь, но меня смутил ответ (и я пока не могу комментировать этот вопрос из-за моей низкой репутации ). У меня есть bash-скрипт, который нужно запустить с помощью slurm, поэтому, когда...
03.08.2021
0
ответов

Удалить все подполя -в организованном файле данных столбца -, которые содержат «_XX»

У меня есть файл такого типа #CHROM POS ID REF ALT QUAL FILTER INFO chr1 69511 rs2691305 A G. PASS AC=70482;AN=83312;AF=0,846001;popmax=eas;...
03.07.2021
0
ответов

SED для сохранения части имени файла в каталоге

У меня есть структура Fastas MainDirectory/сотни _из _подкаталогов/тысячи _из _. Для каждого фаста (формат файла биоинформатики )на нижнем уровне я пытаюсь изменить имя файла, а также...
20.05.2021
0
ответов

Цикл for для объединения файлов с двумя переменными

Я относительно новичок в Linux и надеюсь, что кто-нибудь сможет мне помочь. Я хотел бы объединить файлы fastq.gz из 4 разных дорожек секвенирования. Каждый файл имеет следующее имя :GC082 _F4.lane1.1901.R1....
22.10.2020
0
ответов

Выбор одной строки (на основе значения столбца )из каждой группы строк (на основе различного столбца)

У меня есть следующий файл :ген.14977.0.1.p2 NbD023586.1.mrna1 100,0 132 0 0 1 132 1 132 4,9e -72 268,9 ген.14977.0.1.p2 NbD032405.1.mrna1...
21.10.2020
0
ответов

Есть ли способ извлечь строки между тремя файлами, которые являются общими на основе одного столбца?

У меня есть 3 файла, разделенных пробелами, в которых около 3,4 миллиона строк (но количество строк в них не одинаково, и они отсортированы по столбцу «Маркер»). Они выглядят так: head neu1 ...
03.06.2020
0
ответов

Назначение наборов значений из каждой строки таблицы отдельно команде в bash

У меня есть текстовый файл (input.txt )с 3 столбцами, разделенными символом \t. 62M __29 _длина _73210 _cov _19,6684 28981 -31993 минус 61M __32 _длина _66572 _cov _22,1672 22311 -25323 минус...
01.06.2020
0
ответов

Пакеты R не устанавливаются в среде conda R.

Я пытаюсь установить пакет R в среду R, созданную с помощью conda на сервере HPC, где я занимаюсь биоинформатикой. Я попытался запустить обычную команду R (которая работает и установить ...
10.12.2019
0
ответов

Лучший дистрибутив Linux для научных вычислений? [closed]

Недавно я купил новый ноутбук, чтобы использовать его для научных исследований, когда я дома. В машине установлен процессор Intel i7 с 8 ядрами, 4 ГБ оперативной памяти и графическая карта от Nvidia (2 ГБ, Ivy Bridge). ...
17.11.2019
0
ответов

Linux & Bash Chromosomes sorting files

Мне нужно объединить все файлы с геномными данными именно таким образом. Это означает, что он должен быть отсортирован сначала по номерам, а затем по алфавиту. Названия файлов: Homo_sapiens.GRCh38.dna.chromosome....
13.11.2019
0
ответов
0
ответов

удалить строки с дубликатами в первом столбце в bash

У меня есть файл .txt с разделителями табуляции, и я хочу удалить строки с дубликатами в первом столбце. Если бы это можно было сделать без сортировки, это было бы замечательно, но я как бы смирился с тем, что я...
22.03.2019
0
ответов

Извлечь значение из форматированного текста с помощью bash

У меня есть файл .fasta, который представляет собой строго отформатированный текст, содержащий некоторую информацию о ДНК. Вот его общая структура:> NODE_18_length_75451_cov_83.3021 ...
13.02.2018
0
ответов

скопируйте названия последовательностей ДНК в файл филогенетического дерева и добавьте названия видов в it

Из файла, похожего на этот: (AJirio_TR15329 | c4_g1_i4 | m.30470: 0.00230, (AJama_TR16613 | c5_g2_i2 | m.30203: 0.00171, (AJkago_TR11651 | c5_g2_i1 | m_.38471 | .3527: 0,00033) 1,00 ...
09.01.2018
0
ответов

извлекает блок текста из другого файла

, я хочу извлечь блок текста на основе идентификаторов, присутствующих в другой файл, Input> Feature scaffold1 1 100 г 101 200 г 201 300 г 500 500 руб. 900 1000 руб. > Особенность scaffold2 1 100 г 01 500 г 200 ...
06.01.2018
0
ответов

Выберите строки файла 1, где поле файла 2 > x

У меня есть большой файл file1, содержащий много информации, например rs969931 C A 1,993 1,189 1,003 .............. rs2745406 C T 1.993 1.166 1.003 .............. rs6939431 AG ...
05.12.2017
0
ответов

Как заменить файлы с определенным словом на .fasta

Как выбрать и изменить файлы, в которых есть определенное слово, так, чтобы все они заканчивались на ".fasta"? Например, я выбираю файлы, в которых есть слово «автомобиль». найти / home / user -name "* car *", который дает мне / ...
26.11.2017
0
ответов

между двумя файлами (значения в файле 1, которые попадают в диапазон значений в файл 2)

У меня есть файл с именем snp_data, содержащий данные о хромосомах SNP (однонуклеотидный полиморфизм). Это файл CSV с тремя столбцами, разделенными пробелами, который имеет следующий формат: user@host:~$ cat ...
26.11.2017
0
ответов

сравните и распечатайте значения в двух массивах с помощью awk

A01 11814111 11814112 GA AA A01 11485477 11485519 AG AT A01 11667935 11667971 TC TA A01 11876070 11876079 TC ...
30.10.2017
0
ответов

команда sort-bed не найдена

У меня есть следующий код "не мой" wget -qO- http://hgdownload.cse.ucsc.edu/goldenPath/hg19/database/snp142Common.txt.gz \ | gunzip -c - \ | вырезать -f2,3,4,5,10 - \ | sort-bed - \ &...
15.10.2017
0
ответов

Извлечь число длиной n из поля и вернуть строку

У меня есть файл с разделителями табуляции, в котором комбинация текста и чисел. Я хочу сохранить каждую строку как есть, но я хочу оставить только шестизначные числа в 5-м столбце, если они есть. Например: gene1 ...
11.10.2017
0
ответов

условное хранение строк

Это часть моего файла (с 10000 строк): N N N N N N N N N N N N N N N N N N N N N N N N N N R N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N A ...
11.10.2017
0
ответов

Управление таблицей

У меня есть три файла с координатами генома и последним столбцом в качестве общих имен Файл 1. X 1 100 B Y 101 200 B Z 1 50 B Файл 2. X 200 300 A Y 101 200 A Z 1 50 A Файл 3. X 1 100 C Y 200 300 C Я 1 50 С ...
09.10.2017
0
ответов

переупорядочить вывод IO primer3 boulder

Я пытаюсь переставить вывод primer3_core. Например: SEQUENCE_ID = ID_1. PRIMER_LEFT_0_SEQUENCE = ACGTGTAGCGGTTCAGACG PRIMER_RIGHT_0_SEQUENCE = ACCATGCATGATCCATCCAGG PRIMER_LEFT_1_SEQUENCE = ...
02.10.2017
0
ответов

Использование подфункции awk для последовательной нумерации заголовков fasta

Я новичок в написании сценариев оболочки и пытаюсь последовательно пронумеровать заголовки в файле fasta. Последовательности в моем файле fasta выглядят так:> Rodentia sp. ...
30.09.2017
0
ответов

Как отсортировать данные по числам в третьем столбце? [дубликат]

Если у меня есть файл, состоящий из данных, который выглядит следующим образом, как мне отсортировать данные по числам в 3-м столбце? Пространство между первыми двумя столбцами НЕ разделено табуляцией, но некоторые ...
04.02.2016