bioinformatics - лучшие вопросы о Unix / linux операционная система (юникс)

1

ответ

найти строки, содержащие точную строку

У меня есть файл csv, из которого я пытаюсь извлечь только строки с "Ann_Pet.Fal". Это должно быть очень просто, набрав grep -w "Ann_Pet.Fal" my.file. К сожалению, это не работает, и я получаю...

16.09.2019

1

ответ

Как вырезать определенные строки из столбцов, разделенных табуляцией?

У меня есть файл (.gff3) с девятью столбцами, разделенными табуляцией. ##gff-версия 3 ##другая информация 0 . мРНК 1300 9000 . + . ID=mrna0001;Name=sonicedgehog 1 . exon 1300 ...

bioinformatics cut grep linux

14.09.2019

1

ответ

Создание множества символических ссылок

У меня есть файл sample_long.20Bids.txt с таким содержимым: P2_305_USD16089489L_HJJNWDSXX_L4 P2_307_USD16089490L_HJNMNDSXX_L3 P2_42_USD16089409L_HJM27DSXX_L1 P2_43_USD16089410L_HJM27DSXX_L1 ...

awk bioinformatics text-processing

11.09.2019

1

ответ

Как я запускаю эти команды одновременно для разных файлов

Представьте себе, что у меня есть 16 отдельных папок с именами от A1 до A16 внутри каждой из них. У меня есть файл с именемalign.sorted.bam С помощью этих команд я хочу преобразовать выровненный.сортированный.бам в модуль выровненный.сам ...

bioinformatics linux shell-script

10.09.2019

1

ответ

Ошибка "xargs" в отношении файлов пар и одиночных файлов

В настоящее время я работаю с HISAT2 и пытаюсь использовать xargs, чтобы упростить себе жизнь при вводе нескольких образцов. Итак, у меня есть текстовый файл "samples.txt", в котором каждое имя сэмпла разделено пробелами-...

bioinformatics xargs

05.09.2019

1

ответ

Возьмите файлы fastq с одинаковыми именами в папке и добавьте их в сценарий (попарно)

У меня есть набор файлов с такими именами внутри папки: AM11_BW415_R1.fastq.gz NAM13_BW968_R2.fastq.gz NAM17_AC_Barrie_R1.fastq.gz NAM3_PI648600_R2.fastq.gz NAM7_Glenlea_R1.fastq.gz ...

bioinformatics directory files parallelism scripting

12.07.2019

1

ответ

как загрузить ссылку ebi fastq через командную строку с помощью wget/curl

У меня есть множество данных (fastq) для загрузки из базы данных ENA. Пример: ERS076383 ERS012262 ERS160574 ERS349280 и т. д. Ссылка для загрузки через браузер: https://www.ebi.ac.uk/ena/data/warehouse/filereport?...

bioinformatics curl linux osx wget

04.06.2019

1

ответ

извлечь строку в файле, если первый столбец совпадает с другим файлом?

У меня есть два текстовых файла (разделенных табуляцией). Я хочу получить строку из файла 2, если первый столбец или идентификатор совпадают в файле 2. Пример ниже: Файл 1: 115 147 222 322 Файл 2: 0 ...

bioinformatics linux

23.05.2019

1

ответ

хвост: ошибка записи "стандартный вывод": Broken pipe

I tried to use some scripts that use tail commands on Debian stretch but I got tail: error write 'standard output': Сломанная труба. Различается ли в Debian синтаксис хвоста и труб? Спасибо в ...

debian pipe tail bioinformatics

04.05.2019

1

ответ

для циклов для поиска нескольких текстов из родительского файла в несколько файлов одной командой

У меня есть 29 файлов fasta (расширение .fa), названных и сохраненных последовательностей в соответствии с их генами. (Пример: рибосомный белок L1, рибосомный белок L6P/L9E,...) Всего было 722 вида...

bioinformatics grep shell-script text-processing

05.04.2019

1

ответ

Как загрузить общедоступный набор данных из Интернета в Linux?

Мне нужно загрузить общедоступный набор данных (от OpenNeuro) онлайн в Linux, чтобы я мог работать с этими данными. Как это сделать?

bioinformatics download linux

04.04.2019

1

ответ

Почему поведение ERR-ловушки отличается от версий bash 3 и 4?

Фон Выполните следующий код в bash 3, 4 и 5 соответственно, и вы получите разные результаты. (функция handle_error () {echo ERROR;}; ловушка handle_error ERR; (выход 1)) Представьте, что (...

shell-script bioinformatics

19.02.2019

1

ответ

Извлечение столбцов и строк из файла [закрыто]

У меня есть список из 164 SNP, которые мне нужно сопоставить с очень большим.txt из базы данных и извлеките из этого текстового файла несколько столбцов и строк, соответствующих этим SNP, и распечатайте их в новом тексте ...

bioinformatics grep

18.11.2018

1

ответ

удалить чтение из файла fastq

Я хочу удалить четыре строки из файла fastq. Например, обычно файл выглядит следующим образом: (каждому образцу соответствуют четыре строки) @M04241:303:000000000-BR896:1:1102:21438:12389 1:N:0:TATGGCAC ...

awk bioinformatics sed text-processing

27.06.2018

1

ответ

Извлечение строк, содержащих шаблон + следующая строка

У меня есть два файла: один, содержащий список идентификаторов (файл A), и другой, содержащий список идентификаторов плюс их соответствующий текст - который всегда находится на следующей строке (файл B). Файл A: >161@1983 >947@...

linux text-processing bioinformatics

07.05.2018

1

ответ

преобразование файла fasta в обычный текст

как преобразовать формат fasta с ">" в простой текстовый файл напр. ввод: файл fasta> 1M14 Вывод GATCGGACTAGCTAA: простой текстовый файл GATCGGACGAGCTAA

shell-script text-processing bioinformatics

04.03.2018

1

ответ

Измените числа в этой форме: 0,873000 / 0,234000 на эту форму: 87/23

Из файла, подобного этому (филогенетическое дерево, в котором поддержки ветвей находятся между 0 и 1) : (AJirio: 0,00207, (AJama: 0,00176, (AJtok: 0,00034, AJkago: 0,00057) 0,832000: 0,00080) 0,934000: 0,00111) 0,923000 I ...

text-processing awk sed scripting bioinformatics

31.01.2018

1

ответ

Изменить символ в столбце в зависимости от инструкции из другого столбца

Я пытаюсь настроить сценарий, который преобразует последовательность кодонов в другую последовательность кодонов в зависимости от вариантов, которые я нахожу в мои данные NGS. В настоящее время Мой сценарий создает выходной файл с разделителями табуляц

linux text-processing awk sed bioinformatics

02.01.2018

1

ответ

Обновить значения файла, используя информацию из другого файла

Файл 1: P SNP: 0,266234 1: 11008 0,266234 1: 11012 0,340042 1: 13110 0,86724 RS201725126 0,86724 долл. США200579949 0.127269 1: 1327 Файл 2: snp chr: pos rs201725126 1: ...

awk bioinformatics text-processing

11.06.2017

1

ответ

Получение согласованного файла фесты

list.txt: 58759 __ len __ 2903 58759 __ len __ 2903 673957 __ len __ 1655 673957 __ len __ 1655 3566454 __ len __ 1744 seq.fasta:> 58759 __ len __ 2903 TTTTCCGTAGAGGAGATCCCTATTTTTAGGTTTGTAAGAGATCATTTT>...

awk bioinformatics

31.05.2017

1

ответ

удалить TAG / TAA / TGA

У меня есть файл в указанном ниже формате. Мне нужно удалить стоп-кодоны (TAG / TAA / TGA) все, что соответствует TAG, TAA или TGA. поиск должен быть кратным трем. (как будто он должен искать каждый ...

bioinformatics text-processing

27.02.2017

1

ответ

объединить мульти fasta последовательности [закрыто]

У меня есть этот файл, который имеет много последовательностей до 500 последовательностей некоторые из этих последовательностей имеют одинаковые имена я хочу объединить репликацию в один файл 1 >1 aa >2 cc >3 tt >4 atc >2 ...

bioinformatics linux text-processing

23.01.2017

1

ответ

Проблема, если каталог существует

У меня есть следующий код: #! / Bin / bash при чтении строки делать эхо "линия" $ линия если [[-d ../Results/${line}_Forward && -d ../Results/${line}_Reverse]] затем cd ../Results/COMBI ...

bash bioinformatics shell-script

15.01.2017

1

ответ

Проблема с обрезкой хвостовых символов

У меня есть следующий скрипт: #! / Bin / bash SINGLE = `cut -c 7-21 Data.txt` cd .. / FASTA_SEC / для i в $ {SINGLE}; делать, если [-r ../FASTA_SEC/${i}.fa]; then HEAD = `sed -n 2p ../ FASTA_SEC / $ {i} ....

bash bioinformatics shell-script string tail

11.01.2017

1

ответ

samtools / sed для редактирования файла BAM

У меня есть следующая команда sed, которая ch измените имя хромосомы: для файла в /myoldpath/*.bam; сделать filename = echo $ file | вырезать -d "." -f 1 просмотр Samtools -H $ file | sed -e 's / SN: ([0-9XY]) / SN: chr \ 1 /' ...

bioinformatics sed

06.01.2017

1

ответ

Как вырезать последовательность fasta по определенным номерам и сгенерировать ORF

У меня есть файл, показанный ниже: CDS join (36..56,37..67) CDS 36..183 CDS 457..565 CDS join (505..519,521..596) Соединение CDS (577..591,725 .....

bioinformatics text-processing

25.06.2016

1

ответ

Создание списка, содержащего имена файлов с путями

У меня есть каталог (INPUTDIR) с демонстрационными именами как подкаталоги (508_C, 540_C, 570_D и т.д.).Within они каждый подкаталоги, там другой каталог под названием FASTQ, который содержит два вида файлов. например....

linux shell-script command-line directory-structure bioinformatics

02.12.2014

1

ответ

подсчет нескольких шаблонов в единственной передаче с grep?

Я записал grep цикл, чтобы многократно считать DNA trinucleotides в gzipped файле фесты DNA, содержащем последовательности DNA, например, объявить-a тримаран = (AAA AAC AAG AAT CAA.. и т.д.), поскольку я в $ {тримаран} делаю...

bioinformatics grep text-processing shell-script bash

11.02.2014

0

ответов

использование sed для захвата групп

У меня есть такой файл :chr1 3143567 3143568.3 -2704 1.000000|ENSMUSG00000102693.2 chr1 3143599 3143600.3 -2705 1.000000|ENSMUSG00000102693.2 chr1 3143631 3143632.3 -2706 1.000000|ENSMUSG00000102693.2 чр1 3143663 3143664.3

bioinformatics sed

20.10.2021

0

ответов

Перебрать файл с уникальным идентификатором и вычислить кумулятивную сумму

У меня есть большой текстовый файл, как показано ниже, где столбец1 -столбец3 определяет регион, а четвертый столбец является уникальным идентификатором. Столбцу 6 присвоено значение региона. chr6 26204834 26204839 регион1 + 119,862 chr6 26204834 26204835

array awk bioinformatics pattern-matching text-processing

20.09.2021